> DeepSeekってただ安いEVが登場しましたくらいのニュースに感じられるんだけど > スケールするんだろうか 手法は知られた手法を駆使してるけどそれを組み合わせたのが新しい 強化学習手法 GRPOみたいなのはOPENAIも試みてたけども実現はできてなかった さらにいうとdeepseekで他の小型LLMを蒸留すると小型LLMが大幅に強化できるようになった 参考:2025/01/28(火)16時03分32秒