>  2025/01/28 (火) 16:14:39        [misao]
> > DeepSeekってただ安いEVが登場しましたくらいのニュースに感じられるんだけど
> > スケールするんだろうか
> 手法は知られた手法を駆使してるけどそれを組み合わせたのが新しい
> 強化学習手法 GRPOみたいなのはOPENAIも試みてたけども実現はできてなかった
> さらにいうとdeepseekで他の小型LLMを蒸留すると小型LLMが大幅に強化できるようになった

よし完全に理解した

参考:2025/01/28(火)16時09分52秒