OraCore
.dev
新聞
趨勢
比較
排行
學習
Claude Code
更多
EN
更多
EN
新聞
趨勢
比較
排行
學習
Claude Code
返回首頁
標籤
student model
1 篇文章
技術研究
/
6月5日
強化感知蒸餾,想把推理一起學進去
這篇論文提出強化感知知識蒸餾,目標不是只壓縮答案,而是把 LLM 的推理行為一起轉移給學生模型。