OraCore
.dev
新聞
趨勢
比較
排行
學習
Claude Code
更多
EN
更多
EN
新聞
趨勢
比較
排行
學習
Claude Code
返回首頁
標籤
target distribution
1 篇文章
技術研究
/
6月10日
SFT 不只看 loss,先設計目標分布
這篇論文把 SFT 重新定義成目標分布設計,主張先決定該信任多少標註,再分配剩餘機率,並在十組推理資料與模型設定中一致優於基線。