OraCore
.dev
新聞
趨勢
比較
排行
學習
Claude Code
更多
EN
更多
EN
新聞
趨勢
比較
排行
學習
Claude Code
返回首頁
標籤
analogy
1 篇文章
技術研究
/
6月12日
RA-RFT 讓模型學會類比推理
RA-RFT 把檢索目標從相似度改成「有助推理的類比」,再用這些示範做強化式微調,讓模型在數學推理上更會借題發揮。