標籤
fine-tuning
微調是把通用模型改造成特定任務工具的關鍵步驟,常見於新詞注入、指令對齊與多模態適配。重點不只在訓練技巧,也在初始化、資料分佈、VRAM 需求與語言覆蓋,直接影響生成品質與部署成本。
9 篇文章

產業動態/6月20日
5 個關鍵部件看懂 LLMs
5 個關鍵部件帶你看懂 LLMs 如何從資料、token、注意力到對齊,進而判斷訓練與部署該看什麼。

AI Agent/6月13日
SLM 微調把企業 AI 變可用
拆 CogitX 的 SLM 微調 playbook,整理成企業訓練、評估、部署都能直接照抄的模板。

技術研究/5月30日
為什麼微調仍然勝過只靠提示詞的 AI
微調仍是把基礎模型做成可靠專用工具的最佳方法,因為它改變模型本身,而不只是包裝在外的提示詞。

技術研究/5月28日
怎麼用 DeepMind 建立 AI 研究基礎
這篇教你用 DeepMind 的課程與本機實作,建立現代語言模型與微調的入門基礎。

技術研究/5月19日
PEFT-Bench 讓微調比較更公平
PEFT-Bench 把 27 個 NLP 資料集與 7 種 PEFT 方法放進同一套流程,比的不只準確率,也把參數、速度和記憶體成本算進去。

技術研究/5月11日
Microsoft GoalCover 找出微調缺口
Microsoft Research 的 GoalCover 會在微調前找出資料缺口,並在 Qwen-3-14B 的金融摘要任務上提升 reward 分數。

技術研究/5月5日
5 步建出 1930 截止 LLM 測試台
用 5 個步驟建立一個 1930 截止的 LLM 測試台,驗證歷史推理與無污染泛化。

區塊鏈/4月3日
新詞初始化別再只取平均
GTI 在微調前先把新詞錨定到有意義的嵌入位置,避免平均初始化讓 token 擠成一團,進而影響生成式推薦的表現。

產業動態/3月26日
2026 年企業 AI 為何更靠 RAG
RAG 已從展示用技術走進企業預算。原因很直接:公司要的是能讀取最新內部資料、可追溯、可控權限的 AI,而不是只會背舊訓練資料的聊天模型。到了 2026 年,真正有用的重點在檢索品質、權限治理、即時資料連接與合規設計。