標籤
mixture-of-experts
4 篇文章

產業動態/6月27日
Kimi K2.7 Code 值得盯的 5 個原因
4 個關鍵看點:256k 長上下文、$4 輸出定價、開放權重與編碼表現,幫你判斷 Kimi K2.7 Code 值不值得試。

技術研究/6月6日
HANDOFF 讓人形機器人更好控
HANDOFF 用更精簡的控制介面,把三種專家能力蒸餾進單一人形控制器,讓規劃器更容易下指令。

工具應用/6月3日
Kimi K2 把 Moonshot 變成模型堆疊
我拆 Moonshot AI 的 GitHub,整理成可直接套用的開源模型、agent 工具與 serving 堆疊寫法。

技術研究/5月8日
UniPool:共享 MoE 專家池
UniPool 把 MoE 的分層專家改成全域共享池,減少重複參數,並在五個 LLaMA 規模模型上改善驗證損失。