標籤
開源模型
開源模型已不只是在比參數大小,而是走向可部署、可微調、可接工具的實用路線。從寫碼、長上下文代理到語音合成,這些模型正在改變團隊如何在成本、效能與控制權之間取捨。
15 篇文章

GLM-5.2 登頂華為晶片開源榜
Z.ai 的 GLM-5.2 在華為 Ascend 910B 上訓練後,登上開源模型榜首;Anthropic 的 Fable 5 則因美國出口限制下線。

Fable 5 封鎖暴露模型路由賽局
Anthropic 短暫封鎖 Fable 5 後,4 個開源模型立刻接手回應。這件事把模型路由、備援機制和 Wasm 安全邊界一次攤開。

GLM-5.2 開源:1M 上下文上線
智譜開源 GLM-5.2,主打 1M 上下文、Coding 與長程任務,並同步開放 API、Hugging Face、ModelScope 與多種推理框架接入。

中國 AI 轉向:開源、效率、出海
中國 AI 正改走低成本、開源與海外商用路線。DeepSeek、Qwen 等模型帶動全球使用,企業也把重心放到代理工具與出海銷售。

Kimi K2.6 把開源寫碼推向代理工作流
5 個面向看 Kimi K2.6 的開源寫碼升級:4,000+ 工具調用、300 子代理、12% 準確率提升與更長的連續執行。

Nemotron 3 Ultra 證明開源模型仍能和頂尖對手正面競爭
Nemotron 3 Ultra 顯示,開源權重模型不但能追上頂尖對手,還能在推理吞吐上大幅領先,這會直接改寫部署成本與產品選型。

MiniMax M3:開源三合一模型
MiniMax M3 主打 1M context、原生多模態與寫程式能力,搭配 MiniMax Code。這篇整理它和 Claude、GPT 的差異。

MiniMax M2 開源,代理編碼變便宜
MiniMax 開源 M2,主打代理編碼與工具使用,輸入每百萬 Token 只要 0.30 美元,還有限時免費試用。

Qwen3.6-27B:更小卻更準的寫碼路線
Qwen3.6-27B 是 27B dense multimodal 模型,在 SWE-bench Verified 拿到 77.2,還贏過更大的 Qwen3.5-397B-A17B。對開發團隊來說,這代表更好部署,也更適合 agentic coding。

Qwen3.6-35B-A3B 打開開源寫碼新路線
Qwen3.6-35B-A3B 以 35B 總參數、3B 啟用參數和 Anthropic API 相容性,直接瞄準 Claude Code 工作流。這款開源 MoE 模型想把效能、成本和工具整合一次做到位。

Kimi K2.5 上線:開源模型打進第一梯隊
Moonshot AI 的 Kimi K2.5 在 2026/1/27 上線,主打 256K context、Agent Swarm、MIT 授權,還把多項 benchmark 拉到和 GPT、Claude 同一張桌子。

Mistral Voxtral TTS瞄準語音AI開發者
Mistral 推出 Voxtral TTS,支援 9 種語言、不到 5 秒音檔做聲音複製,TTFA 只有 90 ms。這款開源語音模型,直接對準語音助理、客服與即時翻譯場景。

Cursor、Kimi 與開源賭注
Cursor 把 Composer 2 建在 Moonshot AI 的 Kimi K2.5 上,價格約只有傳統方案的八分之一。這篇拆解它的成本邏輯、開源模型競爭、資安風險,還有台灣開發者該怎麼看。

2026年4月 AI 模型更新追蹤
2026 年 4 月 AI 模型更新很密集,274+ 次釋出、GPT-5.4、Mistral Small 4、Nemotron 3 都在名單上。

OpenClaw 逼問 AI 模型價值
OpenClaw 從開發者 side project 竄進 Nvidia GTC 主舞台,讓市場開始正視一件事:AI 的價值可能正從大型模型本身,轉向代理軟體、在地部署與權限控制。對 OpenAI、Anthropic 與 Nvidia,這題都很硬。