GLM-5.2 登頂華為晶片開源榜
Z.ai 的 GLM-5.2 在華為 Ascend 910B 上訓練後,登上開源模型榜首;Anthropic 的 Fable 5 則因美國出口限制下線。

Z.ai 的 GLM-5.2 在華為 Ascend 910B 上訓練後,成為開源 AI 榜單第一名。
Techtimes 指出,Z.ai 在 6 月 17 日發布 GLM-5.2,幾天後就衝上多個公開榜單。與此同時,Anthropic 的 Fable 5 和 Mythos 5 仍因美國出口命令維持離線。
這次最受關注的不是單一分數,而是訓練條件。GLM-5.2 全程使用 華為 Ascend 910B 晶片,沒有 Nvidia 硬體進入訓練堆疊。
| 項目 | 數值 |
|---|---|
| GLM-5.2 發布日 | 2026 年 6 月 17 日 |
| Fable 5 禁用日 | 2026 年 6 月 12 日 |
| 訓練晶片 | 100,000 顆 Huawei Ascend 910B |
| 總參數 | 7440 億 |
| 推理啟用參數 | 約 400 億 |
| 上下文長度 | 100 萬 tokens |
| 訓練成本估算 | 2500 萬美元 |
發生了什麼
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
Z.ai 表示,GLM-5.2 是它第一個完全用中國本土晶片訓練的模型家族。這版權重也採 MIT 授權,並已上傳到 Hugging Face,方便開發者直接下載、自架與測試。

在公開測試中,GLM-5.2 的表現集中在程式與設計任務。它在 Code Arena 拿到 1595 Elo、在 SWE-bench Pro 得到 62.1,並在 Design Arena 排名第一。這讓它成為少數同時兼顧聊天、編碼與代理任務的開源選項。
但它不是全方位領先。報導也提到,在更難的 SWE-Marathon 測試裡,GLM-5.2 只有 13.0,而 Anthropic 的 Claude Opus 4.8 為 26.0。換句話說,GLM-5.2 更像是把「可用、可部署、可公開驗證」推到前排,而不是在每個硬測試都碾壓對手。
- 7440 億總參數,推理時約啟用 400 億。
- 採用 Mixture-of-Experts 與 DeepSeek Sparse Attention。
- 上下文長度達 100 萬 tokens,適合長文件與大型程式庫。
- 推理速度約每秒 17 到 19 tokens,仍慢於部分 Nvidia 陣營模型。
架構上,Z.ai 把重點放在長上下文與 agent 工作流。每個 token 只路由到 256 個專家子網路中的 8 個,目標是把算力花在需要的地方,而不是整個模型一起重算。
為什麼重要
這件事的時間點很敏感。6 月 12 日,美國商務部要求 Anthropic 停用 Fable 5 與 Mythos 5 對全球外國人提供服務,理由是存在 jailbreak 風險。五天後,Z.ai 就交出一個可公開下載、也能本地部署的替代方案。

對開發者來說,差別不只在榜單名次,而在控制權。閉源 API 可以被限制、下架或改條款;開源權重一旦釋出,團隊就能在自己的機器上跑,資料也不用外送到第三方服務。
對產業來說,這也把討論從「能不能拿到高階晶片」推向「拿到晶片後能做出什麼」。如果中國模型能在華為硬體上完成接近商用水準的編碼與設計任務,出口管制對訓練的阻力仍在,但對結果的封鎖力道會變弱。
當然,最難的推理測試上,美國實驗室仍有優勢。只是對很多團隊而言,今天真正要選的不是最強分數,而是能不能離線、能不能自管、能不能把模型留在自己手上。
問題已經變了:當開源權重能在中國晶片上跑到榜首,出口管制還能決定多少開發者的預設選擇?