[IND] 3 分鐘閱讀OraCore 編輯部

GLM-5.2 登頂華為晶片開源榜

Z.ai 的 GLM-5.2 在華為 Ascend 910B 上訓練後,登上開源模型榜首;Anthropic 的 Fable 5 則因美國出口限制下線。

分享 LinkedIn
GLM-5.2 登頂華為晶片開源榜

Z.ai 的 GLM-5.2 在華為 Ascend 910B 上訓練後,成為開源 AI 榜單第一名。

Techtimes 指出,Z.ai 在 6 月 17 日發布 GLM-5.2,幾天後就衝上多個公開榜單。與此同時,Anthropic 的 Fable 5 和 Mythos 5 仍因美國出口命令維持離線。

這次最受關注的不是單一分數,而是訓練條件。GLM-5.2 全程使用 華為 Ascend 910B 晶片,沒有 Nvidia 硬體進入訓練堆疊。

項目數值
GLM-5.2 發布日2026 年 6 月 17 日
Fable 5 禁用日2026 年 6 月 12 日
訓練晶片100,000 顆 Huawei Ascend 910B
總參數7440 億
推理啟用參數約 400 億
上下文長度100 萬 tokens
訓練成本估算2500 萬美元

發生了什麼

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

Z.ai 表示,GLM-5.2 是它第一個完全用中國本土晶片訓練的模型家族。這版權重也採 MIT 授權,並已上傳到 Hugging Face,方便開發者直接下載、自架與測試。

GLM-5.2 登頂華為晶片開源榜

在公開測試中,GLM-5.2 的表現集中在程式與設計任務。它在 Code Arena 拿到 1595 Elo、在 SWE-bench Pro 得到 62.1,並在 Design Arena 排名第一。這讓它成為少數同時兼顧聊天、編碼與代理任務的開源選項。

但它不是全方位領先。報導也提到,在更難的 SWE-Marathon 測試裡,GLM-5.2 只有 13.0,而 AnthropicClaude Opus 4.8 為 26.0。換句話說,GLM-5.2 更像是把「可用、可部署、可公開驗證」推到前排,而不是在每個硬測試都碾壓對手。

  • 7440 億總參數,推理時約啟用 400 億。
  • 採用 Mixture-of-Experts 與 DeepSeek Sparse Attention。
  • 上下文長度達 100 萬 tokens,適合長文件與大型程式庫。
  • 推理速度約每秒 17 到 19 tokens,仍慢於部分 Nvidia 陣營模型。

架構上,Z.ai 把重點放在長上下文與 agent 工作流。每個 token 只路由到 256 個專家子網路中的 8 個,目標是把算力花在需要的地方,而不是整個模型一起重算。

為什麼重要

這件事的時間點很敏感。6 月 12 日,美國商務部要求 Anthropic 停用 Fable 5 與 Mythos 5 對全球外國人提供服務,理由是存在 jailbreak 風險。五天後,Z.ai 就交出一個可公開下載、也能本地部署的替代方案。

GLM-5.2 登頂華為晶片開源榜

對開發者來說,差別不只在榜單名次,而在控制權。閉源 API 可以被限制、下架或改條款;開源權重一旦釋出,團隊就能在自己的機器上跑,資料也不用外送到第三方服務。

對產業來說,這也把討論從「能不能拿到高階晶片」推向「拿到晶片後能做出什麼」。如果中國模型能在華為硬體上完成接近商用水準的編碼與設計任務,出口管制對訓練的阻力仍在,但對結果的封鎖力道會變弱。

當然,最難的推理測試上,美國實驗室仍有優勢。只是對很多團隊而言,今天真正要選的不是最強分數,而是能不能離線、能不能自管、能不能把模型留在自己手上。

問題已經變了:當開源權重能在中國晶片上跑到榜首,出口管制還能決定多少開發者的預設選擇?