GLM-5.2 開源：1M 上下文上線

[MODEL] 2026年6月22日3 分鐘閱讀OraCore 編輯部

智譜開源 GLM-5.2，主打 1M 上下文、Coding 與長程任務，並同步開放 API、Hugging Face、ModelScope 與多種推理框架接入。

智譜開源 GLM-5.2，主打 1M 上下文、Coding 與長程任務。

智譜今天正式推出並開源 GLM-5.2，把重點放在 1M 上下文、程式開發與長程任務。官方同時宣布，模型已開放 API、Hugging Face、ModelScope 與開發工具接入。

這次更新不只是把上下文拉長，還把訓練、推理與部署一起往工程可用性靠攏。智譜稱，GLM-5.2 在全球百萬用戶參與的 Code Arena 前端開發評估中拿到「全球可用模型第一」。

發生了什麼

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

GLM-5.2 的核心變化，是把 1M 上下文做成可用能力，而不是只停在規格數字。智譜表示，它先擴展了 1M Coding Agent 訓練環境，再把自動化研究、效能優化等任務納入訓練，目標是減少長上下文在數十萬 token 後常見的退化。

在能力面，這版模型主打三個方向：更穩的 Coding 體感、更長的任務續航，以及更容易落地的工程整合。官方給出的結果顯示，它在前端、後端與長程任務上的成功率都較 GLM-5.1 提升，並在多個主流編程基準上維持開源模型中的前列位置。

技術棧上，GLM-5.2 也補齊了部署端。它已適配 vLLM、SGLang 與 transformers，並提供 MIT License，允許下載、私有部署與商用。對企業來說，這代表從拿到模型到接進現有推理服務，路徑更短。

另外，智譜還引入 IndexShare、改進 MTP 投機解碼，並用自研 Slime 框架支撐 Agentic RL 與 OPD 訓練。官方說法是，這些改動一起壓低長上下文推理成本，同時提高接受長度與訓練效率。

對開發者來說，GLM-5.2 的重點不是單純「更會寫程式」，而是能把一次任務拉長到完整工程週期。官方舉例稱，它曾在一次長程任務中處理 88 萬 tokens，完成開發、聯調、測試到上線，涵蓋 Web、移動端與小程式，這類工作過去通常要多人協作數週。

這會直接影響團隊怎麼切任務。當模型能吃下更長的程式庫、更多歷史紀錄與更多測試輸出，開發者就能少做上下文裁切，少來回餵資料，也更容易把重構、除錯、文件更新放進同一條工作流。

對產業面來看，GLM-5.2 釋放的是開源模型、國產算力與 API 商用同步推進的訊號。它已在華為昇騰、平頭哥、摩爾線程、寒武紀、昆侖芯、沐曦、海光、壁仞等平台完成推理適配，意味著企業可以更直接把模型放進國產晶片集群與既有推理棧。

智譜也把這版模型接入 GLM Coding Plan、AutoClaw 與 ZCode，指向的已不是單一編碼助手，而是覆蓋設計、法務、重構與辦公流程的長程智能體工具鏈。問題不再只是模型會不會寫，而是它能不能穩定接手一段跨天、跨週的工作流。

如果 1M 上下文真的能在真實工程裡穩定運作，下一個被改寫的可能不是 benchmark，而是團隊分工本身。

// 相關文章