GLM-5.2 開源:1M 上下文上線
智譜開源 GLM-5.2,主打 1M 上下文、Coding 與長程任務,並同步開放 API、Hugging Face、ModelScope 與多種推理框架接入。

智譜開源 GLM-5.2,主打 1M 上下文、Coding 與長程任務。
智譜今天正式推出並開源 GLM-5.2,把重點放在 1M 上下文、程式開發與長程任務。官方同時宣布,模型已開放 API、Hugging Face、ModelScope 與開發工具接入。
這次更新不只是把上下文拉長,還把訓練、推理與部署一起往工程可用性靠攏。智譜稱,GLM-5.2 在全球百萬用戶參與的 Code Arena 前端開發評估中拿到「全球可用模型第一」。
| 項目 | 數值 |
|---|---|
| 上下文窗口 | 1M |
| Code Arena 排名 | 全球可用模型第一 |
| FrontierSWE | 比 Opus 4.8 低 1% |
| SWE-Marathon | 比 Opus 4.8 低 13% |
| Terminal-Bench 2.1 | 比 Opus 4.8 低 4% |
| MCP-Atlas | 比 Opus 4.8 低 0.8% |
| 一次長程交付處理量 | 88萬 tokens |
| FLOPs 優化 | 單位 token 降至 2.9 倍 |
發生了什麼
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
GLM-5.2 的核心變化,是把 1M 上下文做成可用能力,而不是只停在規格數字。智譜表示,它先擴展了 1M Coding Agent 訓練環境,再把自動化研究、效能優化等任務納入訓練,目標是減少長上下文在數十萬 token 後常見的退化。

在能力面,這版模型主打三個方向:更穩的 Coding 體感、更長的任務續航,以及更容易落地的工程整合。官方給出的結果顯示,它在前端、後端與長程任務上的成功率都較 GLM-5.1 提升,並在多個主流編程基準上維持開源模型中的前列位置。
技術棧上,GLM-5.2 也補齊了部署端。它已適配 vLLM、SGLang 與 transformers,並提供 MIT License,允許下載、私有部署與商用。對企業來說,這代表從拿到模型到接進現有推理服務,路徑更短。
- 1M 無損上下文,面向長鏈路任務
- 支援 effort level,平衡能力、速度和成本
- 已適配 vLLM、SGLang、transformers
- MIT License,允許下載、部署和商用
另外,智譜還引入 IndexShare、改進 MTP 投機解碼,並用自研 Slime 框架支撐 Agentic RL 與 OPD 訓練。官方說法是,這些改動一起壓低長上下文推理成本,同時提高接受長度與訓練效率。
為什麼重要
對開發者來說,GLM-5.2 的重點不是單純「更會寫程式」,而是能把一次任務拉長到完整工程週期。官方舉例稱,它曾在一次長程任務中處理 88 萬 tokens,完成開發、聯調、測試到上線,涵蓋 Web、移動端與小程式,這類工作過去通常要多人協作數週。

這會直接影響團隊怎麼切任務。當模型能吃下更長的程式庫、更多歷史紀錄與更多測試輸出,開發者就能少做上下文裁切,少來回餵資料,也更容易把重構、除錯、文件更新放進同一條工作流。
對產業面來看,GLM-5.2 釋放的是開源模型、國產算力與 API 商用同步推進的訊號。它已在華為昇騰、平頭哥、摩爾線程、寒武紀、昆侖芯、沐曦、海光、壁仞等平台完成推理適配,意味著企業可以更直接把模型放進國產晶片集群與既有推理棧。
智譜也把這版模型接入 GLM Coding Plan、AutoClaw 與 ZCode,指向的已不是單一編碼助手,而是覆蓋設計、法務、重構與辦公流程的長程智能體工具鏈。問題不再只是模型會不會寫,而是它能不能穩定接手一段跨天、跨週的工作流。
如果 1M 上下文真的能在真實工程裡穩定運作,下一個被改寫的可能不是 benchmark,而是團隊分工本身。