[MODEL] 3 分鐘閱讀OraCore 編輯部

GLM-5.2 開源:1M 上下文上線

智譜開源 GLM-5.2,主打 1M 上下文、Coding 與長程任務,並同步開放 API、Hugging Face、ModelScope 與多種推理框架接入。

分享 LinkedIn
GLM-5.2 開源:1M 上下文上線

智譜開源 GLM-5.2,主打 1M 上下文、Coding 與長程任務。

智譜今天正式推出並開源 GLM-5.2,把重點放在 1M 上下文、程式開發與長程任務。官方同時宣布,模型已開放 API、Hugging FaceModelScope 與開發工具接入。

這次更新不只是把上下文拉長,還把訓練、推理與部署一起往工程可用性靠攏。智譜稱,GLM-5.2 在全球百萬用戶參與的 Code Arena 前端開發評估中拿到「全球可用模型第一」。

項目數值
上下文窗口1M
Code Arena 排名全球可用模型第一
FrontierSWE比 Opus 4.8 低 1%
SWE-Marathon比 Opus 4.8 低 13%
Terminal-Bench 2.1比 Opus 4.8 低 4%
MCP-Atlas比 Opus 4.8 低 0.8%
一次長程交付處理量88萬 tokens
FLOPs 優化單位 token 降至 2.9 倍

發生了什麼

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

GLM-5.2 的核心變化,是把 1M 上下文做成可用能力,而不是只停在規格數字。智譜表示,它先擴展了 1M Coding Agent 訓練環境,再把自動化研究、效能優化等任務納入訓練,目標是減少長上下文在數十萬 token 後常見的退化。

GLM-5.2 開源:1M 上下文上線

在能力面,這版模型主打三個方向:更穩的 Coding 體感、更長的任務續航,以及更容易落地的工程整合。官方給出的結果顯示,它在前端、後端與長程任務上的成功率都較 GLM-5.1 提升,並在多個主流編程基準上維持開源模型中的前列位置。

技術棧上,GLM-5.2 也補齊了部署端。它已適配 vLLMSGLang 與 transformers,並提供 MIT License,允許下載、私有部署與商用。對企業來說,這代表從拿到模型到接進現有推理服務,路徑更短。

  • 1M 無損上下文,面向長鏈路任務
  • 支援 effort level,平衡能力、速度和成本
  • 已適配 vLLM、SGLang、transformers
  • MIT License,允許下載、部署和商用

另外,智譜還引入 IndexShare、改進 MTP 投機解碼,並用自研 Slime 框架支撐 Agentic RL 與 OPD 訓練。官方說法是,這些改動一起壓低長上下文推理成本,同時提高接受長度與訓練效率。

為什麼重要

對開發者來說,GLM-5.2 的重點不是單純「更會寫程式」,而是能把一次任務拉長到完整工程週期。官方舉例稱,它曾在一次長程任務中處理 88 萬 tokens,完成開發、聯調、測試到上線,涵蓋 Web、移動端與小程式,這類工作過去通常要多人協作數週。

GLM-5.2 開源:1M 上下文上線

這會直接影響團隊怎麼切任務。當模型能吃下更長的程式庫、更多歷史紀錄與更多測試輸出,開發者就能少做上下文裁切,少來回餵資料,也更容易把重構、除錯、文件更新放進同一條工作流。

對產業面來看,GLM-5.2 釋放的是開源模型、國產算力與 API 商用同步推進的訊號。它已在華為昇騰、平頭哥、摩爾線程、寒武紀、昆侖芯、沐曦、海光、壁仞等平台完成推理適配,意味著企業可以更直接把模型放進國產晶片集群與既有推理棧。

智譜也把這版模型接入 GLM Coding Plan、AutoClaw 與 ZCode,指向的已不是單一編碼助手,而是覆蓋設計、法務、重構與辦公流程的長程智能體工具鏈。問題不再只是模型會不會寫,而是它能不能穩定接手一段跨天、跨週的工作流。

如果 1M 上下文真的能在真實工程裡穩定運作,下一個被改寫的可能不是 benchmark,而是團隊分工本身。