GLM-5.2开源:1M上下文冲刺长程任务
智谱开源GLM-5.2,主打1M上下文、Coding和长程任务,API与主流推理框架同步支持。

智谱开源GLM-5.2,主打1M上下文、Coding和长程任务。
智谱今天上线并开源GLM-5.2,称其在全球百万用户参与的 Code Arena 前端开发评估中拿到“全球可用模型第一”。这版模型重点押注代码生成、长程任务和国产算力适配,并已同步开放 API、Hugging Face、ModelScope 与开发工具接入。
| 項目 | 數值 |
|---|---|
| 上下文窗口 | 1M |
| Code Arena 排名 | 全球可用模型第一 |
| FrontierSWE | 比 Opus 4.8 低 1% |
| SWE-Marathon | 比 Opus 4.8 低 13% |
| Terminal-Bench 2.1 | 比 Opus 4.8 低 4% |
| MCP-Atlas | 比 Opus 4.8 低 0.8% |
| 一次长程交付处理量 | 88万 tokens |
| FLOPs 优化 | 单位 token 降至 2.9 倍 |
What changed
Get the latest AI news in your inbox
Weekly picks of model releases, tools, and deep dives — no spam, unsubscribe anytime.
No spam. Unsubscribe at any time.
GLM-5.2 的核心变化是把 1M 上下文做成可用能力,而不是只做长度数字。智谱称,它先扩展了 1M Coding Agent 训练环境,再把自动化研究、性能优化等任务纳入训练,以减少长上下文在数百K后常见的退化问题。

在能力侧,GLM-5.2把重点放在三件事:更强的 Coding 体感、更稳的长程执行、以及更好的工程落地。官方给出的说法是,它在前端、后端和长程任务上的成功率都比上一代 GLM-5.1 提升,并在主流编程基准上保持开源模型中的领先位置。
- 1M 无损上下文,面向长链路任务
- 支持 effort level,平衡能力、速度和成本
- 已适配 vLLM、SGLang、transformers
- MIT License,允许下载、部署和商用
技术栈上,GLM-5.2 还引入 IndexShare、改进 MTP 投机解码,并用自研 Slime 框架支撑 Agentic RL 和 OPD 训练。智谱称,这些改动把长上下文推理成本压低,同时提升了接受长度和训练效率。
Why it matters
对开发者来说,GLM-5.2 的意义不只是“更会写代码”,而是能把一次任务拉长到完整工程周期。官方举例称,它曾在一次长程任务中处理 88 万 tokens,完成开发、联调、测试到上线,覆盖 Web、移动端和小程序,这类工作过去通常要团队协作数周。

对市场来说,GLM-5.2 释放的是国产模型在开源、算力适配和 API 商用上的同步推进。它已在华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等平台完成推理适配,意味着企业可以更直接地把模型放进国产芯片集群和现有推理栈。
智谱还把这版模型接入 GLM Coding Plan、AutoClaw 和 ZCode,指向的不只是代码助手,而是覆盖设计、法务、重构和办公流程的长程智能体工具链。
真正的问题已经不是“模型能不能写代码”,而是它能否稳定接管一段跨天、跨周的工作流。GLM-5.2 试图回答的,正是这道题。
// Related Articles
- [MODEL]
Apple pushes AI deeper into iPhone apps
- [MODEL]
Google launches Gemini 3.5 Live Translate audio model
- [MODEL]
Kimi K2.7-Code Adds HighSpeed Mode, Skips Benchmarks
- [MODEL]
Kimi K2.7: What Changed and How to Run It
- [MODEL]
Linux Kernel 7.1 adds FRED, NTFS, and AMD fixes
- [MODEL]
Fable 5 drew rare praise from top AI voices