EN
返回资讯列表
模型

智谱GLM-5.2发布并开源:Code Arena全球可用模型第一,1M上下文长程编程能力跃升

2025年6月17日,智谱AI正式发布并开源旗舰模型GLM-5.2,采用MIT协议,支持100万token上下文,在Code Arena前端开发盲测中取得全球可用模型第一(仅次于未解禁的Claude Fable 5),并在Design Arena中获全球第一。

核心能力与基准表现

  • 编程与智能体:在FrontierSWE基准上,GLM-5.2仅落后Claude Opus 4.8约1%,领先GPT-5.5约1%;在PostTrainBench上超过Opus 4.7和GPT-5.5,仅次于Opus 4.8;在SWE-Marathon超长任务基准中排名第二,仅次于Opus系列。在标准编程基准Terminal-Bench 2.1上得分81.0(GLM-5.1为63.5),SWE-bench Pro得分62.1(GLM-5.1为58.4)。
  • 长上下文:支持100万token上下文,在长程编程基准上表现优异,团队通过IndexShare机制(每4层共享indexer)将单token FLOPs降低约2.9倍,并优化推理引擎以提升长上下文吞吐。
  • 思考努力级别:引入effort level控制,允许用户平衡能力与计算成本,Max级别可进一步延展编程能力。

架构创新

  • IndexShare动态稀疏注意力:每4个Transformer层共享一个轻量级indexer,减少3/4的indexer计算开销,在1M上下文下显著降低计算量。
  • 改进的MTP(多token预测):在MTP层也应用IndexShare,投机解码接受长度提升20%。

开源与生态

  • 模型权重在HuggingFace和ModelScope公开,支持transformers、vLLM、SGLang等推理框架。
  • 上线首日即完成与华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等国产算力平台的全适配。
  • Hugging Face首次为国产模型提供6小时全球免费算力支持。

各方反应

  • 马斯克在X上回复称中国达到Fable水平可能需至2027年一季度,智谱创始人唐杰回应“用不了那么久”,引发海外网友热议。
  • 硅谷风投a16z联合创始人Marc Andreessen和Perplexity CEO Aravind Srinivas也关注此事。
  • 美国开源模型研究员Nathan Lambert评论称GLM-5.2在智能体能力上超过谷歌Gemini,标志着中国模型首次跻身全球“御三家”(Claude、OpenAI、智谱)。

影响与意义

GLM-5.2的发布标志着中国开源大模型在智能体编程和长程复杂任务领域首次达到世界一流闭源模型水平,打破了此前由Claude、GPT等模型主导的竞争格局。其开源策略(MIT协议、无地区限制)为全球开发者提供了可自由使用的前沿模型,推动AI编程从单次输出向长期工程能力演进。

2026年6月19日来源:综合整理