模型

智谱GLM-5.2开源并登顶编程榜单，前端能力获显著提升

智谱AI于2025年6月13日全量开放GLM-5.2模型，该模型在LMSYS Code Arena: Frontend榜单中排名全球第二，仅次于Claude Fable 5，成为开源模型中的第一名。同时，在Design Arena中取得全球第一。GLM-5.2支持1M上下文，在长程任务中表现领先，并已开源（MIT协议）。

榜单表现与评测

Code Arena: Frontend：GLM-5.2排名第二，比Claude Opus 4.8 Thinking高29分，在React子榜第二、HTML子榜第四，并在品牌与营销、基于参考的设计、数据与分析、消费品、游戏和模拟等子类别中排名第一。
Design Arena：全球第一，体现模型在审美和设计方面的能力。
八项权威基准测试：表现亮眼，具体分数未在报道中详细列出。

前端能力提升

多个独立评测者指出，GLM-5.2的前端能力相比前代（GLM-5.0/5.1）有质的飞跃。典型测试案例包括：

赛博朋克版清明上河图：GLM-5.0效果粗糙，GLM-5.2能生成完整建筑和物体形态，但赛博味足而清明味略逊于Opus 4.8。
无限流文字冒险游戏：GLM-5.0布局崩塌，GLM-5.2布局正常且动画效果酷炫。
五子棋对战：GLM-5.0设计感差，GLM-5.2棋盘、背景、配色均有优化。
霓虹奔跑者：GLM-5.2画面纵深感强，支持二级跳和炸开效果。
3D太阳系：GLM-5.2采用抽象线条设计，虽不写实但具有设计感。

评测者认为，GLM-5.2在前端方面经过专门训练，设计感过强可能导致作品风格趋同，但整体效果已接近甚至局部超越Opus 4.8。

长上下文与工程能力

GLM-5.2支持1M上下文，在真实工程任务中表现突出：

完整代码库理解：在Appsmith项目中，GLM-5.2能准确梳理架构、定位耦合点并给出重构路线图，覆盖深度优于CodeX。
跨文件追Bug：在OpenWebUI项目中，GLM-5.2能定位到SSE分片与后端解析之间的链路问题，给出前后端修复方案。
新增功能：在OpenWebUI中新增“会话摘要导出为Markdown”功能，GLM-5.2拆分为五层实现，38个后端测试全部通过。
多任务交付：在构建英国学生公寓行业研究包的任务中，GLM-5.2一次性输出完整文件夹，包含图表、报告和脚本。

评测者指出，1M上下文适用于整库理解、跨文件追Bug、长期重构等复杂任务，但简单任务中可能过度设计。

生态与工具

智谱同步推出ZCode（zcode.z.ai），一款类似Claude Code和OpenAI Codex的智能体开发套件，支持Windows和macOS。评测显示，GLM-5.2在ZCode中生成的UI效果显著优于在Claude Code中的表现，可能得益于ZCode的工程优化。ZCode新用户可免费使用5天，订阅用户享有150%配额。

行业影响

GLM-5.2的开源和榜单表现，标志着国产模型首次跻身AI编程“御三家”（Claude、OpenAI、智谱），将谷歌Gemini挤出前列。在Claude Fable 5因安全争议被限制访问的背景下，智谱强调“前沿智能应属于所有人”，推动开源生态发展。

局限与展望

尽管前端能力大幅提升，GLM-5.2在全面能力上仍与Opus 4.8存在差距，尤其在处理时间、思考深度和首次准确率方面。评测者建议，简单任务中无需使用1M上下文，以保持效率。模型API将于下周上线，开源版本遵循MIT协议。

2026年6月17日来源：综合整理

glm-5-2 zhipu coding open-source ai-benchmark