EN
返回资讯列表
模型

智谱GLM-5.2开源并登顶编程榜单,前端能力获显著提升

智谱AI于2025年6月13日全量开放GLM-5.2模型,该模型在LMSYS Code Arena: Frontend榜单中排名全球第二,仅次于Claude Fable 5,成为开源模型中的第一名。同时,在Design Arena中取得全球第一。GLM-5.2支持1M上下文,在长程任务中表现领先,并已开源(MIT协议)。

榜单表现与评测

  • Code Arena: Frontend:GLM-5.2排名第二,比Claude Opus 4.8 Thinking高29分,在React子榜第二、HTML子榜第四,并在品牌与营销、基于参考的设计、数据与分析、消费品、游戏和模拟等子类别中排名第一。
  • Design Arena:全球第一,体现模型在审美和设计方面的能力。
  • 八项权威基准测试:表现亮眼,具体分数未在报道中详细列出。

前端能力提升

多个独立评测者指出,GLM-5.2的前端能力相比前代(GLM-5.0/5.1)有质的飞跃。典型测试案例包括:

  • 赛博朋克版清明上河图:GLM-5.0效果粗糙,GLM-5.2能生成完整建筑和物体形态,但赛博味足而清明味略逊于Opus 4.8。
  • 无限流文字冒险游戏:GLM-5.0布局崩塌,GLM-5.2布局正常且动画效果酷炫。
  • 五子棋对战:GLM-5.0设计感差,GLM-5.2棋盘、背景、配色均有优化。
  • 霓虹奔跑者:GLM-5.2画面纵深感强,支持二级跳和炸开效果。
  • 3D太阳系:GLM-5.2采用抽象线条设计,虽不写实但具有设计感。

评测者认为,GLM-5.2在前端方面经过专门训练,设计感过强可能导致作品风格趋同,但整体效果已接近甚至局部超越Opus 4.8。

长上下文与工程能力

GLM-5.2支持1M上下文,在真实工程任务中表现突出:

  • 完整代码库理解:在Appsmith项目中,GLM-5.2能准确梳理架构、定位耦合点并给出重构路线图,覆盖深度优于CodeX。
  • 跨文件追Bug:在OpenWebUI项目中,GLM-5.2能定位到SSE分片与后端解析之间的链路问题,给出前后端修复方案。
  • 新增功能:在OpenWebUI中新增“会话摘要导出为Markdown”功能,GLM-5.2拆分为五层实现,38个后端测试全部通过。
  • 多任务交付:在构建英国学生公寓行业研究包的任务中,GLM-5.2一次性输出完整文件夹,包含图表、报告和脚本。

评测者指出,1M上下文适用于整库理解、跨文件追Bug、长期重构等复杂任务,但简单任务中可能过度设计。

生态与工具

智谱同步推出ZCode(zcode.z.ai),一款类似Claude Code和OpenAI Codex的智能体开发套件,支持Windows和macOS。评测显示,GLM-5.2在ZCode中生成的UI效果显著优于在Claude Code中的表现,可能得益于ZCode的工程优化。ZCode新用户可免费使用5天,订阅用户享有150%配额。

行业影响

GLM-5.2的开源和榜单表现,标志着国产模型首次跻身AI编程“御三家”(Claude、OpenAI、智谱),将谷歌Gemini挤出前列。在Claude Fable 5因安全争议被限制访问的背景下,智谱强调“前沿智能应属于所有人”,推动开源生态发展。

局限与展望

尽管前端能力大幅提升,GLM-5.2在全面能力上仍与Opus 4.8存在差距,尤其在处理时间、思考深度和首次准确率方面。评测者建议,简单任务中无需使用1M上下文,以保持效率。模型API将于下周上线,开源版本遵循MIT协议。

2026年6月17日来源:综合整理