智谱刚刚发布了GLM-4.7新版本,其核心亮点在于代码编程能力的全面增强。
代码能力的核心提升:
与此前的GLM-4.6相比,GLM-4.7在多语言智能体(Agentic)编程和基于终端任务方面表现尤为突出。其在多项权威基准测试中成绩斐然:SWE-bench得分提升至73.8%(增长5.8%),SWE-bench Multilingual达到66.7%(大幅跃升12.9%),而在Terminal Bench 2.0上更是取得了41%的成绩(提升16.5%)。此外,模型新增了对“谋定而后动”(行动前思考)工作流的支持,在处理Claude Code、Kilo Code、Cline及Roo Code等主流智能体框架下的复杂任务时,表现出了显著改进。
视觉化编程(Vibe Coding):
GLM-4.7在前端界面生成质量上迈进了一大步。它能够编写出更加简洁、更具现代感的网页代码,并且能够生成布局与尺寸更精准、视觉效果更出色的幻灯片。
工具调用能力:
GLM-4.7的工具使用能力实现了显著革新。无论是在π²-Bench等标准测试中,还是在通过BrowseComp进行的网络浏览任务里,其性能表现均有肉眼可见的提升。
复杂推理:
GLM-4.7大幅强化了数学与逻辑推理能力。在人类终极考试基准测试中,其得分达到42.8%,相较GLM-4.6提升了12.4%。



