智谱最新消息显示,其最新开源大语言模型GLM-4.7在全球权威大模型评测榜单Artificial Analysis Intelligence Index(AA智能指数)中,以总分68分的成绩强势登顶——同时位列开源模型与国产模型双榜首位,并在全球所有参评模型中排名第六。

该榜单由Artificial Analysis发布,聚焦模型在知识覆盖、逻辑推演、代码生成及Agent(智能体)能力等关键维度的表现,被广泛视为衡量大模型综合水平最具公信力的行业标尺。
GLM-4.7是智谱于近日正式发布的全新开源版本,在面向编程任务场景下,重点增强了代码理解与生成能力、长周期任务拆解规划能力,以及多工具协同调用能力,在编程、推理与智能体三大方向实现跨越式升级。
- 编程能力再突破:全面优化多语言编码表现,尤其在终端智能体环境中的稳定性与准确性显著提升;GLM-4.7已支持在Claude Code、TRAE、Kilo Code、Cline和Roo Code等主流编程框架中落地“思考—决策—执行”闭环机制,复杂工程任务处理更可靠。
- 前端生成更出彩:网页、PPT、宣传海报等可视化内容生成质量明显跃升,布局合理、风格协调、视觉体验更趋专业。
- 工具调用更精准:在BrowseComp网页交互任务评测中斩获67.5分;在τ²-Bench多步工具调用基准测试中以87.4分刷新开源模型纪录(SOTA),超越Claude Sonnet 4.5。
- 推理性能更强劲:数学建模与逻辑推理能力大幅增强,在高难度HLE(“人类终极考试”)基准中达42.8%正确率,相比GLM-4.6提升41%,并已超越GPT-5.1。
- 通用交互更自然:对话响应更凝练智能,兼具温度与个性;文本创作与角色扮演更具文学质感与沉浸张力。
源码地址:点击下载
