GLM-4闪电发布：性能焕新，迭代提速_AI热点日报

GLM-4闪电发布：性能焕新，迭代提速

类型：热点整理2025-12-23

GLM-4 7已成为GLM Coding Plan的默认模型，该计划提供多种订阅选项，起价为每月3美元，兼容Claude Code、Cursor等10多种编程工具。 GLM-4 7最新基准测试经过多

GLM-4.7现已作为GLM Coding Plan的默认模型，该计划提供多种订阅选项，起价为每月3美元，并兼容Claude Code、Cursor等十余种主流编程工具。

GLM-4.7官方基准测试 GLM-4.7基准测试表现

经过多日预热，智谱AI于12月22日正式发布了新一代旗舰模型GLM-4.7。其在编程能力与复杂逻辑推理方面实现了显著突破，直接对标当前顶尖的开源模型。

基准测试表现亮眼

根据Z.ai团队发布的信息，GLM-4.7在编程、复杂推理和工具调用等多个技术维度均有显著提升。同时，在常规对话、创意写作及角色扮演等场景下的表现也更为出色。

最新公布的测试结果显示，GLM-4.7在多项关键基准测试中表现优异：

在LMArena代码竞技场（盲测）中，位列开源模型榜首，表现超越GPT-5.2LiveCodeBench V6测试：得分达84.8，领先于Claude 4.5 SonnetAIME 2025（数学测试）：表现优于Claude 4.5 Sonnet与GPT-5.1人类终极考试（HLE）：得分率达到42%，相较GLM-4.6提升38%，逼近GPT-5.1水平τ²-Bench：在模拟真实世界交互的任务中，与Claude 4.5 Sonnet表现持平

LM Arena测试结果 LM Arena测试数据

在实际开发场景的横向对比中，GLM-4.7在前端开发任务中以64.6%的胜率领先GLM-4.6，后端任务胜率为46.7%，而在指令遵循任务上的胜率达到58.3%。

实际任务胜率对比

技术规格与特性

GLM-4.7支持高达200K的上下文长度，最大可输出128K tokens，处理速度达到每秒55+ tokens。该模型进一步优化了其交织思维推理模式，并引入了保留思维与回合级思维功能。通过在具体操作步骤之间进行系统性思考，并保持跨回合任务的一致性与连续性，使得处理复杂任务时更加稳定而可控。

定价策略

GLM-4.7现已成为GLM Coding编程计划的默认模型。该计划提供灵活的月付与年付方案，起价为每月3美元，并全面支持与Claude Code、Cursor等十余款热门编程IDE及工具的深度集成。

小结

尽管基准测试数据相当亮眼，但部分早期用户的实际测试反馈则相对保守。有用户表示，在有限的测试中，GLM-4.7的表现并未明显优于Claude 4.5 Sonnet或GPT-5.2，甚至在部分场景下可能不及Minimax M2.1。

智谱近期密集的模型发布节奏，让不少用户直呼“应接不暇，GLM-4.6还没来得及熟悉，GLM-4.7就来了”。这背后的原因，或许与智谱立志成为国内大模型领域领导者的战略目标有关。智谱AI刚刚宣布将于明年1月在香港启动IPO。而市场亦有消息称，其国内竞争对手Minimax也计划在港股上市。相较而言，Minimax的产品布局更为多元，在海外市场的影响力也更强，其应用已拥有超过2.12亿个人用户，覆盖全球200多个国家和地区，海外市场贡献了超过70%的收入。从这个角度来看，为了提升国际影响力与市场声量，频繁推出新模型的动作也就不难理解了。

来源：https://www.51cto.com/article/832538.html

延伸阅读

补充最近整理过的热点入口。