游乐游手机版
首页/AI热点日报/热点详情

GLM-4闪电发布:性能焕新,迭代提速

类型:热点整理2025-12-23
GLM-4 7已成为GLM Coding Plan的默认模型,该计划提供多种订阅选项,起价为每月3美元,兼容Claude Code、Cursor等10多种编程工具。 GLM-4 7最新基准测试经过多

GLM-4.7现已作为GLM Coding Plan的默认模型,该计划提供多种订阅选项,起价为每月3美元,并兼容Claude Code、Cursor等十余种主流编程工具。

GLM-4.7官方基准测试GLM-4.7基准测试表现

经过多日预热,智谱AI于12月22日正式发布了新一代旗舰模型GLM-4.7。其在编程能力与复杂逻辑推理方面实现了显著突破,直接对标当前顶尖的开源模型。

基准测试表现亮眼

根据Z.ai团队发布的信息,GLM-4.7在编程、复杂推理和工具调用等多个技术维度均有显著提升。同时,在常规对话、创意写作及角色扮演等场景下的表现也更为出色。

最新公布的测试结果显示,GLM-4.7在多项关键基准测试中表现优异:

在LMArena代码竞技场(盲测)中,位列开源模型榜首,表现超越GPT-5.2LiveCodeBench V6测试:得分达84.8,领先于Claude 4.5 SonnetAIME 2025(数学测试):表现优于Claude 4.5 Sonnet与GPT-5.1人类终极考试(HLE):得分率达到42%,相较GLM-4.6提升38%,逼近GPT-5.1水平τ²-Bench:在模拟真实世界交互的任务中,与Claude 4.5 Sonnet表现持平

LM Arena测试结果LM Arena测试数据

在实际开发场景的横向对比中,GLM-4.7在前端开发任务中以64.6%的胜率领先GLM-4.6,后端任务胜率为46.7%,而在指令遵循任务上的胜率达到58.3%。

图片实际任务胜率对比

技术规格与特性

GLM-4.7支持高达200K的上下文长度,最大可输出128K tokens,处理速度达到每秒55+ tokens。该模型进一步优化了其交织思维推理模式,并引入了保留思维与回合级思维功能。通过在具体操作步骤之间进行系统性思考,并保持跨回合任务的一致性与连续性,使得处理复杂任务时更加稳定而可控。

图片

定价策略

GLM-4.7现已成为GLM Coding编程计划的默认模型。该计划提供灵活的月付与年付方案,起价为每月3美元,并全面支持与Claude Code、Cursor等十余款热门编程IDE及工具的深度集成。

小结

尽管基准测试数据相当亮眼,但部分早期用户的实际测试反馈则相对保守。有用户表示,在有限的测试中,GLM-4.7的表现并未明显优于Claude 4.5 Sonnet或GPT-5.2,甚至在部分场景下可能不及Minimax M2.1。

智谱近期密集的模型发布节奏,让不少用户直呼“应接不暇,GLM-4.6还没来得及熟悉,GLM-4.7就来了”。这背后的原因,或许与智谱立志成为国内大模型领域领导者的战略目标有关。智谱AI刚刚宣布将于明年1月在香港启动IPO。而市场亦有消息称,其国内竞争对手Minimax也计划在港股上市。相较而言,Minimax的产品布局更为多元,在海外市场的影响力也更强,其应用已拥有超过2.12亿个人用户,覆盖全球200多个国家和地区,海外市场贡献了超过70%的收入。从这个角度来看,为了提升国际影响力与市场声量,频繁推出新模型的动作也就不难理解了。

来源:https://www.51cto.com/article/832538.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。