游乐游手机版
首页/AI教程/文章详情

GLM-4.7闪电发布,旧版未热新版已到

时间:2026-06-24 11:47
智谱AI全新发布GLM-4 7旗舰模型,编程与复杂推理能力实现重大技术突破。在LMArena代码竞技场中开源模型排名第一,LiveCodeBenchV6得分84 8分,数学能力显著优于Claude4 5Sonnet。支持200K超长上下文,月费低至3美元起,该模型在多项权威评测中均表现优异。

GLM-4.7官方基准测试GLM-4.7 官方基准测试详情

经过多日市场预热,12月22日,智谱AI正式发布了新一代旗舰模型GLM-4.7。此次升级在编程能力和复杂推理能力上取得了重大突破,性能直接对标当前顶尖的闭源模型。消息公布后,迅速引发行业高度关注。

基准测试表现突出

据Z.ai团队披露,GLM-4.7在编程、复杂推理及工具使用等核心能力上均有显著提升,同时在聊天、创意写作和角色扮演场景下的表现也进一步增强。具体来看,多项关键基准测试的结果十分亮眼:

  • LMArena代码竞技场(盲测):在开源模型中排名第一,成功超越GPT-5.2
  • LiveCodeBench V6:得分84.8,超过Claude 4.5 Sonnet
  • AIME 2025(数学):表现优于Claude 4.5 Sonnet和GPT-5.1
  • 人类终极考试(HLE):得分42%,相较GLM-4.6提升38%,逼近GPT-5.1水平
  • τ²-Bench:在真实世界交互测试中与Claude 4.5 Sonnet持平

LM Arena测试结果LM Arena 代码竞技场盲测结果

在实际开发场景的对比测试中,GLM-4.7在前端任务上以64.6%的胜率领先GLM-4.6,后端任务胜率为46.7%,指令遵循任务胜率为58.3%。这一数据分布表明,新模型在前端交互和指令理解方面进行了最大力度的优化。

\

技术规格与核心特性

GLM-4.7支持200K上下文窗口,最大输出可达128K tokens,处理速度约为每秒55 tokens。同时,模型进一步优化了交织思维模式,引入了保留思维和回合级思维机制——简单来说,即在执行动作之间进行思考,并保持跨回合的一致性,从而让复杂任务的执行更加稳定、可控。

定价与订阅策略

GLM-4.7已成为GLM Coding Plan的默认模型。该计划提供多种订阅选项,起价为每月3美元,兼容Claude Code、Cursor等十余种编程工具。对开发者而言,这一门槛相对较低。

总结

基准测试数据确实引人注目,部分内测用户反馈,实际编程能力有大幅提升,甚至有人觉得这可能是又一个“deepseek时刻”。不过,也有早期用户的实际测试反馈相对保守——有用户表示,在有限的测试中,GLM-4.7的表现并未明显优于Claude 4.5 Sonnet或GPT-5.2,甚至可能不及Minimax M2.1。客观而言,测试场景和任务类型对结果影响很大,具体表现仍需更多用户实际使用后才能得出结论。

智谱近期密集发布新模型,有用户调侃“GLM-4.6还没熟悉,4.7就来了”。这背后或许与智谱冲刺“中国大模型第一股”的战略有关——智谱AI刚刚宣布将于明年1月在香港进行IPO。值得注意的是,minimax也传出了在港股上市的消息。相比之下,minimax业务更为多元,海外市场影响力更强,拥有超过2.12亿个人用户,覆盖200多个国家和地区,海外市场贡献了超过70%的收入。从这个角度看,智谱加速迭代、频繁动作,显然是在为提升国际影响力铺路。

来源:https://cloud.tencent.com.cn/developer/article/2695726
上一篇SGLang迷你版用5千行代码实现LLM推理核心 下一篇Andrej Karpathy爆料自家遭Claude Code入侵
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Windows Docker Desktop RabbitMQ生产级部署完整指南
AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言 在 Windows 本地开发环境中,直接安装 RabbitMQ 确实颇为周折:需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是,版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。 相比之下,借助 Do

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践
AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年,我们与福建制造企业合作较为频繁,发现一个非常突出的现象:超过80%的企业官网,产品参数仍然存放在PDF或图片中。AI爬虫?根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富,但在AI搜索这一全新战场上,它们几乎处于隐身状态。 一、一个正在发生的行业变化 A

阿里云Token Plan团队版功能价格与省钱购买指南
AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务,这一服务专为企业与开发者量身打造,定位为AI大模型订阅平台。通过引入Credits作为统一计量单位,将文本生成、图像生成等多模态AI能力纳入单一计费体系,同时无缝兼容主流AI编程工具及智能体(Agent)生态系统。其核心亮点包括:全

阿里云物联网.NET Core客户端位置信息上报
AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标,而位置数据的来源本质上是借助设备属性进行上传。换言之,若要让设备上报位置,您需先将其视为一个普通属性进行处理。 1)添加二维位置数据 操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据,点击添加,将

年阿里云服务器选型配置与网站部署全攻略
AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年,阿里云服务器生态已高度成熟,形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网,还是运营电商平台、进行应用开发,基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维,系统梳理2026年最实用的操作要点,帮助你少走弯路,让网