智谱IPO前推出旗舰大模型GLM-4,能力全面升级
在推进IPO的关键节点,智谱AI正式上线并开源其最新旗舰模型GLM-4.7,新版本针对Coding场景着重强化了编码能力、长程任务规划与工具协同,标志着该公司技术产品线的又一次重要迭代。
12月23日,智谱正式上线并开源其最新旗舰模型GLM-4.7,在多项主流公开基准测试中,GLM-4.7展现了具有竞争力的性能,部分指标超越了目前市场的领先模型。数据显示,在全球百万用户参与盲测的专业编码评估系统Code Arena中,GLM-4.7位列开源第一、国产第一,并超越了GPT-5.2。同时,该模型在SWE-bench-Verified和LiveCodeBench V6等测试中均取得了开源SOTA(当前最佳)分数,对齐Claude Sonnet 4.5。
在架构上,GLM-4.7引入了“保留式思考”与“轮级思考”机制,显著提升了复杂任务的稳定性与可控性。在前端生成质量方面,模型对UI设计规范的理解得以增强,能够生成审美更佳的网页与PPT。目前,该模型已通过BigModel.cn提供API服务,并在z.ai全栈开发模式中上线Skills模块,支持多模态任务的统一规划。
此次更新标志着国产大模型在“思考”与“行动”协同能力上的进一步突破。随着Coding能力的增强,开发者能够更自然地以“任务交付”为核心组织开发流程,这一进展也被视为智谱在资本市场动作前夕展示技术肌肉的重要举措。
编码与推理能力刷新基准
根据公布的测试数据,GLM-4.7在编程和推理能力上实现了显著提升。在HLE(“人类最后的考试”)基准测试中,该模型获得42.8%的成绩,较上一代GLM-4.6提升41%,并超越了GPT-5.1。
在代码生成领域,GLM-4.7展现了在多语言编码方面的优势。具体评测数据包括:
SWE-bench-Verified:获得73.8%的开源SOTA分数。LiveCodeBench V6:达到84.9%的开源SOTA分数,超过Claude Sonnet 4.5。Terminal Bench 2.0:达到41%,提升幅度达16.5%。
此外,在工具调用能力方面,GLM-4.7在τ²-Bench交互式工具调用评测中得分87.4分,刷新开源记录。
引入可控“思考”模型
为解决复杂任务中的稳定性问题,GLM-4.7强化了思考能力的可控进化,具体体现在三个维度:
交错式思考:模型在每次回答或工具调用前进行预先思考,以提升对复杂指令的遵循能力及代码生成质量。保留式思考:支持在多轮对话中自动保留思考块,提升缓存命中率,从而降低长程任务的推理成本。轮级思考:允许在该会话内按“轮”控制推理开销,简单任务关闭思考以降低时延,复杂任务开启思考以确保准确性。
这种机制使得GLM-4.7能够在Claude Code、TRAE、Kilo Code、Cline和Roo Code等主流编程框架中实现“先思考、再行动”的逻辑,在实际编程任务的稳定性和可交付性上优于前代版本。
前端审美与全栈交付
针对前端开发场景,GLM-4.7提升了对视觉代码的理解力。在实际应用中,模型能够更好地遵循UI设计规范,在布局结构、配色和谐度及组件样式上提供具备美感的默认方案,减少人工微调时间。
据最新演示,该模型在办公创作中的版式审美显著升级,PPT 16:9的适配率从52%跃升至91%,生成结果基本达到“即开即用”标准。

在实际案例演示中,GLM-4.7已能独立完成如“植物大战僵尸”、“水果忍者”等高交互小游戏的开发,显示出较强的任务拆解与技术栈整合能力。

市场反馈:性价比与实战表现
GLM-4.7上线后迅速引起了全球开发者社区的关注,用户反馈主要集中在其实际解决问题的能力与极高的性价比上。
在社交媒体上,网友Diego分享了使用GLM-4.7编写Python代码来可视化单行道红绿灯的案例,评价称结果“整体运行良好”,仅指出车辆颜色随红绿灯变化的细微瑕疵。

网友Alex Fazio则表示在WebDev Arena上的表现令其震惊,直言“GLM-4.7超越了GPT-5.2”。
价格策略也成为市场讨论的焦点。网友Bessi指出,订阅一年GLM-4.7的费用仅相当于Codex或Claude Code最高级计划一个月的价格,并认为这种极具竞争力的定价模式将对西方AI公司构成挑战,直言“无论你是否喜欢,这就是未来”。

针对模型进化速度,网友Chubby评论称,HLE基准测试原本被设计为极其复杂、难以在短期内拟合的最终测试,但业界在短短12个月内通过各类工具将成绩从8%(o1)提升至45.8%,GLM-4.7此次取得的突破表明技术迭代速度正“超出预期”。
相关攻略
角色与核心任务 你是一位顶级的文章润色专家,擅长将AI生成的文本转化为具有个人风格的专业文章。现在,请对用户提供的文章进行“人性化重写”。 你的核心目标是: 在不改动原文任何事实信息、核心观点、逻辑结构、章节标题和所有图片的前提下,彻底改变原文的AI表达腔调,使其读起来像是一位资深人类专家的作品。
从“动口”到“动手”:OpenClaw如何将AI推入“执行时代”? 文|洞见新研社 3月的最后一周,OpenClaw的GitHub社区上演了一出反转剧。往日里忙着报错的开发者们这次成了观众,主角换成了来自蚂蚁、天融信、360等机构的安全研究员,他们密集披露了数十个涉及远程接管、信息泄露的高风险漏洞。
程序员惊喜,每月100美元!OpenAI上线全新Pro方案:Codex限时10倍额度 北京时间4月10日凌晨,OpenAI终于落下了重度用户期盼已久的那只靴子:正式推出每月100美元的全新订阅方案。 至此,OpenAI的商业化版图已经清晰地划分为四个核心层级: ·免费版(接入广告) ·每月8美元的G
2026 04 14 一个核心趋势是:未来的商业竞争,本质上是用户注意力资源的争夺战。谁能更精准、高效地连接信息与用户需求,谁就能在市场中赢得关键优势。 本文配图深刻揭示了这种高效连接的底层逻辑与完整工作流。它系统展示了从数据采集到价值交付的闭环链路,每个环节都紧密耦合。实践证明,其中任一节点的效率
AI行业迎来关键转折:从“烧钱补贴”迈入“商业化定价”新阶段。被市场誉为“Token第一股”的迅策科技(03317)迎来重大利好。近期,国泰君安国际大幅上调其目标价至245港元 股。多重因素驱动下,迅策有望成为AI领域“千亿市值俱乐部”的有力竞争者。 中国AI实现弯道超车:成本优势构筑核心壁垒 全球
热门专题
热门推荐
备受瞩目的MG07,现已正式登陆工信部新车公告目录。这标志着,这款全新轿跑距离正式上市发售,又迈出了关键一步。 仅从外观设计审视,MG07便展现出令人过目不忘的视觉冲击力。其造型极具张力与未来感,辨识度极高。前脸配备的锐利修长大灯组,造型已接近高性能跑车的经典风格,视觉攻击性十足。车身侧面,流畅而舒
5月15日,彭博社的一则爆料,给硅谷的科技圈投下了一颗不大不小的石子。据知情人士透露,苹果与OpenAI那场曾被视为“天作之合”的战略联姻,在持续两年后正面临破裂危机。核心矛盾点在于,OpenAI方面认为商业回报远未达预期,甚至已开始考虑采取法律手段。 由于相关讨论尚未公开,消息人士要求匿名。他们指
XPL币是Plasma生态系统的原生代币,主要用于网络治理、交易费用支付和节点激励。Plasma项目旨在构建一个高效、可扩展的区块链基础设施,其技术背景涉及分片与Layer2解决方案。XPL币的使用场景覆盖了网络治理投票、Gas费抵扣、节点质押奖励以及生态内服务支付,其价值与Plasma网络的实际采用率和生态发展紧密相连。
OpenAI成立独立咨询公司DeployCo,并获40亿美元投资。新公司将通过派驻前线工程师和收购等方式,帮助企业部署AI应用。此举标志着其战略重心从研发转向大规模企业赋能,旨在弥合AI能力与企业实际应用之间的差距。面对万亿美元规模的系统集成市场,OpenAI将与现有咨询机构形成竞合关系。
5月13日,全球跑车行业迎来战略级转向:英国传奇性能品牌路特斯(Lotus)正式公布其“Focus 2030”全新战略规划。核心决策引发广泛关注——品牌宣布调整此前激进的全面电动化路线,重启燃油及混合动力跑车的研发,未来将采取燃油、混合动力与纯电动“三线并行”的产品发展路径。 路特斯集团首席执行官冯






