游乐游手机版
首页/业界动态/文章详情

GLM-4.7 - 智谱推出的旗舰AI模型,Coding能力再提升

时间:2026-04-22 19:08
GLM-4 7是什么 谈起最近开源模型领域的动静,GLM-4 7的发布绝对算得上一个标志性事件。这款由智谱AI推出的模型,将核心升级点精准地锚定在了编码、推理与工具协同三大能力上。它在多语言编程、复杂任务规划乃至前端设计美学方面的表现,都让人眼前一亮,对包括Claude Code在内的多种编程框架提

GLM-4.7是什么

谈起最近开源模型领域的动静,GLM-4.7的发布绝对算得上一个标志性事件。这款由智谱AI推出的模型,将核心升级点精准地锚定在了编码、推理与工具协同三大能力上。它在多语言编程、复杂任务规划乃至前端设计美学方面的表现,都让人眼前一亮,对包括Claude Code在内的多种编程框架提供了良好支持。基准测试的结果也相当有力,其代码能力稳居开源领先梯队,而推理能力的跃升更是显著。为了实现更稳定的复杂任务执行,模型内部引入了交错式、保留式乃至轮级思考等多种模式,可控性大大增强。目前,开发者已经可以通过BigModel获取其API服务,而在z.ai的全栈开发模式中,全新的Skills模块也已上线,目标直指为开发者提供更高效、更智能的编程体验。

GLM-4.7的主要功能

  • 核心编码能力:在多语言编程和终端任务处理上,GLM-4.7的表现堪称卓越。其支持的“先思考、再行动”模式,有效提升了复杂任务的稳定性和最终代码的产出质量。
  • 前端设计优化:这一点对有UI设计需求的开发者非常友好。模型能够生成更具现代感、更美观的网页和幻灯片,直接提升了设计产出质量,帮开发者省去了大量繁琐的样式调整时间。
  • 工具调用能力:在工具调用和网页浏览这类实际任务中,它的效率和准确性都上了一个台阶。例如,其在τ²-Bench中拿到了87.4%的高分,在BrowseComp测试中也取得了67.5分,提升幅度相当可观。
  • 复杂推理能力:数学和逻辑推理是模型硬实力的试金石。GLM-4.7在HLE这类高难度基准测试中得分达到42.8%,相比前代大幅提升了12.4%,处理复杂问题的能力已经今非昔比。
  • 思考模式优化:为了解决长程任务容易“跑偏”或“遗忘”的痛点,模型引入了交错式、保留式和轮级思考模式。这相当于给模型的思考过程加上了“导航”和“记事本”,执行复杂任务时的稳定性和可控性自然更强。
  • 多模态与全栈开发:模型并非孤立地增强单项能力,而是着眼于多模态任务的协同与全栈开发的闭环。集成Skills模块的设计,正是为了助力开发者构建交互更丰富、体验更流畅的完整应用。

GLM-4.7的性能表现

  • 编码能力(Core Coding)
    • SWE-bench Verified:73.8%的得分,比GLM-4.6高出5.8个百分点,这个成绩已经达到了开源模型的顶尖(SOTA)水平。
    • SWE-bench Multilingual:66.7%的得分,相比前代跃升了12.9个百分点,清晰印证了其多语言编程能力的显著增强。
    • Terminal Bench 2.0:41%的得分,提升幅度高达16.5个百分点,终端任务性能的提升可以说是一次“跨越”。
  • 工具调用能力(Tool Using)
    • τ²-Bench:87.4%的高分,较前代提升12.2个百分点,其交互式工具调用能力同样站上了开源SOTA的位次。
    • BrowseComp(网页浏览):基础版本得分52.0%,提升6.9个百分点;而当启用更先进的上下文管理机制后,得分飙升至67.5%,提升达10个百分点。这组对比数据充分说明了它在网页浏览与复杂工具链管理方面的优化成效。
  • 复杂推理能力(Complex Reasoning)
    • HLE(人类最后的考试):42.8%的得分,相比GLM-4.6实现了12.4个百分点的巨大跨越,数学与深度推理能力的进步一目了然。
    • MMLU-Pro:84.3%的得分,保持稳定提升,表明其多领域综合推理能力底子扎实。
    • GPQA-Diamond:85.7%的得分,相比前代提升4.7个百分点,推理的精准度得到了进一步锤炼。

GLM-4.7的项目地址

  • 项目官网:https://z.ai/blog/glm-4.7,获取最权威的发布信息和详情解读。
  • GitHub仓库:https://github.com/zai-org/GLM-4.5,开发者可以在此跟进代码、参与讨论。
  • HuggingFace模型库:https://huggingface.co/zai-org/GLM-4.7,方便社区直接下载和使用模型。

GLM-4.7的应用场景

  • 编程与软件开发:作为高效的智能编程助手,它能生成高质量的多语言代码片段乃至完整模块,实实在在提升开发效率,降低重复劳动。
  • 前端开发与设计:对于前端开发者和UI/UX设计师,它可以快速生成现代、美观的页面布局与配色方案,将从业者从繁复的样式调整中解放出来,更专注于逻辑与体验。
  • 复杂任务规划与执行:凭借其保留式思考和轮级思考等高级模式,GLM-4.7擅长拆解和执行多步骤的复杂任务,确保长链条工作的准确性与稳定性,这在自动化流程设计中价值凸显。
  • 教育与学习:在编程教育领域,它可以提供丰富的代码示例和实时练习指导;同时,通过解答数学和逻辑难题,也能有效辅助学生锻炼和提升结构化思维能力。
  • 办公自动化:从自动生成格式规范的文档、报告,到编写数据分析脚本,GLM-4.7都能派上用场,大幅减少人工编写和排版的时间,成为提升办公效率的智能副手。
来源:https://ai-bot.cn/glm-4-7/
上一篇NitroGen - 英伟达联合斯坦福大学等推出的通用游戏AI模型 下一篇【CVE-2026-4747】疯了!Claude 直接写内核 RCE,成功获得 Root Shell!
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
九号N1机甲风电动车发布 模拟声浪轻量化车架3499元起
业界动态 · 2026-05-29

九号N1机甲风电动车发布 模拟声浪轻量化车架3499元起

九号发布N1机甲风电动车系列,三款起售价3499元。N170极速47km h,轻量化车架;N185极速55km h,可选模拟声浪;旗舰N190极速60km h,标配模拟声浪及双通道ABS,7月上市。

九号2026新品发布会最强阵容连发4款新车重新定义好车标准
业界动态 · 2026-05-29

九号2026新品发布会最强阵容连发4款新车重新定义好车标准

九号公司发布2026年新品,推出N1、M1、M3及Fz5四款新车,覆盖电摩与电自领域。N1主打短轴距声光电酷玩体验,M1配备双通道ABS与100公里真续航,M3下放AXC车架技术,Fz5首搭载双向转把功能。同时推出3年原厂换新质保等用户权益。

世界超级摩托车锦标赛阿拉贡站张雪机车超级杆位赛获亚军
业界动态 · 2026-05-29

世界超级摩托车锦标赛阿拉贡站张雪机车超级杆位赛获亚军

5月29日,世界超级摩托车锦标赛(WSBK)阿拉贡站传来一则引人瞩目的消息——中国摩托车制造商“张雪机车”旗下的法国车手瓦伦丁·德比斯,在WorldSSP组别的超级杆位赛中成功夺得第二名。 先简要科普一下赛事背景:世界超级摩托车锦标赛(WSBK)是由国际摩托车联合会于1988年创立的顶级公路摩托车赛

英雄联盟海克斯大乱斗重大更新 移除羁绊新增技能符文
业界动态 · 2026-05-29

英雄联盟海克斯大乱斗重大更新 移除羁绊新增技能符文

英雄联盟海克斯大乱斗将在26 12版本移除羁绊系统,上线技能符文体系。该符文能重构技能释放逻辑,实现布里茨钩五人、拉克丝定全队等效果。部分原有羁绊效果转为独立专属符文,更新预计2026年6月中旬登陆国服。

领克10/10+正式上市限时价16.99-23.59万号称弯道之王
业界动态 · 2026-05-29

领克10/10+正式上市限时价16.99-23.59万号称弯道之王

```html 5月29日晚间,领克终于将其备受关注的中大型运动纯电轿车正式推向市场——领克10与领克10+同步上市,官方直接打出“弯道之王”的旗号。我们先不深究它是否真能“弯道超车”,单从价格来看,就已经颇具冲击力。 先奉上一张价格速览表,让大家心里有个底: 领克 10 701 长续航 Max:指