GLM-4.7 - 智谱推出的旗舰AI模型，Coding能力再提升

时间：2026-04-22 19:08

GLM-4 7是什么谈起最近开源模型领域的动静，GLM-4 7的发布绝对算得上一个标志性事件。这款由智谱AI推出的模型，将核心升级点精准地锚定在了编码、推理与工具协同三大能力上。它在多语言编程、复杂任务规划乃至前端设计美学方面的表现，都让人眼前一亮，对包括Claude Code在内的多种编程框架提

GLM-4.7是什么

谈起最近开源模型领域的动静，GLM-4.7的发布绝对算得上一个标志性事件。这款由智谱AI推出的模型，将核心升级点精准地锚定在了编码、推理与工具协同三大能力上。它在多语言编程、复杂任务规划乃至前端设计美学方面的表现，都让人眼前一亮，对包括Claude Code在内的多种编程框架提供了良好支持。基准测试的结果也相当有力，其代码能力稳居开源领先梯队，而推理能力的跃升更是显著。为了实现更稳定的复杂任务执行，模型内部引入了交错式、保留式乃至轮级思考等多种模式，可控性大大增强。目前，开发者已经可以通过BigModel获取其API服务，而在z.ai的全栈开发模式中，全新的Skills模块也已上线，目标直指为开发者提供更高效、更智能的编程体验。

GLM-4.7的主要功能

核心编码能力：在多语言编程和终端任务处理上，GLM-4.7的表现堪称卓越。其支持的“先思考、再行动”模式，有效提升了复杂任务的稳定性和最终代码的产出质量。
前端设计优化：这一点对有UI设计需求的开发者非常友好。模型能够生成更具现代感、更美观的网页和幻灯片，直接提升了设计产出质量，帮开发者省去了大量繁琐的样式调整时间。
工具调用能力：在工具调用和网页浏览这类实际任务中，它的效率和准确性都上了一个台阶。例如，其在τ²-Bench中拿到了87.4%的高分，在BrowseComp测试中也取得了67.5分，提升幅度相当可观。
复杂推理能力：数学和逻辑推理是模型硬实力的试金石。GLM-4.7在HLE这类高难度基准测试中得分达到42.8%，相比前代大幅提升了12.4%，处理复杂问题的能力已经今非昔比。
思考模式优化：为了解决长程任务容易“跑偏”或“遗忘”的痛点，模型引入了交错式、保留式和轮级思考模式。这相当于给模型的思考过程加上了“导航”和“记事本”，执行复杂任务时的稳定性和可控性自然更强。
多模态与全栈开发：模型并非孤立地增强单项能力，而是着眼于多模态任务的协同与全栈开发的闭环。集成Skills模块的设计，正是为了助力开发者构建交互更丰富、体验更流畅的完整应用。

GLM-4.7的性能表现

编码能力（Core Coding）：
- SWE-bench Verified：73.8%的得分，比GLM-4.6高出5.8个百分点，这个成绩已经达到了开源模型的顶尖（SOTA）水平。
- SWE-bench Multilingual：66.7%的得分，相比前代跃升了12.9个百分点，清晰印证了其多语言编程能力的显著增强。
- Terminal Bench 2.0：41%的得分，提升幅度高达16.5个百分点，终端任务性能的提升可以说是一次“跨越”。
工具调用能力（Tool Using）：
- τ²-Bench：87.4%的高分，较前代提升12.2个百分点，其交互式工具调用能力同样站上了开源SOTA的位次。
- BrowseComp（网页浏览）：基础版本得分52.0%，提升6.9个百分点；而当启用更先进的上下文管理机制后，得分飙升至67.5%，提升达10个百分点。这组对比数据充分说明了它在网页浏览与复杂工具链管理方面的优化成效。
复杂推理能力（Complex Reasoning）：
- HLE（人类最后的考试）：42.8%的得分，相比GLM-4.6实现了12.4个百分点的巨大跨越，数学与深度推理能力的进步一目了然。
- MMLU-Pro：84.3%的得分，保持稳定提升，表明其多领域综合推理能力底子扎实。
- GPQA-Diamond：85.7%的得分，相比前代提升4.7个百分点，推理的精准度得到了进一步锤炼。

GLM-4.7的项目地址

项目官网：https://z.ai/blog/glm-4.7，获取最权威的发布信息和详情解读。
GitHub仓库：https://github.com/zai-org/GLM-4.5，开发者可以在此跟进代码、参与讨论。
HuggingFace模型库：https://huggingface.co/zai-org/GLM-4.7，方便社区直接下载和使用模型。

GLM-4.7的应用场景

编程与软件开发：作为高效的智能编程助手，它能生成高质量的多语言代码片段乃至完整模块，实实在在提升开发效率，降低重复劳动。
前端开发与设计：对于前端开发者和UI/UX设计师，它可以快速生成现代、美观的页面布局与配色方案，将从业者从繁复的样式调整中解放出来，更专注于逻辑与体验。
复杂任务规划与执行：凭借其保留式思考和轮级思考等高级模式，GLM-4.7擅长拆解和执行多步骤的复杂任务，确保长链条工作的准确性与稳定性，这在自动化流程设计中价值凸显。
教育与学习：在编程教育领域，它可以提供丰富的代码示例和实时练习指导；同时，通过解答数学和逻辑难题，也能有效辅助学生锻炼和提升结构化思维能力。
办公自动化：从自动生成格式规范的文档、报告，到编写数据分析脚本，GLM-4.7都能派上用场，大幅减少人工编写和排版的时间，成为提升办公效率的智能副手。

来源：https://ai-bot.cn/glm-4-7/

其他

上一篇NitroGen - 英伟达联合斯坦福大学等推出的通用游戏AI模型 下一篇【CVE-2026-4747】疯了！Claude 直接写内核 RCE，成功获得 Root Shell！

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

业界动态 · 2026-06-27

Adobe Reader零日漏洞被恶意PDF利用预警

本文分享EXPMON系统对一种针对Adobe Reader用户的高度复杂、指纹识别式PDF漏洞利用的检测与分析过程，并披露相关技术细节。一、摘要 EXPMON系统检测到一个针对Adobe Reader用户的高度复杂的PDF漏洞利用样本。根据分析，该样本属于一个初始漏洞利用程序，具备收集和泄露各类

业界动态 · 2026-06-27

黑客借Claude Code和GPT-4.1窃取墨西哥数亿政府记录

先说一个让人后背发凉的案例。一名黑客，只用了几个小时的“作业时间”，就把墨西哥九家政府机构的网络翻了个底朝天。他累计提交了1,088条指令，在34次实时会话中触发了5,317条操作命令，硬是在数小时内把一片陌生的网络变成了清晰标记的攻击地图。这个工作量，如果换乘人类安全团队，恐怕够整个团队忙上好几天