阿里通义千问发布Qwen3.7-Max全栈智能体基座
2025年5月20日,通义千问重磅推出新一代旗舰模型——Qwen3.7-Max。这款被定位为“面向智能体时代”的先进大语言模型,即将通过API全面开放,其核心使命是成为一个卓越的全能智能体基座模型。无论是高效编写与调试代码、实现办公流程深度自动化,还是稳健执行涉及数百乃至数千步骤的长周期复杂任务,Qwen3.7-Max旨在提供持续、自主且高度可靠的支持,开启智能体应用的新篇章。
核心优势:广度与深度兼备的智能体能力
Qwen3.7-Max的核心竞争力,源于其智能体能力在广度与深度上的双重突破。在AI编程领域,从前端原型快速构建到后端复杂的多文件软件工程,它都能游刃有余。在办公自动化与生产力提升场景,通过原生支持模型上下文协议(MCP)集成和高效的多智能体协作,它能够实现工作流的智能化重塑。其长周期任务执行能力尤为引人注目:在一项耗时长达35小时、累计调用工具超过1000次的全自主GPU内核优化实验中,模型展现了卓越的连贯推理能力与持久稳定的性能表现。更重要的是,无论是在Claude Code、OpenClaw、Qwen Code还是其他自定义框架中部署,Qwen3.7-Max都表现出优秀的跨框架泛化能力,确保了其作为企业级智能体基座的广泛适用性与可靠性。
Qwen3.7-Max即将通过阿里云百炼平台提供便捷的API服务,主要聚焦于以下四大前沿应用方向:
- 前沿编程智能体:覆盖从快速原型开发到企业级软件工程的全流程代码生成与优化。
- 办公生产力与工作流自动化:支持MCP协议深度集成,实现文档处理、数据分析等多智能体协同自动化。
- 持续稳定的长周期自主执行能力:胜任需要长时间规划与迭代的复杂、多步骤任务。
- 跨多种智能体框架的泛化能力:无缝适配主流开发框架,降低开发者接入与迁移成本。
模型表现:全方位评测领先

从最新的权威评测数据来看,Qwen3.7-Max在多个关键维度均展现出领先或顶尖的综合实力。
编程智能体方面,在SWE-Pro(得分60.6)、SWE-Multilingual(78.3)、SciCode(53.5)和QwenSVG(1608)等基准上均取得领先地位。在Terminal Bench 2.0-Terminus(69.7)上超越了DS-V4-Pro Max(67.9)。在SWE-Verified(80.4)上则与Opus-4.6 Max(80.8)和DS-V4-Pro Max(80.6)表现相当,跻身第一梯队。
通用智能体方面,性能提升更为显著。在MCP-Mark(60.8 vs. GLM-5.1的57.5)、MCP-Atlas(76.4 vs. Opus-4.6的75.8)和Skillbench(59.2 vs. K2.6的56.2)上表现突出。尤其在Kernel Bench L3上,实现了1.98倍的中位数加速和96%的加速成功率,展示了强大的GPU内核优化实战能力。在BFCL-V4(75.0)、Qwenclaw(64.3)和ClawEval(65.2)上同样表现出色,紧追Opus-4.6 Max。在办公自动化基准SpreadSheetBench-v1上获得87.0的高分,处于行业顶尖水平。
复杂推理能力方面,在多个高难度基准上取得领先:GPQA Diamond(92.4 vs. Opus-4.6的91.3)、HLE(41.4 vs. Opus-4.6的40.0)、HMMT 2026 Feb(97.1 vs. Opus-4.6的96.2)、IMOAnswerBench(90.0 vs. DS-V4-Pro的89.8)和Apex(44.5 vs. DS-V4-Pro的38.3)。
通用与多语言能力方面,在IFBench(79.1 vs. DS-V4-Pro的77.0)上表现突出,展示了精准的指令遵循与理解能力。在WMT24++(85.8)和MAXIFE(89.2)上领先,表明其多语言理解与高质量翻译能力处于业界一流。在SuperGPQA(73.6)和QwenWorldBench(57.3)上同样表现卓越。

需要特别强调的是,上述优异的评测成绩是在多种不同的智能体运行框架下取得的。这有力证明了Qwen3.7-Max并非针对某一特定框架进行过拟合优化,而是在Claude Code、OpenClaw、Qwen Code及各类自定义工具调用框架下都能保持稳定、高效的发挥。这种卓越的跨框架兼容性,使其成为构建各类企业级智能体系统更可靠、更通用的强大基座模型。
生产力助手:重塑专业工作流
面向真实的企业级生产力场景,Qwen3.7-Max旨在成为深度协同的AI助手。依托其强大的智能体执行能力,它可以全面重塑专业工作流:从海量行业信息的快速研读与整合,到复杂业务数据的深度分析与建模预测,再到出版级专业文档与交互式可视化的自动生成,它能够精准承接高复杂度、高强度、高质量要求的核心任务。
该模型原生适配主流智能体开发框架。针对需要长链路交付的复杂项目,它支持长达数小时的自主规划与持续运行,通过上千次精准的工具调用和数十轮自动版本迭代,持续优化最终交付物的质量。以往可能需要专业团队耗时一至两周才能完成的复杂数据分析或代码重构项目,现在由Qwen3.7-Max驱动的智能体有望在数小时内完成从需求理解到成果交付的端到端闭环,从而推动企业生产力实现实质性跃升。
智能体扩展:环境多样性驱动能力泛化
在Qwen3.5引入的环境扩展方法基础上,Qwen3.7进一步大幅提升了智能体训练环境的质量、规模与多样性。这背后的核心理念与语言模型的预训练类似:正如大语言模型通过海量多样化文本数据获得强大的语言泛化能力,智能体的规划与执行能力同样可以从高度多样化的模拟训练环境中实现真正的泛化。

如图所示,这种大规模环境扩展带来了清晰且稳定的性能提升轨迹,Qwen3.7-Max在智能体综合能力排名中已位列前三,接近Claude-4.6-Opus-Max的顶尖水平。值得注意的是,评测中所有基准测试所涉及的环境场景,均为训练过程中从未出现过的全新、未见领域外环境,这直接验证了其强大的零样本泛化能力。
研究还揭示了一个显著规律:模型在任意一个基准子集上获得的性能增益高度一致,可以可靠地预测其在其余未知基准或整体平均值上的相对增益。这表明,由环境多样性驱动的能力扩展,带来的是真正通用的问题解决能力提升,而非针对特定评测基准的针对性优化。关于扩展动态和训练方法论的深度技术分析,将在后续发布的详细技术报告中全面阐释。
跨框架泛化能力:掌握解题策略,而非框架捷径
为了实现真正的通用泛化,其底层训练基础设施将每个训练实例解耦为三个正交组件——任务、运行框架与验证器,这些组件可以进行自由组合与重组。该创新设计兼容多种运行框架及其迭代版本,并将训练环境根植于真实应用场景。这种解耦实现了高效的组合式数据扩展:同一核心任务能以极低的边际成本,与不同类型、不同版本的运行框架及验证器进行匹配训练。
更关键的是,它赋能了跨框架与跨验证器的强化学习训练——迫使模型在不断变化的框架配置下,反复学习处理同源任务,从而真正掌握具备泛化能力的解题策略,而非依赖特定框架的“捷径”或“后门”。在QwenClawBench与CoWorkBench等跨框架评测中,无论评估时使用何种运行框架(Harness),Qwen3.7-Max均展现出强劲且一致的性能表现,显著超越前代Qwen3.6系列模型。这有力地证实了该模型已真正内化了解决任务的核心逻辑与能力,而非过拟合于某个特定框架的接口或模式。

因此,Qwen3.7-Max可以无缝、低门槛地集成到包括Claude Code、OpenClaw、Qwen Code在内的主流智能体框架和AI编程助手中,为开发者和企业提供一个强大、灵活且可靠的智能体基座选择,加速AI原生应用的创新与落地。
相关攻略
在会计审计实务中,如何从格式复杂的财务报表中高效提取数据并完成专业分析,是提升工作效率的关键挑战。传统OCR技术与规则引擎常因文档结构混乱、跨页表格、附注嵌套等问题而力不从心。如今,借助通义千问(Qwen)系列大模型,我们可以构建一套覆盖图像解析、深度分析到底稿生成的智能化全流程解决方案。本文将详细
合理配置千问Qwen的prompt缓存机制可显著降低延迟。隐式缓存自动识别重复前缀,需保持请求结构一致。显式缓存适合固定模板,需注册并指定缓存键。vLLM部署可启用前缀缓存,Transformers则需手动管理past_key_values参数。调试时可禁用缓存以获取基线数据。
【快讯】阿里云旗下千问大模型家族迎来了新成员——最新预览版本Qwen3 7-Max-Preview与Qwen3 7-Plus-Preview已正式登陆Qwen Chat及Arena AI平台。这意味着,在即将到来的5月20日阿里云峰会正式发布前,业界和开发者已经可以提前一睹其风采。 作为Qwen3
阿里通义千问推出下一代旗舰模型预览版Qwen3 7Preview,包含主打极致推理的Max版和侧重长上下文与性价比的Plus版。模型在编程基准和LMSYS竞技场表现领先,支持多模态输入与超长上下文处理,采用混合专家架构等技术创新,适用于软件开发、企业知识管理等多类场景。
Qwen3 7系列预览版在竞技场榜单首次亮相,其中Qwen3 7-Max-Preview在文本综合能力榜位列全球第13,助力阿里机构排名升至第6,并居国产模型首位。Qwen3 7-Plus-Preview则在视觉榜单排名第16,使阿里视觉机构排名跃至第5。两款模型在多个细分领域也进入全球前十。自Qwen3系列起,模型迭代明显加速,预览版先行测试、正式版后续发
热门专题
热门推荐
为庆祝成立50周年,苹果在全球多地门店举办系列庆祝活动。最盛大的庆典在其总部ApplePark举行,员工齐聚草坪,传奇音乐人保罗·麦卡特尼登台献唱,首席执行官蒂姆·库克也参与其中。这场科技与艺术交融的盛会,既是对过往传奇的致敬,也寓意着新篇章的开启。
苹果公司成立五十周年之际,首席执行官蒂姆·库克发布内部信回顾历程。信中指出,公司从车库中的一台原型机起步,如今全球活跃设备已达25亿台。库克强调,未来需主动创造而非等待,并鼓励员工铭记创新精神,共同把握机遇,开创下一个五十年。
苹果CEO库克在专访中回顾了iPod的诞生历程。该产品以口袋装千首歌的能力革新了音乐消费方式。其爆红要求苹果在三个月内生产约1500万台,这极大考验了供应链。此次极限压力测试为苹果锻造出世界级供应链能力奠定了基础。库克还透露,首台原型机播放的第一首歌是《HeyJude》。
知名投资人段永平家族办公室持仓市值升至约200亿美元。本季度清仓阿里,减持苹果、台积电;重仓AI与电动车赛道,大幅增持英伟达并新建仓特斯拉,拼多多获增持。其首次跨足Web3领域,建仓稳定币发行商Circle,显示对合规区块链基础设施的关注。
Mac内置的“缩放”辅助功能可放大屏幕细节。通过系统设置开启该功能后,可选择画中画或全屏模式。用户可使用修饰键配合触控板手势、快捷键组合、双击Control+Option或鼠标智能缩放等多种方式灵活操作,满足不同场景下的查看需求。





