在智能体(Agentic)时代,人工智能的核心命题已从单纯的“对话交互”悄然转向“实际任务执行”。
近日,千问3.7系列推出的最新多模态大模型——Qwen3.7-Plus正式亮相,并已在千问云和阿里云百炼平台同步上架,开发者可通过API直接调用。
先提炼几个关键结论:Qwen3.7-Plus在文本与视觉能力上均有显著提升,在第三方权威评测榜单Vision Arena中位列全球前五、中国第一。更值得关注的是,该模型在多模态混合智能体方向实现了实质性突破——它不仅能理解图片与视频内容,还能进行深度推理、自主编程、调用工具、执行验证测试,甚至实现自我迭代。简言之,它将“观察、思考、编写、执行、验证”五个环节无缝衔接,形成了一条完整的智能体工作流。

根据第三方权威榜单Vision Arena的排名,阿里巴巴凭借Qwen3.7-Plus模型跻身全球前五、中国第一的位置
该模型在多模态混合智能体领域实现了全新突破——不仅能识别图片与视频内容,还能进行深度推理、自主编程、调用工具、验证测试并自主迭代,将“看、想、写、做、验”整合为一个统一的智能体工作流。
从“看懂”到“做完”:多模态混合智能体的全面进化
传统多模态模型的能力往往仅停留在“理解”层面。然而,Qwen3.7-Plus将视觉感知与代码生成、工具调用、GUI操控进行了深度融合,能够在单一的智能体循环中闭环执行复杂任务直至完成。
举例来说,在一项桌面端应用复刻测试中,模型利用GUI感知能力模拟用户与示例股票应用的交互流程:首先理解UI布局与功能细节,随后自动生成SwiftUI代码,连接实时行情API获取真实数据,最后自主执行并通过了10项核心功能测试。结果如何?它成功高保真地复刻了macOS原生Stocks应用。
另一个更具代表性的案例是英语词汇学习App的完整开发与测试。智能体连续稳定运行超过11小时,自动完成了从需求文档生成、代码编写、安装部署、测试用例创建到多场景测试的全流程。累计生成代码超过10,000行,触发Agent调用超过1,000次——这一过程已覆盖软件研发全生命周期的核心阶段。
文本能力媲美旗舰,编程与Agent能力显著增强
Qwen3.7-Plus是千问3.7系列的最新成员,其纯文本能力已接近旗舰模型Qwen3.7-Max,在Plus级别模型中展现了强大的编程、Agent、推理及通用能力。以下为几组关键数据:
• 编程能力:在Terminal Bench 2.0-Terminus、SciCode等评测中,相比前代Qwen3.6-Plus提升约9分。
• Agent能力:在评估通用Agent能力的Skillbench评测中提升10.2分;在MCP-Mark、Deep-Planning等评测中同样表现突出。
• 推理能力:在数学推理Apex评测中,性能评分约为前代模型的3倍。
• 长上下文处理:在MRCR-v2 128K评测中得分91.7,对长文本的理解能力非常扎实。

Qwen3.7-Plus关键评测得分一览
视觉能力全面系统性升级
为使模型在真实智能体场景中表现更佳,Qwen3.7-Plus对视觉能力进行了系统性强化:
• 视觉推理:在纯视觉推理评测BabyVision中,得分从前代的37.4跃升至64.7,泛化能力显著提升。
• 搜索增强问答:在SimpleVQA、MMSearchPlus、MMBC等评测中,性能提升最高超过2倍。例如,给定一张工厂中模糊的专业机械图,模型能清晰解析设备的功能与参数。
• GUI感知与操控:ScreenSpot Pro得分从前代的68.2提升至79.0,AndroidWorld得分达到81.0,已具备理解与操作真实用户界面的能力。
• 视觉编程:基于一张照片、截图、草图甚至一段视频,模型可直接生成完整的SVG动画或网页。
在视频理解与驾驶场景理解方面,千问3.7对视频中的事件、动作、时序与语义关系,以及真实世界的动态场景、交通参与者、空间关系的理解能力均有显著增强。这些能力为多模态智能体在自动驾驶、具身智能等高难度场景中的应用奠定了坚实基础。
工具使用能力大幅拓展
集成CI代码解释器后,Qwen3.7-Plus能够将“找不同”、“华容道”、“迷宫”等视觉任务转化为可计算问题并自行求解。接入搜索增强后,它可结合视觉线索与外部知识,回答那些仅凭图像内容无法解决的开放性问题。
更实际的应用场景是,基于Qwen3.7-Plus可构建浏览器智能助手。例如,面对一位非技术背景用户“采购一台最便宜ECS服务器”的需求,智能体可直接进入云控制台,完成实例规格比价、低成本选型、镜像与存储配置、安全组设置、订单确认等完整操作。更关键的是,当遇到价格变动、库存限制或购买受阻时,它能主动反思并调整策略。
现已上线千问云与百炼平台
Qwen3.7-Plus目前已在千问云和阿里云百炼平台上线,支持通过API调用,可接受文本与图片/视频双模态输入,兼容OpenAI标准协议。该模型支持思维链(enable_thinking)模式,建议在Agent任务中开启该模式以获得更优效果。
• 千问云API地址:https://www.qianwenai.com/models/qwen3.7-plus
• 百炼平台API入口:https://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3.7-plus
• 技术博客深度解读:https://qwen.ai/blog?id=qwen3.7-plus

