Qwen3.7-Plus正式上线千问云，多模态智能体能力再升级

时间：2026-06-06 16:45

Qwen3 7-Plus多模态大模型上线千问云和阿里云百炼，支持API调用。其在VisionArena位列全球前五、中国第一。模型实现多模态混合智能体突破，将视觉感知、推理、编程、工具调用和验证整合为完整工作流，文本能力接近旗舰，编程与Agent能力显著提升。

在智能体（Agentic）时代，人工智能的核心命题已从单纯的“对话交互”悄然转向“实际任务执行”。

近日，千问3.7系列推出的最新多模态大模型——Qwen3.7-Plus正式亮相，并已在千问云和阿里云百炼平台同步上架，开发者可通过API直接调用。

先提炼几个关键结论：Qwen3.7-Plus在文本与视觉能力上均有显著提升，在第三方权威评测榜单Vision Arena中位列全球前五、中国第一。更值得关注的是，该模型在多模态混合智能体方向实现了实质性突破——它不仅能理解图片与视频内容，还能进行深度推理、自主编程、调用工具、执行验证测试，甚至实现自我迭代。简言之，它将“观察、思考、编写、执行、验证”五个环节无缝衔接，形成了一条完整的智能体工作流。

根据第三方权威榜单Vision Arena的排名，阿里巴巴凭借Qwen3.7-Plus模型跻身全球前五、中国第一的位置

该模型在多模态混合智能体领域实现了全新突破——不仅能识别图片与视频内容，还能进行深度推理、自主编程、调用工具、验证测试并自主迭代，将“看、想、写、做、验”整合为一个统一的智能体工作流。

从“看懂”到“做完”：多模态混合智能体的全面进化

传统多模态模型的能力往往仅停留在“理解”层面。然而，Qwen3.7-Plus将视觉感知与代码生成、工具调用、GUI操控进行了深度融合，能够在单一的智能体循环中闭环执行复杂任务直至完成。

举例来说，在一项桌面端应用复刻测试中，模型利用GUI感知能力模拟用户与示例股票应用的交互流程：首先理解UI布局与功能细节，随后自动生成SwiftUI代码，连接实时行情API获取真实数据，最后自主执行并通过了10项核心功能测试。结果如何？它成功高保真地复刻了macOS原生Stocks应用。

另一个更具代表性的案例是英语词汇学习App的完整开发与测试。智能体连续稳定运行超过11小时，自动完成了从需求文档生成、代码编写、安装部署、测试用例创建到多场景测试的全流程。累计生成代码超过10,000行，触发Agent调用超过1,000次——这一过程已覆盖软件研发全生命周期的核心阶段。

文本能力媲美旗舰，编程与Agent能力显著增强

Qwen3.7-Plus是千问3.7系列的最新成员，其纯文本能力已接近旗舰模型Qwen3.7-Max，在Plus级别模型中展现了强大的编程、Agent、推理及通用能力。以下为几组关键数据：

• 编程能力：在Terminal Bench 2.0-Terminus、SciCode等评测中，相比前代Qwen3.6-Plus提升约9分。

• Agent能力：在评估通用Agent能力的Skillbench评测中提升10.2分；在MCP-Mark、Deep-Planning等评测中同样表现突出。

• 推理能力：在数学推理Apex评测中，性能评分约为前代模型的3倍。

• 长上下文处理：在MRCR-v2 128K评测中得分91.7，对长文本的理解能力非常扎实。

Qwen3.7-Plus关键评测得分一览

视觉能力全面系统性升级

为使模型在真实智能体场景中表现更佳，Qwen3.7-Plus对视觉能力进行了系统性强化：

• 视觉推理：在纯视觉推理评测BabyVision中，得分从前代的37.4跃升至64.7，泛化能力显著提升。

• 搜索增强问答：在SimpleVQA、MMSearchPlus、MMBC等评测中，性能提升最高超过2倍。例如，给定一张工厂中模糊的专业机械图，模型能清晰解析设备的功能与参数。

• GUI感知与操控：ScreenSpot Pro得分从前代的68.2提升至79.0，AndroidWorld得分达到81.0，已具备理解与操作真实用户界面的能力。

• 视觉编程：基于一张照片、截图、草图甚至一段视频，模型可直接生成完整的SVG动画或网页。

在视频理解与驾驶场景理解方面，千问3.7对视频中的事件、动作、时序与语义关系，以及真实世界的动态场景、交通参与者、空间关系的理解能力均有显著增强。这些能力为多模态智能体在自动驾驶、具身智能等高难度场景中的应用奠定了坚实基础。

工具使用能力大幅拓展

集成CI代码解释器后，Qwen3.7-Plus能够将“找不同”、“华容道”、“迷宫”等视觉任务转化为可计算问题并自行求解。接入搜索增强后，它可结合视觉线索与外部知识，回答那些仅凭图像内容无法解决的开放性问题。

更实际的应用场景是，基于Qwen3.7-Plus可构建浏览器智能助手。例如，面对一位非技术背景用户“采购一台最便宜ECS服务器”的需求，智能体可直接进入云控制台，完成实例规格比价、低成本选型、镜像与存储配置、安全组设置、订单确认等完整操作。更关键的是，当遇到价格变动、库存限制或购买受阻时，它能主动反思并调整策略。

现已上线千问云与百炼平台

Qwen3.7-Plus目前已在千问云和阿里云百炼平台上线，支持通过API调用，可接受文本与图片/视频双模态输入，兼容OpenAI标准协议。该模型支持思维链（enable_thinking）模式，建议在Agent任务中开启该模式以获得更优效果。

• 千问云API地址：https://www.qianwenai.com/models/qwen3.7-plus

• 百炼平台API入口：https://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3.7-plus

• 技术博客深度解读：https://qwen.ai/blog?id=qwen3.7-plus

来源：https://developer.aliyun.com/article/1739515

Plus

上一篇阿里云TSDB时序时空数据库黑科技全解析 下一篇Python之父曾欲移除import 称模块系统是败笔

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-06-30

企业组织级AI赋能具体实施方法

前段时间收到一位读者的留言，希望聊聊企业级、组织级的AI赋能究竟该怎么落地。巧的是，前几天刚看到一份咨询调研机构的数据：对近一两年所有企业级AI赋能项目的统计显示，超过90%的甲方企业认为，AI赋能在核心业务价值链上没有发挥任何实质性作用。除了AI辅助办公、企业智能知识库这类边缘应用起到了一些辅助效

AI教程 · 2026-06-30

Scrapy与Redis分布式架构的日本电商多平台数据聚合系统

从事日本电商数据聚合工作时，最大的难点在于要同时应对雅虎拍卖、煤炉（Mercari）、乐天和亚马逊日本站等截然不同的平台。以往使用单机爬虫，经常出现运行中崩溃的情况——单点故障、带宽利用率不足、数据存储混乱，这三大痛点令人困扰。本文分享一套基于Scrapy + Redis的分布式爬虫方案，专门解决

AI教程 · 2026-06-30

详细PuTTY 0.81安装教程 SSH远程连接与自定义路径设置

PuTTY（简称PT）是一款轻量级开源SSH Telnet客户端，凭借简洁高效的特性，多年来始终是系统管理员与开发者进行远程连接的首选利器。本教程将详细介绍PuTTY 0 81版本的完整安装过程，并指导您自定义安装路径，以便更灵活地管理SSH远程连接工具。安装准备首先需要说明的是，整个安装流

AI教程 · 2026-06-30

在线教育系统必备功能：直播课堂与题库考试架构

很多人一想到做在线教育系统，第一反应往往是先把直播间和课程播放器搭起来，觉得“能看课”就万事大吉了。真到落地那天才发现，系统能不能顺滑跑起来，关键全藏在那些细节里——课程怎么组织、学习进度怎么记、考试怎么处理、后台怎么管得住。前端看起来就几个页面，后端其实是一整条业务链路。不管你是要做在线教育APP

AI教程 · 2026-06-30

ZStack源码级AI诊断套件让故障排查秒出答案

一次故障排查，到底要花多少时间？运维人员处理私有云、虚拟化平台的问题，流程大致都是这样：先翻日志看现象，再去文档里找对应机制，然后搜社区有没有类似案例，最后综合判断给出答复。简单问题半小时，复杂问题可能要跨天——而这些时间里，大部分精力耗在了“找信息”而不是“做决策”上。类似的问题，也许每天都在