游乐游手机版
首页/AI教程/文章详情

Qwen3.7-Plus正式上线千问云,多模态智能体能力再升级

时间:2026-06-06 16:45
Qwen3 7-Plus多模态大模型上线千问云和阿里云百炼,支持API调用。其在VisionArena位列全球前五、中国第一。模型实现多模态混合智能体突破,将视觉感知、推理、编程、工具调用和验证整合为完整工作流,文本能力接近旗舰,编程与Agent能力显著提升。

在智能体(Agentic)时代,人工智能的核心命题已从单纯的“对话交互”悄然转向“实际任务执行”。

近日,千问3.7系列推出的最新多模态大模型——Qwen3.7-Plus正式亮相,并已在千问云和阿里云百炼平台同步上架,开发者可通过API直接调用。

先提炼几个关键结论:Qwen3.7-Plus在文本与视觉能力上均有显著提升,在第三方权威评测榜单Vision Arena中位列全球前五、中国第一。更值得关注的是,该模型在多模态混合智能体方向实现了实质性突破——它不仅能理解图片与视频内容,还能进行深度推理、自主编程、调用工具、执行验证测试,甚至实现自我迭代。简言之,它将“观察、思考、编写、执行、验证”五个环节无缝衔接,形成了一条完整的智能体工作流。

根据第三方权威榜单Vision Arena的排名,阿里巴巴凭借Qwen3.7-Plus模型跻身全球前五、中国第一的位置

该模型在多模态混合智能体领域实现了全新突破——不仅能识别图片与视频内容,还能进行深度推理、自主编程、调用工具、验证测试并自主迭代,将“看、想、写、做、验”整合为一个统一的智能体工作流。

从“看懂”到“做完”:多模态混合智能体的全面进化

传统多模态模型的能力往往仅停留在“理解”层面。然而,Qwen3.7-Plus将视觉感知与代码生成、工具调用、GUI操控进行了深度融合,能够在单一的智能体循环中闭环执行复杂任务直至完成。

举例来说,在一项桌面端应用复刻测试中,模型利用GUI感知能力模拟用户与示例股票应用的交互流程:首先理解UI布局与功能细节,随后自动生成SwiftUI代码,连接实时行情API获取真实数据,最后自主执行并通过了10项核心功能测试。结果如何?它成功高保真地复刻了macOS原生Stocks应用。

另一个更具代表性的案例是英语词汇学习App的完整开发与测试。智能体连续稳定运行超过11小时,自动完成了从需求文档生成、代码编写、安装部署、测试用例创建到多场景测试的全流程。累计生成代码超过10,000行,触发Agent调用超过1,000次——这一过程已覆盖软件研发全生命周期的核心阶段。

文本能力媲美旗舰,编程与Agent能力显著增强

Qwen3.7-Plus是千问3.7系列的最新成员,其纯文本能力已接近旗舰模型Qwen3.7-Max,在Plus级别模型中展现了强大的编程、Agent、推理及通用能力。以下为几组关键数据:

• 编程能力:在Terminal Bench 2.0-Terminus、SciCode等评测中,相比前代Qwen3.6-Plus提升约9分。

• Agent能力:在评估通用Agent能力的Skillbench评测中提升10.2分;在MCP-Mark、Deep-Planning等评测中同样表现突出。

• 推理能力:在数学推理Apex评测中,性能评分约为前代模型的3倍。

• 长上下文处理:在MRCR-v2 128K评测中得分91.7,对长文本的理解能力非常扎实。

Qwen3.7-Plus关键评测得分一览

视觉能力全面系统性升级

为使模型在真实智能体场景中表现更佳,Qwen3.7-Plus对视觉能力进行了系统性强化:

• 视觉推理:在纯视觉推理评测BabyVision中,得分从前代的37.4跃升至64.7,泛化能力显著提升。

• 搜索增强问答:在SimpleVQA、MMSearchPlus、MMBC等评测中,性能提升最高超过2倍。例如,给定一张工厂中模糊的专业机械图,模型能清晰解析设备的功能与参数。

• GUI感知与操控:ScreenSpot Pro得分从前代的68.2提升至79.0,AndroidWorld得分达到81.0,已具备理解与操作真实用户界面的能力。

• 视觉编程:基于一张照片、截图、草图甚至一段视频,模型可直接生成完整的SVG动画或网页。

在视频理解与驾驶场景理解方面,千问3.7对视频中的事件、动作、时序与语义关系,以及真实世界的动态场景、交通参与者、空间关系的理解能力均有显著增强。这些能力为多模态智能体在自动驾驶、具身智能等高难度场景中的应用奠定了坚实基础。

工具使用能力大幅拓展

集成CI代码解释器后,Qwen3.7-Plus能够将“找不同”、“华容道”、“迷宫”等视觉任务转化为可计算问题并自行求解。接入搜索增强后,它可结合视觉线索与外部知识,回答那些仅凭图像内容无法解决的开放性问题。

更实际的应用场景是,基于Qwen3.7-Plus可构建浏览器智能助手。例如,面对一位非技术背景用户“采购一台最便宜ECS服务器”的需求,智能体可直接进入云控制台,完成实例规格比价、低成本选型、镜像与存储配置、安全组设置、订单确认等完整操作。更关键的是,当遇到价格变动、库存限制或购买受阻时,它能主动反思并调整策略。

现已上线千问云与百炼平台

Qwen3.7-Plus目前已在千问云和阿里云百炼平台上线,支持通过API调用,可接受文本与图片/视频双模态输入,兼容OpenAI标准协议。该模型支持思维链(enable_thinking)模式,建议在Agent任务中开启该模式以获得更优效果。

• 千问云API地址:https://www.qianwenai.com/models/qwen3.7-plus

• 百炼平台API入口:https://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3.7-plus

• 技术博客深度解读:https://qwen.ai/blog?id=qwen3.7-plus

来源:https://developer.aliyun.com/article/1739515
上一篇阿里云TSDB时序时空数据库黑科技全解析 下一篇Python之父曾欲移除import 称模块系统是败笔
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
企业组织级AI赋能具体实施方法
AI教程 · 2026-06-30

企业组织级AI赋能具体实施方法

前段时间收到一位读者的留言,希望聊聊企业级、组织级的AI赋能究竟该怎么落地。巧的是,前几天刚看到一份咨询调研机构的数据:对近一两年所有企业级AI赋能项目的统计显示,超过90%的甲方企业认为,AI赋能在核心业务价值链上没有发挥任何实质性作用。除了AI辅助办公、企业智能知识库这类边缘应用起到了一些辅助效

Scrapy与Redis分布式架构的日本电商多平台数据聚合系统
AI教程 · 2026-06-30

Scrapy与Redis分布式架构的日本电商多平台数据聚合系统

从事日本电商数据聚合工作时,最大的难点在于要同时应对雅虎拍卖、煤炉(Mercari)、乐天和亚马逊日本站等截然不同的平台。以往使用单机爬虫,经常出现运行中崩溃的情况——单点故障、带宽利用率不足、数据存储混乱,这三大痛点令人困扰。 本文分享一套基于Scrapy + Redis的分布式爬虫方案,专门解决

详细PuTTY 0.81安装教程 SSH远程连接与自定义路径设置
AI教程 · 2026-06-30

详细PuTTY 0.81安装教程 SSH远程连接与自定义路径设置

​ PuTTY(简称PT)是一款轻量级开源SSH Telnet客户端,凭借简洁高效的特性,多年来始终是系统管理员与开发者进行远程连接的首选利器。本教程将详细介绍PuTTY 0 81版本的完整安装过程,并指导您自定义安装路径,以便更灵活地管理SSH远程连接工具。 安装准备 首先需要说明的是,整个安装流

在线教育系统必备功能:直播课堂与题库考试架构
AI教程 · 2026-06-30

在线教育系统必备功能:直播课堂与题库考试架构

很多人一想到做在线教育系统,第一反应往往是先把直播间和课程播放器搭起来,觉得“能看课”就万事大吉了。真到落地那天才发现,系统能不能顺滑跑起来,关键全藏在那些细节里——课程怎么组织、学习进度怎么记、考试怎么处理、后台怎么管得住。前端看起来就几个页面,后端其实是一整条业务链路。不管你是要做在线教育APP

ZStack源码级AI诊断套件让故障排查秒出答案
AI教程 · 2026-06-30

ZStack源码级AI诊断套件让故障排查秒出答案

一次故障排查,到底要花多少时间? 运维人员处理私有云、虚拟化平台的问题,流程大致都是这样:先翻日志看现象,再去文档里找对应机制,然后搜社区有没有类似案例,最后综合判断给出答复。简单问题半小时,复杂问题可能要跨天——而这些时间里,大部分精力耗在了“找信息”而不是“做决策”上。 类似的问题,也许每天都在