游乐游手机版
首页/AI教程/文章详情

Qwen3.7-Plus正式上线千问云,多模态智能体能力再升级

时间:2026-06-06 16:45
Qwen3 7-Plus多模态大模型上线千问云和阿里云百炼,支持API调用。其在VisionArena位列全球前五、中国第一。模型实现多模态混合智能体突破,将视觉感知、推理、编程、工具调用和验证整合为完整工作流,文本能力接近旗舰,编程与Agent能力显著提升。

在智能体(Agentic)时代,人工智能的核心命题已从单纯的“对话交互”悄然转向“实际任务执行”。

近日,千问3.7系列推出的最新多模态大模型——Qwen3.7-Plus正式亮相,并已在千问云和阿里云百炼平台同步上架,开发者可通过API直接调用。

先提炼几个关键结论:Qwen3.7-Plus在文本与视觉能力上均有显著提升,在第三方权威评测榜单Vision Arena中位列全球前五、中国第一。更值得关注的是,该模型在多模态混合智能体方向实现了实质性突破——它不仅能理解图片与视频内容,还能进行深度推理、自主编程、调用工具、执行验证测试,甚至实现自我迭代。简言之,它将“观察、思考、编写、执行、验证”五个环节无缝衔接,形成了一条完整的智能体工作流。

根据第三方权威榜单Vision Arena的排名,阿里巴巴凭借Qwen3.7-Plus模型跻身全球前五、中国第一的位置

该模型在多模态混合智能体领域实现了全新突破——不仅能识别图片与视频内容,还能进行深度推理、自主编程、调用工具、验证测试并自主迭代,将“看、想、写、做、验”整合为一个统一的智能体工作流。

从“看懂”到“做完”:多模态混合智能体的全面进化

传统多模态模型的能力往往仅停留在“理解”层面。然而,Qwen3.7-Plus将视觉感知与代码生成、工具调用、GUI操控进行了深度融合,能够在单一的智能体循环中闭环执行复杂任务直至完成。

举例来说,在一项桌面端应用复刻测试中,模型利用GUI感知能力模拟用户与示例股票应用的交互流程:首先理解UI布局与功能细节,随后自动生成SwiftUI代码,连接实时行情API获取真实数据,最后自主执行并通过了10项核心功能测试。结果如何?它成功高保真地复刻了macOS原生Stocks应用。

另一个更具代表性的案例是英语词汇学习App的完整开发与测试。智能体连续稳定运行超过11小时,自动完成了从需求文档生成、代码编写、安装部署、测试用例创建到多场景测试的全流程。累计生成代码超过10,000行,触发Agent调用超过1,000次——这一过程已覆盖软件研发全生命周期的核心阶段。

文本能力媲美旗舰,编程与Agent能力显著增强

Qwen3.7-Plus是千问3.7系列的最新成员,其纯文本能力已接近旗舰模型Qwen3.7-Max,在Plus级别模型中展现了强大的编程、Agent、推理及通用能力。以下为几组关键数据:

• 编程能力:在Terminal Bench 2.0-Terminus、SciCode等评测中,相比前代Qwen3.6-Plus提升约9分。

• Agent能力:在评估通用Agent能力的Skillbench评测中提升10.2分;在MCP-Mark、Deep-Planning等评测中同样表现突出。

• 推理能力:在数学推理Apex评测中,性能评分约为前代模型的3倍。

• 长上下文处理:在MRCR-v2 128K评测中得分91.7,对长文本的理解能力非常扎实。

Qwen3.7-Plus关键评测得分一览

视觉能力全面系统性升级

为使模型在真实智能体场景中表现更佳,Qwen3.7-Plus对视觉能力进行了系统性强化:

• 视觉推理:在纯视觉推理评测BabyVision中,得分从前代的37.4跃升至64.7,泛化能力显著提升。

• 搜索增强问答:在SimpleVQA、MMSearchPlus、MMBC等评测中,性能提升最高超过2倍。例如,给定一张工厂中模糊的专业机械图,模型能清晰解析设备的功能与参数。

• GUI感知与操控:ScreenSpot Pro得分从前代的68.2提升至79.0,AndroidWorld得分达到81.0,已具备理解与操作真实用户界面的能力。

• 视觉编程:基于一张照片、截图、草图甚至一段视频,模型可直接生成完整的SVG动画或网页。

在视频理解与驾驶场景理解方面,千问3.7对视频中的事件、动作、时序与语义关系,以及真实世界的动态场景、交通参与者、空间关系的理解能力均有显著增强。这些能力为多模态智能体在自动驾驶、具身智能等高难度场景中的应用奠定了坚实基础。

工具使用能力大幅拓展

集成CI代码解释器后,Qwen3.7-Plus能够将“找不同”、“华容道”、“迷宫”等视觉任务转化为可计算问题并自行求解。接入搜索增强后,它可结合视觉线索与外部知识,回答那些仅凭图像内容无法解决的开放性问题。

更实际的应用场景是,基于Qwen3.7-Plus可构建浏览器智能助手。例如,面对一位非技术背景用户“采购一台最便宜ECS服务器”的需求,智能体可直接进入云控制台,完成实例规格比价、低成本选型、镜像与存储配置、安全组设置、订单确认等完整操作。更关键的是,当遇到价格变动、库存限制或购买受阻时,它能主动反思并调整策略。

现已上线千问云与百炼平台

Qwen3.7-Plus目前已在千问云和阿里云百炼平台上线,支持通过API调用,可接受文本与图片/视频双模态输入,兼容OpenAI标准协议。该模型支持思维链(enable_thinking)模式,建议在Agent任务中开启该模式以获得更优效果。

• 千问云API地址:https://www.qianwenai.com/models/qwen3.7-plus

• 百炼平台API入口:https://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3.7-plus

• 技术博客深度解读:https://qwen.ai/blog?id=qwen3.7-plus

来源:https://developer.aliyun.com/article/1739515
上一篇阿里云TSDB时序时空数据库黑科技全解析 下一篇Python之父曾欲移除import 称模块系统是败笔
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Synthesia零基础教程:客户端安装与工作区权限设置
AI教程 · 2026-06-07

Synthesia零基础教程:客户端安装与工作区权限设置

本文介绍了AI视频生成工具Synthesia的入门流程。内容涵盖从官网下载客户端、完成账户注册与登录,到软件安装与启动的完整步骤。详细说明了如何初始化工作区,包括创建首个AI视频项目、选择模板与AI主播。最后,指导用户理解并设置团队协作中的不同权限角色,以便安全高效地共同管理项目。

FramePack新手入门指南:安装启动报错修复导出全流程
AI教程 · 2026-06-07

FramePack新手入门指南:安装启动报错修复导出全流程

本文详细介绍了FramePack工具从下载安装到项目导出的完整流程。内容涵盖软件安装步骤、首次启动设置、常见报错解决方案以及项目打包导出方法。指南旨在帮助用户快速掌握工具核心操作,解决使用过程中可能遇到的技术问题,确保顺利完成AI视频帧处理任务。

FLUX.1保姆级教程:环境安装、显存优化与首次出图测试
AI教程 · 2026-06-07

FLUX.1保姆级教程:环境安装、显存优化与首次出图测试

本文详细介绍了FLUX 1的安装与初步使用流程。内容涵盖从Python环境配置、代码仓库克隆、依赖包安装,到关键的显存优化设置,最后指导用户完成首次文生图测试。教程旨在帮助用户顺利搭建运行环境,解决常见安装问题,并实现基础图像生成功能。

AnythingLLM新手实战:本地大模型部署后知识库接入设置
AI教程 · 2026-06-07

AnythingLLM新手实战:本地大模型部署后知识库接入设置

本文介绍了在本地部署大模型后,如何为AnythingLLM设置知识库。内容涵盖知识库的基本概念、创建与配置步骤、文档上传与处理技巧,以及如何通过问答测试其效果。旨在帮助用户有效整合本地文档资源,构建个性化的AI知识助手,提升信息检索与利用效率。

Aider安装失败排查:扩展冲突与登录异常全解析
AI教程 · 2026-06-07

Aider安装失败排查:扩展冲突与登录异常全解析

本文针对Aider安装过程中常见的扩展冲突与登录异常问题,提供了系统的排查思路与解决方案。内容涵盖如何识别并处理与其他AI工具的兼容性问题,解决因网络或账户设置导致的登录失败,以及通过环境检查、依赖更新等步骤彻底排除安装障碍,帮助用户顺利完成安装与配置。