阿里千问登顶全球冠军,空间推理能力超越Gemini3与GPT5
11月26日,业界领先的空间推理基准测试榜单SpatialBench发布了最新一期成绩,阿里千问的视觉理解模型Qwen3-VL与Qwen2.5-VL包揽冠亚军,综合表现超越了Gemini 3、GPT-5.1、Claude Sonnet 4.5等国际顶尖模型。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
SpatialBench榜单数据显示,Qwen3-VL-235B与Qwen2.5-VL-72B分别取得13.5和12.9的高分,显著领先于Gemini 3.0 Pro Preview(9.6分)、GPT-5.1(7.5分)及Claude Sonnet 4.5等海外旗舰模型。

不过需要指出的是,当前AI大模型的整体表现与人类水平仍存在差距,人类基准线约为80分左右。在电路分析、CAD工程设计和分子生物学等复杂空间推理任务中,专业人士依然保持着明显优势,现有大模型还无法完全自动化完成此类工作。
据了解,Qwen2.5-VL于2024年开源,而Qwen3-VL则是阿里在2025年推出的新一代视觉理解模型。
Qwen3-VL在视觉感知与多模态推理方面取得重要突破,在32项核心能力测评中超越了Gemini 2.5 Pro和GPT-5。它不仅能够调用截图、搜索等工具完成"带图推理"任务,还能凭借一张设计草图或一段游戏视频直接进行"视觉编程"。

同时,Qwen3-VL专门增强了3D检测能力,能够更精准地感知空间环境。基于该模型,机器人可以更好地判断物体方位、视角变化和遮挡关系,实现如同远处采摘苹果般精准的动作控制。
目前Qwen3-VL已开源多个版本,包括2B、4B、8B、32B等密集模型,以及30B-A3B、235B-A22B等MoE架构模型。每个模型都提供指令版和推理版两种选择,成为目前最受企业和开发者欢迎的开源视觉理解模型。此外,Qwen3-VL模型也已上线千问APP,用户可免费体验其强大功能。
据悉,SpatialBench是近年来兴起的第三方空间推理基准测试榜单,主要关注多模态模型在空间、结构、路径等方面的综合推理能力,被AI社区视为衡量"具身智能"发展水平的新兴测试标准之一。
SpatialBench不仅测试模型已有知识,更着重评估模型在二维和三维空间中感知和操控抽象概念的能力,这对具身智能的实际落地应用尤为关键。
相关攻略
阿里 AI 战略,到底跑出了哪些成果?作者|张鹏编辑|Cynthia前几天,在巴塞罗那举行的 MWC 2026 上,阿里云向国际市场正式推出了企业级 Agentic AI 开发平台——百炼专属版。通
文 | 财能圈3月4日凌晨,阿里千问大模型核心负责人林俊旸在社交平台留下一句“me stepping down bye my beloved qwen”,便结束了自己在阿里巴巴六年的职业生涯。同一
3月4日凌晨,阿里千问模型负责人林俊旸突然宣布离职,引发业界广泛关注。据智能涌现报道,通义实验室紧急召开了All Hands会议,阿里集团CEO吴泳铭向千问员工坦诚表示了歉意。据报道,对于此次调整,
智东西作者 程茜编辑 漠影智东西1月30日报道,1月29日,阿里平头哥“真武810E”高端AI芯片上线正式,揭开了阿里隐藏已久的核心布局:由通义实验室、阿里云和平头哥组成的阿里巴巴AI黄金三角“通云
文 熊逾格编辑 子夜2026年1月15日,阿里千问App进行了上线以来最大规模的版本更新,全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,在全球首次实现点外卖、买东西、订机票等AI购物功能
热门专题
热门推荐
惠普部分型号支持主板集成RAID功能,用户可在系统启动阶段进入RAID配置环境,完成磁盘阵列的创建与维护操作。1、 开机过程中,根据屏幕提示,同时按下 Ctrl + I 组合键,即
F5公司已发布解决方案指南,强烈建议各组织立即遵循最新缓解步骤。 美国网络安全和基础设施安全局(CISA)已将新披露的F5 BIG-IP系统漏洞纳入其已知已利用漏洞(KEV)目录,警告该漏洞正在真实
helium10 chrome插件怎么安装?helium10浏览器扩展安装故障排查解答在电商运营的世界里,helium10可是一款相当强大的工具。而它的chrome插件安装,对于很
3月29日消息,据报道,此前,许先生以所在公司名义花费85万元购置了一辆玛莎拉蒂,后续在苏州某玛莎拉蒂4S店完成维保及延保办理。2019年5月,该车行驶中突发熄火故障,送至该4S店检修后,店方告知需
幻兽帕鲁中的帕鲁农场充满了奇幻与趣味,吸引了众多玩家想要体验。那么,它该如何下载安装呢?接下来为大家详细介绍。首先,要确定你的设备系统是否支持。幻兽帕鲁目前支持多种主流移动设备系统





