阿里千问登顶全球冠军,超越Gemini3与GPT5.1推理能力
11月26日消息,今日空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL与Qwen2.5-VL强势占据冠亚军位置,超越了Gemini 3、GPT-5.1、Claude Sonnet 4.5等国际顶尖模型。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
SpatialBench榜单显示,Qwen3-VL-235B与Qwen2.5-VL-72B分别取得了13.5和12.9分的优异成绩,显著领先于Gemini 3.0 Pro Preview(9.6分)、GPT-5.1(7.5分)及Claude Sonnet 4.5等海外头部模型。

不过需要指出的是,AI大模型的整体表现与人类水平仍存在差距。人类基准线约为80分,能够专业处理电路分析、CAD工程和分子生物学等复杂空间推理任务,而目前大模型还无法完全自动化完成此类工作。
据了解,Qwen2.5-VL于2024年开源,Qwen3-VL则是阿里在2025年开源的新一代视觉理解模型。
Qwen3-VL在视觉感知和多模态推理方面实现了重大突破,在32项核心能力测评中超越Gemini 2.5 Pro和GPT-5。该模型不仅能调用截图、搜索等工具完成“带图推理”,还能通过一张设计草图或一段小游戏视频直接进行“视觉编程”。

与此同时,Qwen3-VL专门增强了3D检测能力,能够更准确地感知空间关系。基于该模型,机器人可以更好地判断物体方位、视角变化和遮挡关系,实现远处物体的精准抓取。
目前,Qwen3-VL已开源不同版本,包括2B、4B、8B、32B等密集型模型以及30B-A3B、235B-A22B等MoE模型,每个模型都提供指令版和推理版两款,是当下最受企业和开发者欢迎的开源视觉理解模型。同时,Qwen3-VL模型也已上线千问APP,用户可免费体验。
据悉,SpatialBench是近年来兴起的第三方空间推理基准测试榜单,主要聚焦多模态模型在空间、结构、路径等方面的综合推理能力,被AI社区视为衡量“具身智能”进展的新兴测试标准之一。
SpatialBench不仅测试模型已有的知识储备,还重点评估模型在二维和三维空间中感知和操控抽象概念的能力,这对具身智能的落地应用尤为关键。
相关攻略
距离上一次围绕 Token Hub 的集约调整不到一月,阿里有关AI业务的组织架构再度迎来迭代。 4月8日,阿里巴巴集团CEO吴泳铭的一封内部信,揭开了新一轮AI组织调整的序幕。核心动作包括新设立集团技术委员会,以及全面升级通义大模型事业部,目标直指加速AI能力建设。 根据这封内部信,阿里巴巴在集团
阿里 AI 战略,到底跑出了哪些成果?作者|张鹏编辑|Cynthia前几天,在巴塞罗那举行的 MWC 2026 上,阿里云向国际市场正式推出了企业级 Agentic AI 开发平台——百炼专属版。通
文 | 财能圈3月4日凌晨,阿里千问大模型核心负责人林俊旸在社交平台留下一句“me stepping down bye my beloved qwen”,便结束了自己在阿里巴巴六年的职业生涯。同一
3月4日凌晨,阿里千问模型负责人林俊旸突然宣布离职,引发业界广泛关注。据智能涌现报道,通义实验室紧急召开了All Hands会议,阿里集团CEO吴泳铭向千问员工坦诚表示了歉意。据报道,对于此次调整,
智东西作者 程茜编辑 漠影智东西1月30日报道,1月29日,阿里平头哥“真武810E”高端AI芯片上线正式,揭开了阿里隐藏已久的核心布局:由通义实验室、阿里云和平头哥组成的阿里巴巴AI黄金三角“通云
热门专题
热门推荐
本文详细介绍了如何更稳定地下载和使用HTXApp。首先,建议通过官方网站或主流应用商店获取安装包,避免第三方来源。其次,安装后需及时清理旧应用的残留缓存与数据,防止冲突。最后,合理设置通知权限并确保网络环境稳定,能有效提升App运行流畅度与安全性,保障交易信息及时接收。
北京时间5月8日凌晨0点,微软将举办一场名为“游戏开发更新”的春季特别直播活动。对于期待次世代硬件的玩家来说,本次发布会的最大看点,无疑是代号“Project Helix”的全新Xbox主机的更多核心信息将被正式公布。 届时,Xbox产品组合与专案总经理Chris Charla将携手次世代平台副总裁
寻找巨岩布利米尔的利刃,是许多冒险者旅程中的一项关键挑战。这把武器不仅威力不凡,其获取过程本身也像一场解谜。如果你还在为此困扰,下面的指引或许能帮你拨开迷雾。 首先,得锁定大致范围。巨岩布利米尔通常活跃在那些地势险峻、岩石嶙峋的区域。这类地方地形复杂,遍布着高耸的巨岩和蜿蜒崎岖的山道,算是它的“主场
想快速升级嘟嘟脸恶作剧?第一步,也是最重要的一步,就是吃透它的基础规则。你得清楚哪些情境能触发恶作剧,更要明白不同的操作如何影响经验值的获取。举个例子,在商场这类特定场景里,如果你能成功对5个陌生人使用恶作剧道具,系统就会直接奖励你一笔可观的经验值,推动等级提升。摸清这些“隐藏任务”,升级之路就成功
在游戏世界中,共鸣之心信物不仅是提升战力的关键装备,更是角色成长路上的战略伙伴。每一件信物都拥有独特的属性倾向与背景故事,能够深度改变角色的战斗风格与玩法策略。合理搭配与培养信物,是玩家从新手迈向高手的必经之路。 信物分类及核心特点 想要进行有效搭配,首先需要了解信物的主要类型。根据其核心加成方向,





