首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
阿里千问登顶全球冠军,超越Gemini3与GPT5.1推理能力

阿里千问登顶全球冠军,超越Gemini3与GPT5.1推理能力

热心网友
84
转载
2025-11-26

11月26日消息,今日空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL与Qwen2.5-VL强势占据冠亚军位置,超越了Gemini 3、GPT-5.1、Claude Sonnet 4.5等国际顶尖模型。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

SpatialBench榜单显示,Qwen3-VL-235B与Qwen2.5-VL-72B分别取得了13.5和12.9分的优异成绩,显著领先于Gemini 3.0 Pro Preview(9.6分)、GPT-5.1(7.5分)及Claude Sonnet 4.5等海外头部模型。

超越Gemini3、GPT5.1!阿里千问登顶空间推理全球冠军

不过需要指出的是,AI大模型的整体表现与人类水平仍存在差距。人类基准线约为80分,能够专业处理电路分析、CAD工程和分子生物学等复杂空间推理任务,而目前大模型还无法完全自动化完成此类工作。

据了解,Qwen2.5-VL于2024年开源,Qwen3-VL则是阿里在2025年开源的新一代视觉理解模型。

Qwen3-VL在视觉感知和多模态推理方面实现了重大突破,在32项核心能力测评中超越Gemini 2.5 Pro和GPT-5。该模型不仅能调用截图、搜索等工具完成“带图推理”,还能通过一张设计草图或一段小游戏视频直接进行“视觉编程”。

超越Gemini3、GPT5.1!阿里千问登顶空间推理全球冠军

与此同时,Qwen3-VL专门增强了3D检测能力,能够更准确地感知空间关系。基于该模型,机器人可以更好地判断物体方位、视角变化和遮挡关系,实现远处物体的精准抓取。

目前,Qwen3-VL已开源不同版本,包括2B、4B、8B、32B等密集型模型以及30B-A3B、235B-A22B等MoE模型,每个模型都提供指令版和推理版两款,是当下最受企业和开发者欢迎的开源视觉理解模型。同时,Qwen3-VL模型也已上线千问APP,用户可免费体验。

据悉,SpatialBench是近年来兴起的第三方空间推理基准测试榜单,主要聚焦多模态模型在空间、结构、路径等方面的综合推理能力,被AI社区视为衡量“具身智能”进展的新兴测试标准之一。

SpatialBench不仅测试模型已有的知识储备,还重点评估模型在二维和三维空间中感知和操控抽象概念的能力,这对具身智能的落地应用尤为关键。

来源:https://m.mydrivers.com/newsview/1088839.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

阿里AI战略解析:探路与修路同步,滚动融入产业未来
AI
阿里AI战略解析:探路与修路同步,滚动融入产业未来

阿里 AI 战略,到底跑出了哪些成果?作者|张鹏编辑|Cynthia前几天,在巴塞罗那举行的 MWC 2026 上,阿里云向国际市场正式推出了企业级 Agentic AI 开发平台——百炼专属版。通

热心网友
03.12
林俊杰告别千问,阿里AI转型背后的行业权衡
科技数码
林俊杰告别千问,阿里AI转型背后的行业权衡

文 | 财能圈3月4日凌晨,阿里千问大模型核心负责人林俊旸在社交平台留下一句“me stepping down bye my beloved qwen”,便结束了自己在阿里巴巴六年的职业生涯。同一

热心网友
03.05
吴泳铭紧急开会致歉:阿里AI团队调整是扩张非收缩
科技数码
吴泳铭紧急开会致歉:阿里AI团队调整是扩张非收缩

3月4日凌晨,阿里千问模型负责人林俊旸突然宣布离职,引发业界广泛关注。据智能涌现报道,通义实验室紧急召开了All Hands会议,阿里集团CEO吴泳铭向千问员工坦诚表示了歉意。据报道,对于此次调整,

热心网友
03.04
揭秘阿里“通义”AI黄金三角:谁是国产AI最强底牌?
AI
揭秘阿里“通义”AI黄金三角:谁是国产AI最强底牌?

智东西作者 程茜编辑 漠影智东西1月30日报道,1月29日,阿里平头哥“真武810E”高端AI芯片上线正式,揭开了阿里隐藏已久的核心布局:由通义实验室、阿里云和平头哥组成的阿里巴巴AI黄金三角“通云

热心网友
01.30
阿里AI直连购物车:商业履约如何超越谷歌与OpenAI
科技数码
阿里AI直连购物车:商业履约如何超越谷歌与OpenAI

文 熊逾格编辑 子夜2026年1月15日,阿里千问App进行了上线以来最大规模的版本更新,全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,在全球首次实现点外卖、买东西、订机票等AI购物功能

热心网友
01.16

最新APP

恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26

热门推荐

苹果或牵手长江存储:国产闪存芯片替代三星SK海力士
网络安全
苹果或牵手长江存储:国产闪存芯片替代三星SK海力士

3月29日消息,据行业爆料,苹果计划在面向中国市场销售的iPhone机型中,搭载长江存储的NAND闪存芯片,以此破解当前存储芯片涨价带来的盈利困境。自去年下半年起,全球内存与存储芯片进入涨价周期,手

热心网友
03.29
为取代三星SK海力士 苹果或将牵手长江存储
iphone
为取代三星SK海力士 苹果或将牵手长江存储

3月29日消息,据行业爆料,苹果计划在面向中国市场销售的iPhone机型中,搭载长江存储的NAND闪存芯片,以此破解当前存储芯片涨价带来的盈利困境。自去年下半年起,全球内存与存储芯片进入涨价周期,手

热心网友
03.29
剪映素材包取消教程:3步教你删除不需要的附加素材
电脑教程
剪映素材包取消教程:3步教你删除不需要的附加素材

近年来,手机短视频迅速走红,已深度渗透进大众的日常生活中,成为人们表达自我、记录生活的重要方式。在欣赏他人精良制作的短视频之余,越来越多用户也开始尝试用手机拍摄并剪辑属于自己的原创

热心网友
03.29
360极速浏览器下载故障?三步轻松修复文件无法下载
手机教程
360极速浏览器下载故障?三步轻松修复文件无法下载

在使用 360 极速浏览器时,有时会遇到无法下载文件的情况,这确实会给我们带来一些困扰。别着急,下面就为您介绍几种常见的解决方法。检查网络连接首先,确保您的设备已成功连接到稳定的网

热心网友
03.29
小米智驾显威力,130km/h成功紧急避让防止追尾
编程语言
小米智驾显威力,130km/h成功紧急避让防止追尾

3月29日消息,日前,一位小米YU7车主发视频称,感谢小米汽车救了自己一命。车主表示,当时自己在高速上打开了辅助驾驶,车速设置在130km h。期间,他驾车分心了没看路,前方出现了三角警示牌也没有注

热心网友
03.29