游乐游手机版
首页/业界动态/文章详情

阿里发布首个具身大模型Qwen-Robot系列 三模型协同

时间:2026-06-22 13:24
先说几个核心判断。2025年6月16日,阿里巴巴正式推出千问具身智能大模型Qwen-Robot系列,该系列包含三大核心模型:VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav以及世界模型Qwen-RobotWorld。这是千问大模型家族首次完整发布具身智能模型矩阵

先说几个核心判断。2025年6月16日,阿里巴巴正式推出千问具身智能大模型Qwen-Robot系列,该系列包含三大核心模型:VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav以及世界模型Qwen-RobotWorld。

这是千问大模型家族首次完整发布具身智能模型矩阵——三个模型分别赋予机器人操作能力、导航能力和环境认知能力,既可独立部署,也能协同运转,为不同形态的机器人走进实际场景提供了统一的“通用底座”。

当前全球具身智能正处从实验室迈向商业化的关键节点,核心难题在于:机器人在未知环境中能否理解自然语言指令并稳定执行任务?

阿里发布首个具身大模型Qwen-Robot系列:三个模型支持协同运转

Qwen-Robot系列通过三大模型的协同设计,使系统能够理解语言、感知三维环境、掌握物理规律,从而指挥机器人在真实世界中自主完成复杂操作与精准移动,甚至泛化到从未见过的任务。

VLA(视觉-语言-动作)模型是具身智能的核心基础架构之一,融合视觉感知、语言理解与动作决策,让机器人能看懂指令并执行操作。传统VLA模型的主要痛点是迁移能力不足——更换机器人平台或应用场景后性能明显下降。

要让不同形态的机器人统一听懂同一个模型,必须解决动作表征与空间感知的统一问题。Qwen-RobotManip正是从这两点切入解决。

一方面,它采用一套80维的统一动作表征,为不同硬件定义了通用的“肢体语言”,使机器人学会基础物理规律与动作逻辑,动作不再停留于简单的模仿。另一方面,它摒弃了繁琐的绝对坐标计算,直接基于摄像头画面中的相对位置进行操作,面对环境变化时反应更快更准。搭载于不同硬件平台后,Qwen-RobotManip仅需少量交互反馈即可自动适配,性能稳定高效——这就像经验丰富的司机坐进陌生车辆,稍试脚感便能上路。

在训练层面,Qwen-RobotManip完成了超过38000小时的语料预训练。有意思的是,该模型全程仅基于开源数据训练,打破了行业高度依赖私有采集数据的常规路径,却依然取得了不俗表现。

在横跨30项真实任务、4个机器人平台的三方真机测评RoboChallenge Table30 v1中,代号为“Lira”和“Atlas”的两个Qwen-RobotManip版本包揽前两名。任务涵盖拧水龙头、插网线、双臂倒薯条等,评测方给出的评价是:“基础任务稳定,高难任务可突破。”

如果说VLA模型赋予机器人动手能力,那么VLN(视觉-语言-导航)模型则让机器人具备认路与移动能力。Qwen-RobotNav基于Qwen-VL构建,将语言指令导航、目标搜索、自动驾驶等五大导航任务统一至同一框架,面对复合任务无需人工切换模型。

针对传统VLN模型因记忆策略僵化而出现的“记少则迷路、记多则混乱”问题,Qwen-RobotNav创新推出了任务自适应观察机制,能根据任务需求灵活切换记忆策略。同时,该模型被设计为通用接口,可被上层系统调用,是业内少数原生支持多种智能体框架的VLN模型。它使机器人实现“边走、边看、边规划最优路径”,并将导航能力从孤立模块升级为可供统一调用的工具,为完整的具身智能系统提供了关键一环。

阿里发布首个具身大模型Qwen-Robot系列:三个模型支持协同运转

以搭载该系统的宇树Go2四足机器人为例,当指令为“帮我找找不知道放在哪里的行李箱”时,机器人可自主巡逻并结合视觉推理,最终顺畅完成寻物导航任务。

会动手、能跑腿,还得“想得深”。正如体操运动员在脑海中反复预演动作,机器人也需要具备对物理世界的推演能力,这依托于具身智能领域的世界模型。Qwen-RobotWorld是千问在此方向的最新探索——基于对物理规律的建模,可推演并模拟机器人下一时刻的合理动作与状态,让机器人在现实世界中按图索骥地执行任务。

在实际应用中,Qwen-RobotWorld不仅能生成视频数据用于模型训练,有效缓解训练数据不足的问题,还可在动作执行前帮助机器人预演未来轨迹,使操作更加精准可靠。

来源:https://m.mydrivers.com/newsview/1129986.html
上一篇租房党随身WiFi选购指南飞猫靠谱机型实测推荐 下一篇直面监管追问,清华百度系自动驾驶卡车再冲港股
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年6月大学生轻薄本购机指南:五款主流机型深度解析
业界动态 · 2026-06-24

年6月大学生轻薄本购机指南:五款主流机型深度解析

针对2026年6月大学生轻薄本选购需求,从性能、屏幕、便携、续航及售后等维度深度解析五款主流机型。Dell16Plus均衡实用,Dell14S便携高效,Dell16S适合设计编程,Inspiron灵越16Plus性价比突出,新XPS14追求高端工艺。建议按使用场景理性选择。

二零二六大学生笔记本推荐轻薄办公剪辑速通指南
业界动态 · 2026-06-24

二零二六大学生笔记本推荐轻薄办公剪辑速通指南

面向2026年大学生,从AI算力、屏幕、内存续航及售后等维度提供选购指南,重点推荐Dell14S、16S、16Plus及灵越16Plus,覆盖轻薄办公、视频剪辑与专业创作场景,附日常养护建议。

朗镜科技自研POSM多模态大模型,成短期活动救星
业界动态 · 2026-06-24

朗镜科技自研POSM多模态大模型,成短期活动救星

朗镜科技自研POSM多模态视觉大模型,针对短期高频活动提供快速识别方案。仅需少量示例图即可当天上线,平均识别准确率超过85%,无需重新训练,有效解决传统识别周期错配问题。

大学生笔记本电脑轻薄性能体验推荐
业界动态 · 2026-06-24

大学生笔记本电脑轻薄性能体验推荐

2026年大学生选购笔记本电脑应注重便携性与专业适配,避免盲目追求高配。戴尔多款轻薄本覆盖不同需求:Dell14S、新XPS14适合文科专业,Inspiron灵越16Plus性价比高;创作场景可选Dell16Plus、Dell16S及新XPS16。建议选带NPU的酷睿Ultra处理器、16GB以上内存、1TB固态,并关注防蓝光屏幕与售后保障。

离散制造数智化转型:安徽长三角MES服务商实力解析
业界动态 · 2026-06-24

离散制造数智化转型:安徽长三角MES服务商实力解析

在中国制造业从自动化向智能化转型的关键期,安徽及长三角地区离散制造企业面临软硬件信息孤岛问题。盘点四家代表性MES服务商,其中中之杰智能以软硬一体化“工厂神经中枢”方案,实现物动单动与智能闭环,已服务近万家离散制造企业,助力企业提升效率与质量。