游乐游手机版
首页/科技数码/文章详情

VLA模型遇瓶颈,机器人技术如何开辟新道路?

时间:2025-12-23 09:13
商汤科技联合创始人、执行董事、大晓机器人董事长王晓刚具身智能一直仰仗的VLA技术线路,在实际开发过程中正在面临越来越多的挑战。所谓VLA模型,即视觉-语言-动作模型。它的技术逻辑可以简单描述为,将人

1

商汤科技联合创始人、执行董事、大晓机器人董事长王晓刚

一直备受期待的具身智能VLA技术路线,在实际开发进程中正遭遇着越来越多的挑战。

所谓VLA模型,即视觉-语言-动作模型。它的技术逻辑可以简单概括为,将人类指令和外界多模态信息(声音、图像、视频)转化为计算机语言,进而控制机器人行为。

但在VLA模型的训练中,互联网上的静态、非结构化文本和图像数据,并非训练所需的核心数据。训练VLA模型真正需要的具身智能数据,是连续的、动态的、三维甚至四维的时空轨迹流。而物理世界数据的稀缺性与复杂性,成为了制约VLA模型能力跃升的主要瓶颈。

“具身智能的大脑,靠读文章、看图片永远不可能理解真实的物理世界。”

商汤科技联合创始人、执行董事、大晓机器人董事长王晓刚对笔者表示,AI的研究范式,要从以机器为中心转变成以人为中心,通过采集人类的真实行为数据,学习真实的物理规律,去训练具身智能的世界模型。

“以人为中心”的ACE范式

12月18日,基于“以人为中心”的研究路径,大晓机器人推出了ACE具身研发范式。

具体来讲,ACE范式就是以人类与物理世界的互动规律作为研究起点,以环视式数据采集为引擎,构建了一套从“环视式数据采集—开悟世界模型3.0—具身交互”的技术体系。

在环视式数据采集中,通过整合第一视角与第三视角视频、力触觉信息、运动轨迹、语音等多模态数据,构建基于物理基础的3D资产库。

在数据处理环节,通过时序一致性对齐、交互动态轨迹预测建模与物理正确性仿真校正,将采集到的“人—物—场”信息转化为可直接用于模型训练的动态场景数据。

1

同时,以环视式采集数据为基础,大晓机器人发布了首个开源且商业化应用的世界模型——开悟世界模型3.0,形成跨本体的统一世界理解框架,融合物理规律、人类行为和真机动作,使机器不仅能“理解”物理世界因果规律,还能“生成”长时动静交互场景。

“在跟物理世界的交互过程中产生智能,这也是世界模型存在的价值。”

王晓刚对笔者表示,至于模型能否覆盖更多的场景以及人类的更多动作,这则是大晓机器人的目标。实现这一切核心的关键是,ACE范式能否实现更大范围的快速扩展,让更多的厂商和开发者使用这种方式采集数据,产生回流。

模型开源,行业共建

为了让ACE范式实现更大范围内的适用,大晓机器人宣布“开悟世界模型3.0”面向全行业开源。

据介绍,开悟具身智能世界模型产品平台集成了多模态生成能力,内置支持11大类、54细类,累积328个标签,覆盖115个垂类具身场景,开发者只需输入简单指令,就能快速生成可视化的任务模拟内容,以此降低具身智能的开发门槛。

在具身本体领域,大晓机器人已携手智元机器人、银河通用、钛虎机器人、国地中心等多家具身智能企业,打通ACE技术范式、世界模型与机器人硬件的适配链路,共同打造适用于不同场景的解决方案。

在算力侧,开悟世界模型3.0则与沐曦、壁仞科技、中科曙光、辉羲智能、影微创新等多款国产厂商芯片完成适配。

硬件领域,大晓机器人与Insta360、卧龙电驱、帕西尼等深度绑定,依托硬件厂商的感知等各类硬件,强化世界模型、模组产品对多视角、动态场景的信息采集能力。

而在具身智能产品的落地节奏上,王晓刚则认为:

短期内,以具备自主导航能力的四足机器狗为主,在安防、巡检等B端场景快速推广;中期,机器人会聚焦前置仓、闪购仓等物流场景,解决人力密集型作业痛点;长期来看,机器人将探索家庭场景,但需解决安全性、责任界定等复杂问题。

“从明年开始,国内将出现大量前置仓与闪购仓,这类场景需要大量人力支持7×24小时服务,而机器人的加入不仅能提升生产效率,还具备较强的可复制性,能够充分发挥其在这类环境中的优势。”

王晓刚表示,“以人为中心”的ACE范式,大方向是正确的,特斯拉、Figure AI等企业,也在朝着这个方向转变。“这个赛道还没到收敛阶段,仍在不断涌现新的机会点,接下来的一到两年会是非常关键的时期。”(作者 | 科技潜行,文 | 饶翔宇 编辑 | 钟毅)

来源:https://www.tmtpost.com/7817374.html
上一篇海底捞小份菜单指南:单品3.8元起,这样点最划算 下一篇英伟达回应GPU定位技术传闻,澄清官方立场
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宫本茂亲签3DS XL拍卖价破两万美元
科技数码 · 2026-05-29

宫本茂亲签3DS XL拍卖价破两万美元

今天来说一件挺有意思的事:2015年任天堂世界锦标赛冠军约翰·戈德堡,近日将他当年夺冠时赢得的宫本茂亲笔签名版3DS XL掌机放上了拍卖平台。截至2026年5月29日,这台签名掌机的竞拍价已突破两万美元,并且价格还在持续攀升。戈德堡在社交媒体上发布声明表示,经过相当长时间的慎重考虑,他决定将这台对自

七彩虹隐星P16 Pro游戏本新配置仅售7799元
科技数码 · 2026-05-29

七彩虹隐星P16 Pro游戏本新配置仅售7799元

七彩虹近期推出隐星P16Pro游戏本新配置,售价7799元。其搭载酷睿i9-13900HX处理器与RTX5060显卡,配备16英寸2 5K高刷电竞屏及高效散热系统。存储组合为16GB内存与1TB固态硬盘,支持后续扩展。该配置主打高性能性价比,适合预算有限但追求强劲性能的游戏玩家与轻度创作者。

苹果iPhone Hikawa握把支架448元重新上架
科技数码 · 2026-05-29

苹果iPhone Hikawa握把支架448元重新上架

苹果公司重新上架了与艺术家贝利·桧川及PopSockets合作设计的iPhone专用握把支架。该配件采用磁吸设计,兼具握持与支架功能,旨在通过人性化设计降低握持负担,并提供三种配色可选,售价448元。

苹果体育应用扩展至170市场 为2026世界杯引入对阵图
科技数码 · 2026-05-29

苹果体育应用扩展至170市场 为2026世界杯引入对阵图

苹果体育应用新增覆盖90多个国家和地区,全球可用市场总数超过170个。为迎接2026年世界杯,应用加入了完整的赛程对阵图和可视化阵型卡片,方便用户追踪赛事与战术。同时,应用支持实时活动功能,可将比分固定在锁屏或表盘,并新增一键跳转至新闻的入口。目前该应用仍仅限iPhone用户使用。

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产
科技数码 · 2026-05-29

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产

据博主爆料,小米下一代自研玄戒芯片计划于今年6月正式进入量产阶段,此次将采用台积电3nm工艺。初代玄戒O1累计出货量已突破100万颗,量产验证十分扎实。新一代芯片的产能将显著提升,这意味着供货问题基本得到解决。 根据现有曝光信息,这颗迭代芯片极有可能命名为玄戒O3,首发搭载机型预计为小米MIX Fo