首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
VLA模型遇瓶颈,机器人技术如何开辟新道路?

VLA模型遇瓶颈,机器人技术如何开辟新道路?

热心网友
27
转载
2025-12-23

1

商汤科技联合创始人、执行董事、大晓机器人董事长王晓刚

一直备受期待的具身智能VLA技术路线,在实际开发进程中正遭遇着越来越多的挑战。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

所谓VLA模型,即视觉-语言-动作模型。它的技术逻辑可以简单概括为,将人类指令和外界多模态信息(声音、图像、视频)转化为计算机语言,进而控制机器人行为。

但在VLA模型的训练中,互联网上的静态、非结构化文本和图像数据,并非训练所需的核心数据。训练VLA模型真正需要的具身智能数据,是连续的、动态的、三维甚至四维的时空轨迹流。而物理世界数据的稀缺性与复杂性,成为了制约VLA模型能力跃升的主要瓶颈。

“具身智能的大脑,靠读文章、看图片永远不可能理解真实的物理世界。”

商汤科技联合创始人、执行董事、大晓机器人董事长王晓刚对笔者表示,AI的研究范式,要从以机器为中心转变成以人为中心,通过采集人类的真实行为数据,学习真实的物理规律,去训练具身智能的世界模型。

“以人为中心”的ACE范式

12月18日,基于“以人为中心”的研究路径,大晓机器人推出了ACE具身研发范式。

具体来讲,ACE范式就是以人类与物理世界的互动规律作为研究起点,以环视式数据采集为引擎,构建了一套从“环视式数据采集—开悟世界模型3.0—具身交互”的技术体系。

在环视式数据采集中,通过整合第一视角与第三视角视频、力触觉信息、运动轨迹、语音等多模态数据,构建基于物理基础的3D资产库。

在数据处理环节,通过时序一致性对齐、交互动态轨迹预测建模与物理正确性仿真校正,将采集到的“人—物—场”信息转化为可直接用于模型训练的动态场景数据。

1

同时,以环视式采集数据为基础,大晓机器人发布了首个开源且商业化应用的世界模型——开悟世界模型3.0,形成跨本体的统一世界理解框架,融合物理规律、人类行为和真机动作,使机器不仅能“理解”物理世界因果规律,还能“生成”长时动静交互场景。

“在跟物理世界的交互过程中产生智能,这也是世界模型存在的价值。”

王晓刚对笔者表示,至于模型能否覆盖更多的场景以及人类的更多动作,这则是大晓机器人的目标。实现这一切核心的关键是,ACE范式能否实现更大范围的快速扩展,让更多的厂商和开发者使用这种方式采集数据,产生回流。

模型开源,行业共建

为了让ACE范式实现更大范围内的适用,大晓机器人宣布“开悟世界模型3.0”面向全行业开源。

据介绍,开悟具身智能世界模型产品平台集成了多模态生成能力,内置支持11大类、54细类,累积328个标签,覆盖115个垂类具身场景,开发者只需输入简单指令,就能快速生成可视化的任务模拟内容,以此降低具身智能的开发门槛。

在具身本体领域,大晓机器人已携手智元机器人、银河通用、钛虎机器人、国地中心等多家具身智能企业,打通ACE技术范式、世界模型与机器人硬件的适配链路,共同打造适用于不同场景的解决方案。

在算力侧,开悟世界模型3.0则与沐曦、壁仞科技、中科曙光、辉羲智能、影微创新等多款国产厂商芯片完成适配。

硬件领域,大晓机器人与Insta360、卧龙电驱、帕西尼等深度绑定,依托硬件厂商的感知等各类硬件,强化世界模型、模组产品对多视角、动态场景的信息采集能力。

而在具身智能产品的落地节奏上,王晓刚则认为:

短期内,以具备自主导航能力的四足机器狗为主,在安防、巡检等B端场景快速推广;中期,机器人会聚焦前置仓、闪购仓等物流场景,解决人力密集型作业痛点;长期来看,机器人将探索家庭场景,但需解决安全性、责任界定等复杂问题。

“从明年开始,国内将出现大量前置仓与闪购仓,这类场景需要大量人力支持7×24小时服务,而机器人的加入不仅能提升生产效率,还具备较强的可复制性,能够充分发挥其在这类环境中的优势。”

王晓刚表示,“以人为中心”的ACE范式,大方向是正确的,特斯拉、Figure AI等企业,也在朝着这个方向转变。“这个赛道还没到收敛阶段,仍在不断涌现新的机会点,接下来的一到两年会是非常关键的时期。”(作者 | 科技潜行,文 | 饶翔宇 编辑 | 钟毅)

来源:https://www.tmtpost.com/7817374.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查
web3.0
美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查

加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这

热心网友
04.08
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币
web3.0
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币

微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿

热心网友
04.08
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch
web3.0
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch

稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D

热心网友
04.08
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线
web3.0
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线

基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一

热心网友
04.08
PAAL代币如何参与治理?社区投票能决定哪些事项?
web3.0
PAAL代币如何参与治理?社区投票能决定哪些事项?

PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票

热心网友
04.08