智元机器人2026发力算法数据,深度布局世界模型机遇
世界模型已成为具身智能与智能驾驶的关注焦点。近期,Momenta CEO曹旭东宣布,Momenta R7强化学习世界模型即将推出,并将全球首发搭载于上汽大众全新旗舰车型。 本月初,前 Meta 首席 AI 科学家杨立昆创立的AMI Labs,宣布完成10.3亿美元融资,约合人民币70.8亿元。该公司同样聚焦世界模型领域。
继首届赛事成功举办后,近期,智元启动了今年的机器人赛事AGIBOT WORLD CHALLENGE @ ICRA,该赛事依托机器人学术与产业盛会ICRA,聚焦Reasoning to Action(推理-操作)和World Model(世界模型)两大赛道,前者包括线上仿真与线下真机两个阶段,后者则聚焦具身智能中的生成与预测能力,采用线上竞赛方式。据悉,该赛事总奖池高达53万美元,冠军单项奖金1万美元。

图片来源:智元最新微信公众号
3月25日,Genie业务部生态及解决方案总监沈咏剑在一场线上沟通会中向南都N视频记者表示,今年以来,世界模型在多模态大模型和具身智能领域爆火,这背后代表着业界对数据驱动这件事情新的认知。智元在赛事中持续布局这一赛道,希望从不同维度的技术路线将具身智能的研究向前推进。
长期以来,业界针对VLA(Vision-Language-Action,视觉-语言-行动)和世界模型路线的相关争议不断。
在VLA路线中,机器人需要靠海量“画面—指令—动作”学习特定的技能、需要机器人看不同的案例和数据,数据越多完成的任务越多,但当机器人从叠衣服动作换到倒水动作又得重新掌握技能,否则成功率会下降。在数据量上,走VLA路线可能存在的瓶颈是需要人工遥控机器人来采集数据,从采集成功率、耗费的人力物力来看,这一路线目前仍存在规模化瓶颈;而在世界模型路线中,机器人大脑需要做到的是掌握物理世界的运行规律,并把这套规律转换成不同的行动指令,这样机器人可以更快学会物理世界中的不同任务和适应新环境,也降低了对数据的依赖。
沈咏剑认为,目前世界模型仍在发展中,不管是在多模态、大语言模型领域,还是在具身智能领域,连定义都还不是很收敛。但世界模型关涉的还是对未来的预测和推演。通过“看到”现有所有模态的数据,去推演下一个时刻可能会发生什么,或者在给定指令下,判断下一步自身与环境会发生什么变化,它更像预先知道或设想未来情况,再做相应任务执行。
沈咏剑还提到,尽管从范式上来看,世界模型是相对独立的技术路线,但他认为VLA模型和世界模型并不存在相互替代的关系,更像是两种不同的解题思路。“长期来看,这两种思路会不会结合起来更合适?所以,我觉得两者不算替代和被替代的关系,更多是大家在研究这类问题时,出于不同的起点去做研究。在解决问题的层面,有可能会有一些融合或合作的状态。所以技术路线层面,基本没有所谓的代际替代或谁先谁后的关系。”
关于世界模型,沈咏剑透露智元内部已有完整布局。目前智元内部有很多科学家和工程师在这个方向上做技术探索。“从重要程度来讲,我觉得它的重要性不逊于之前我们讲的VLA或相关路线。我们发力的核心点,是做一个真正意义上、在物理智能领域能非常自洽、能达到较好效果的世界模型。为了做这样的世界模型,我们也会做非常多的真实真机数据,因为这是做世界模型很好的养料。所以我们今年一方面会在算法侧加大投入,另一方面也会在数据侧积累上一两个量级的数据量,让我们的世界模型达到更好的能力效果。”
在机器人领域,布局世界模型的企业也不在少数。去年9月,宇树科技开源旗下跨多类机器人本体的开源世界模型;去年10月,北京人形机器人创新中心开源了全新的世界模型架构;去年12月,商汤科技联合创始人王晓刚创立的大晓机器人发布了“开悟”世界模型3.0。
采写:南都N视频记者 林文琪
相关攻略
智元官宣加入Hitch Open AI自主决策乒乓挑战赛,开启具身智能国际竞技新篇章 在2026智元全球合作伙伴大会的主会场上,一场汇聚了34个国家与地区、2500位合作伙伴的行业盛事,迎来了一个关键节点。智元正式官宣,加入Hitch Open AI自主决策乒乓挑战赛(简称HOPE),并成为该赛事的
2026 年 4 月 17 日,上海张江科学会堂。 上午九点半,APC2026 智元合作伙伴大会准时开幕。现场汇聚了来自全球 34 个国家和地区的 2500 名合作伙伴。会场内弥漫着一种混合了期待与审视的氛围——在行业经历了三年的概念热潮与技术演示后,人们更渴望听到关于“商业化落地”与“真实价值”的
3月30日,智元机器人第1万台通用具身机器人远征A3正式下线。智元机器人联合创始人、总裁兼CTO彭志辉表示,具身智能的“ChatGPT时刻”已近在眼前,下一个十万台目标有望在明年实现。原标题:《视频
智元(AGIBOT)今天迎来了两位国际重磅嘉宾的到访——2025年诺贝尔经济学奖得主、著名经济史学家Joel Mokyr教授,与卡塔尔王室核心成员、全球艺术及投资领域领袖玛雅莎公主(Sheikha
封面新闻记者 欧阳宏宇“对于人形机器人而言,规模化本身,便是最难攻克的技术课题之一。”3月30日,智元机器人联合创始人、总裁兼CTO彭志辉宣布,智元第10000台通用具身机器人远征A3已于3月28日
热门专题
热门推荐
《Zero Parades: For Dead Spies》的媒体评测已经解禁,结果相当亮眼。这款被许多人视为《极乐迪斯科》精神续作的作品,在OpenCritic上拿到了86分的媒体均分,在Metacritic上也有83分。游戏将于5月21日正式登陆PC平台,看来2026年的必玩叙事RPG名单上,又
目录 你是否也遇到过这些问题 处理效果 前置准备 超简单AI自动化解决方案 第1步:准备好你的原始数据 第2步:针对指定的文件下达指令 第3步:验收 还能解决这些同类问题 指令为什么这么有用? 更多场景直接抄作业 销售数据三级汇总 成本数据多级汇总 库存数据汇总 员工薪资汇总 常见问题答疑 核心价值
AI Agent 的发展,正迎来一个关键的转折点,从概念验证迈向真正的生产力交付。 想象一下,当一个 AI 智能体能够在无需人工介入的情况下,独立完成一个复杂项目的全流程,并将成功经验固化为可随时调用的“技能”——这是否标志着 AI 在职场中的角色,已经从辅助工具演变为自主的生产力单元? 随着 Op
彭博社的马克・古尔曼在最新报道中透露了一个有趣的发现:苹果为WWDC 26发布的宣传海报,其设计细节可能暗藏玄机,指向了即将在iOS 27中亮相的全新Siri交互界面。 根据古尔曼的分析,新版Siri的核心变化在于与灵动岛的深度融合。唤醒时,它将不再以传统的全屏或底部卡片形式出现,而是会以一个扩展的
GitHub 的 Star 数量还值得信赖吗?真相可能比你想象的更严峻。 开源社区中“购买 Star”的现象早已不是秘密,其便捷程度甚至超过点外卖,单价低廉且支持批量折扣。然而,卡内基梅隆大学(CMU)一项被 ICSE 2026 顶会收录的最新研究,首次系统性地揭示了这场“造假生意”的惊人规模:Gi





