王晓刚:机器人泛化能力不足的两大关键原因解析
当前的人形机器人,普遍停留在"看似能用,实则不够聪明"的阶段,其中泛化能力不足是核心挑战。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
谈及这一问题,商汤联合创始人、执行董事、大晓机器人董事长王晓刚在博鳌亚洲论坛2026年年会现场向观察者网表示,主要原因有两个:一个是数据,一个是模型。
“之前是由人来操控真机,靠真机采集数据。这种采集数据的方式不对,”王晓刚说,这样的数据不仅不是在人类真实生产生活当中采集的,而且效率低。“过去几年总共积累10万小时的数据,和我们要达到千万小时的目标,差距非常大。”

王晓刚在博鳌亚洲论坛2026年年会发言博鳌亚洲论坛
为此,2025年,大晓机器人提出“环境式数据采集”,利用第一视角的眼镜、穿戴式设备,以及第三视角的传感器,在人真实的生产生活环境中去记录人的行为。
这样一来,“像保洁阿姨等工人就可以在工作过程当中自然地把这些数据采集下来,从而快速实现数据积累。如果有1000人携带这样的采集设备,一天就有1万小时的数据积累。”
王晓刚还提到,用机器采集的数据只限于机器本身,一旦换了个机器型号,又要重新进行数据采集。而“环境式采集”到的人的数据,能做到“一脑多形”,数据可以用在不同类型机器人的本体上。
至于模型,“以前的VLA模型与本体强相关,机器人收到命令之后,直接输出本体的参数。现在VLA只能完成像分拣货物、拿放水杯这样的简单任务。”王晓刚说,现在要用“世界模型”。
他解释道,世界模型可以让机器人在和世界交互的时候,更本质地理解物理规律是什么,人的行为逻辑是什么,更具通用性且能完成复杂任务。
他认为,未来,世界模型和VLA模型不一定非此即彼,二者可以协同。
“比如在机器人的‘大脑’上有两块GPU,一块是世界模型,当给到它复杂任务时,它会像生成剧本一样,规划出接下来怎么一步一步走。当到了某一个比较简单的具体任务时,VLA可以帮它执行。执行过程中如果发现眼前看到的情景和‘脑子’里想象的不一样,这时候它的世界模型又会重新启动,重新去规划和预测未来的剧本。”王晓刚说。
本文系观察者网独家稿件,未经授权,不得转载。
相关攻略
在新一轮人工智能浪潮中,全球人形机器人产业正经历从“技术验证”迈向“规模化商用部署”的新阶段。全球出货量第一、来自上海的人形机器人企业——智元机器人,今日正式下线第一万台通用具身机器人。这距离它实现
3月30日,智元机器人联合创始人、总裁兼CTO彭志辉宣布,智元第10000台通用具身机器人远征A3已于3月28日正式下线。这一里程碑式的跨越,标志着智元机器人的本体生产能力和智能进化能力同步进入加速
北京商报讯(记者 和岳)有做咖啡的,有串糖葫芦的,有送餐的,机器人餐吧成为本科中关村论坛打卡网红场景。2026年3月25日—29 日,在2026中关村论坛年会期间,由智源研究院主导打造的跨本体多机协
当前的人形机器人,普遍停留在 "看似能用,实则不够聪明 "的阶段,其中泛化能力不足是核心挑战。 谈及这一问题,商汤联合创始人、执行董事、大晓机器人董事长王晓刚在博鳌亚洲论坛2026年年会现场向观察者网
3月13日,证券时报记者从大晓机器人获悉,该公司已开源开悟世界模型3 0(Kairos 3 0)-4B系列具身原生世界模型。Kairos 3 0-4B是全球首个可端侧驱动具身智能本体控制的世界模型,
热门专题
热门推荐
本文介绍了2026年主流的USDT交易软件,重点分析了币安、欧易和火币三大平台的特点与优势。内容涵盖平台安全性、交易功能、用户体验及费用结构,旨在为不同需求的用户提供选择参考。文中强调选择平台时应综合考虑资产安全、操作便捷性和交易成本,并提醒注意风险管理与合规操作。
本文介绍了USDT交易的基本概念与主流平台选择。USDT作为稳定币,其交易主要通过加密货币交易所进行。选择平台时需综合考虑安全性、流动性、手续费和用户体验。文中列举了当前市场认可度较高的几类交易平台,并提醒用户注意资产安全与合规操作,建议根据自身需求谨慎选择。
哥本哈根大学计算机科学系于2026年3月发布了一项具有里程碑意义的研究(论文编号arXiv:2603 12935v1),揭示了当前主流AI推荐系统可能潜藏的社会偏见风险。这项研究同时指出,一种高效且低成本的解决方案——提示工程,或许能成为破解这一难题的关键。 当您使用求职平台或新闻资讯应用时,背后的
照片模糊了、雨滴遮挡了画面、夜晚拍摄噪点过多……这些常见的图像质量问题,往往让人束手无策。传统的解决方案,就像请来一群专科医生:去模糊、去噪点、去雨滴,各有各的专长,但每个“医生”都需要海量的“临床经验”——动辄数百万张训练图片,才能达到可用的修复水平。 然而,一项由香港科技大学、哈尔滨工业大学深圳
这项由英属哥伦比亚大学(UBC)与Vector人工智能研究院联合主导的前沿研究,于2026年3月以预印本论文(arXiv:2603 12634v1)形式发布。研究团队创新性地提出了“预算感知价值树搜索”(Budget-Aware Value Tree Search,简称BA VT)框架,旨在攻克一个





