游乐游手机版
首页/科技数码/文章详情

具身智能公司自变量发布全球首个世界统一模型WALL-B

时间:2026-04-22 14:28
具身智能公司自变量发布全球首个世界统一模型WALL-B 4月21日,具身智能领域传来一个重磅消息:自变量公司正式发布了世界统一模型WALL-B。更关键的是,发布会现场宣布,仅仅35天后,搭载这一全新模型的新一代机器人,就将首批入驻真实的家庭环境。 从家庭日常的“混乱”说起 发布会开场,创始人兼CEO

具身智能公司自变量发布全球首个世界统一模型WALL-B

具身智能公司自变量发布全球首个世界统一模型WALL-B

4月21日,具身智能领域传来一个重磅消息:自变量公司正式发布了世界统一模型WALL-B。更关键的是,发布会现场宣布,仅仅35天后,搭载这一全新模型的新一代机器人,就将首批入驻真实的家庭环境。

从家庭日常的“混乱”说起

发布会开场,创始人兼CEO王潜描绘了一个再熟悉不过的场景:“拖鞋不知踢到哪里,厨房的碗还没洗,孩子的书包扔在地上,猫打翻了一杯水。”这看似琐碎的日常,恰恰揭示了家庭环境的随机性与碎片化本质。目前,全球范围内还没有任何一台机器人,能在无需遥控操作的情况下,独立完成这类综合整理任务。正因如此,让机器人真正走进家庭,被普遍认为是这个时代最具挑战性的技术难题之一。

回顾自变量的技术路径:2024年底,公司发布了基于VLA架构的第一代具身基础模型WALL-A,随后又开源了其轻量化版本WALL-OSS。在应用层面,他们与58同城合作,将搭载WALL-AS模型的机器人送入真实家庭,与保洁阿姨协同作业,实现了机器人在C端复杂环境中的首次大规模落地。

然而,正是这些宝贵的真实部署经验,让团队清晰地看到了VLA架构的“天花板”。联合创始人兼CTO王昊解释道,VLA架构的本质,是将视觉、语言、动作三个模块独立设计。数据每经过一次模块边界,就会产生信息损耗和延迟,导致模型只能机械地模仿轨迹,而无法真正理解物理世界的运行规律。

今天发布的WALL-B,正是对这一根本困局的回应。需要明确的是,它并非WALL-A的简单升级版,而是一次从底层架构到训练范式的全面重写。

从“VLA”到“统一整体”

WALL-B之所以引人注目,其核心在于一场架构革命:从传统的VLA走向了世界统一模型。

在机器人领域,VLA架构的困境日益凸显。视觉、语言、动作模块各自为政,数据在它们之间“搬运”所产生的延迟和损耗,成了性能提升的瓶颈。一个典型的后果是:视觉模块学到的丰富信息,传到动作模块时,往往只剩下一个模糊的“摘要”。

WALL-B采用的WUM架构,彻底打破了这种隔阂。它将视觉、语言、动作乃至物理预测等多种能力,置于同一个神经网络中从零开始训练,从根本上消除了模块间的边界和数据搬运损耗。

据王昊介绍,这一架构赋予了WALL-B三个关键的技术特点,使其能更好地适应复杂的家庭场景:

第一,原生多模态。 模型不再需要像“传话”一样在不同模块间转译信息。例如,看到杯子的瞬间,就能同步规划伸手的动作,反应更为直接和高效。

第二,具备物理世界“世界观”。 模型能够感知并预测重力、惯性、摩擦力、速度等基本物理规律。这意味着,它可以利用对物理常识的理解来应对从未见过的新场景,而无需针对每一个不同的家庭进行重新训练。

第三,能与世界交互并自我进化。 这是一种让模型在真实环境中完成自我迭代的机制。它无需工程师重新训练,无需人工注入新数据,也无需返回实验室。王昊将其类比为人类学习使用筷子的过程:筷子掉落了无数次,但每一次失败都在微调手上的控制,最终形成稳定技能。WALL-B克服了Transformer架构难以进行长期内化记忆的难题,所有经验都以原生多模态记忆的方式,通过类似人脑的机制实现自我更新。

从“糖水”到“牛奶”

训练数据的质量,直接决定了模型的“实战”能力。目前,行业内大多数模型依赖的是在固定、无干扰的实验室环境中采集的数据。王昊形象地将这类数据比喻为“糖水数据”——纯净但脱离现实,在真实复杂环境中会迅速失效。

与之相对,自变量团队将进入数百个志愿者真实家庭所采集的数据,称为“牛奶数据”。这类数据“嘈杂”、多变、充满随机性,却富含现实世界的“营养”。自变量的策略是,用实验数据打底,用真实场景数据提质,让模型学会在不确定的环境中“生存”。可以说,由真实、随机、不可预测的现实数据所驱动的数据飞轮,才是构建长期壁垒的关键。

在商业化落地方面,自变量的时间表非常明确。35天后,搭载WALL-B并针对家居环境进行了硬件升级的新一代机器人,将正式入驻首批用户的家庭。针对公众尤为关注的隐私问题,自变量团队也给出了明确承诺:机器视觉进行脱敏处理、需用户主动授权、数据用途限定且不共享给第三方。

王潜坦言,当前的模型仍处于“实习生”阶段,会犯错,也需要远程协助。但其优势在于能够实现24小时不间断工作,并且每工作一天,都会因为新数据的产生而变得更“聪明”。

发布会最后宣布,即日起,自变量正式开启“首进家庭机器人”的用户招募,感兴趣的家庭可通过官方最新渠道提交申请。

来源:https://www.163.com/dy/article/KR47I0IT0531SC48.html
上一篇三星 Galaxy A57/A37 手机壳渲染图曝光 下一篇阿里巴巴发布千问AI数字人形象“千问小酒窝”
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
多点触控技术实际应用案例分享
科技数码 · 2026-06-30

多点触控技术实际应用案例分享

多点触控技术借助电容或光学感应实现多指同时识别,重塑了移动设备交互、创意设计、教育协作及零售公共服务等场景,未来将与增强现实、智能家居等技术深度融合,使人机交互更自然高效。

MultiTouch多点触控全面教程指南:从入门到实际使用
科技数码 · 2026-06-30

MultiTouch多点触控全面教程指南:从入门到实际使用

多点触控技术使屏幕同时识别多指操作,涉及传感、坐标追踪和手势识别。基础手势如双指缩放、旋转及多指滑动提升效率。在创意软件中实现画布控制与参数调节,游戏带来沉浸式操控。保持屏幕清洁、用指腹触碰可优化体验。

Lily Camera无人机空中拍摄真实应用案例与心得分享
科技数码 · 2026-06-30

Lily Camera无人机空中拍摄真实应用案例与心得分享

LilyCamera是一款无需遥控器的抛飞式自拍无人机,通过视觉与GPS追踪实现自动跟拍,瞄准运动与旅行场景。但因技术、供应链和资金问题未能量产。其概念推动了行业跟拍功能发展,强调用户体验简化与工程务实的平衡。

Lily相机使用中常见问题解决方法
科技数码 · 2026-06-30

Lily相机使用中常见问题解决方法

使用中遇到开不了机、连不上或画质模糊等问题,可先充满电、重启设备、检查镜头及App版本。续航下降可调整高耗电设置,充不进电需用原装配件并清理接口。定期更新固件与应用能解决多数故障,官方支持与用户论坛可获取进一步帮助。

Lily Camera从入门到实际使用的完整详细教程指南
科技数码 · 2026-06-30

Lily Camera从入门到实际使用的完整详细教程指南

LilyCamera是一款抛飞即用的自动跟拍相机,通过计算机视觉与GPS追踪技术,配合腕带追踪器实现无需遥控器的极简操作。其理念影响了后续消费级无人机和运动相机的视觉跟踪系统发展。适用于跑步、骑行等动态场景,充分体现了对用户使用场景的深刻洞察。