自研模型对决:开源自变量的优势与性能解读

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
近日,全球首个大规模多任务的真机基准测试平台RoboChallenge榜单更新,前三名依次为pi0.5、WALL-OSS和pi0。
科普时间到,pi0.5、pi0是出自美国公司 Physical Intelliqence的操作大模型,WALL-OSS是出自中国自变量机器人的全自研开源操作大模型,不仅能完成操作,而且能同时生成复杂推理过程。
这一结果释放出强烈的信号。很长一段时间内,中国具身智能产业陷入“大脑缺位”的争议:我们有较强的本体结构设计和运控算法,但很难让机器人真正“用脑思考”,自主与物理世界交互,进而带来创造生产力的可能。但现在,中国具身智能模型已经与海外顶级模型同台共舞。
更有意思的是,自变量和pi高度默契地选择将模型开源。看似偶然的战略趋同,实则是具身智能产业发展到关键阶段的必然选择。

在RoboChallenge的最新测试中,自变量WALL-OSS展现了极强的竞技状态,总分位居第二,超越了明星模型pi0。在叠洗碗巾、按按钮、浇盆栽等多个任务中,WALL-OSS的得分摘得桂冠,排名第一。

先来划个重点。
RoboChallenge的测试或许更像是一场“开卷考试”,因为数十个桌面任务与场景都是预知的。这就相当于提前布置考题。
而WALL-OSS作为开源模型,某种程度上相当于明牌上场,其每一步操作都真实可见为模型驱动,更多的意义在于给出解题思路,“进一步展示模型的真实性能”。
与用闭源模型参与测评的“黑箱”,不知任务究竟如何完成不同,WALL-OSS作为开源模型,其一举一动相当于“明牌”炸场,换句话说其核心能力均可通过公开的代码和参数得到完整解释和复现,其在榜单上的成绩完全是模型真实能力的直接体现,是无法掺水,难以被“操作”的硬核实力证明。
从技术细节来看,WALL-OSS取得优异成绩的核心在于对“端到端”架构的深度重构:

它依托创新的混合专家(MoE)架构及“共享注意力+专家分流”设计,有效解决了视觉语言模型向具身模型迁移时的“灾难性遗忘”与“模态解耦”难题;
通过“先离散、后连续、再联合”的三阶段训练范式,消除了“认知与动作脱节”的痛点,使模型能精准掌控如浇盆栽时的动作力度;
此外,其内化的跨层级思维链推理能力,实现了高层决策与底层执行的无缝切换,使其在面对各类突发状况时,仍能精准控制关节完成复杂任务。
有个小插曲,WALL-OSS去年9月开源,与Physical Intelligence开源pi0.5相错一天,这也侧面说明了自变量的技术步调一直与国际头部具身大脑公司同频。而今天自变量与Physical Intelligence的模型又在榜单前排聚首,更说明自变量已经站稳了全球第一梯队。

开源之所以重要,在于生态建设,其价值最终体现在生态的繁荣之上。
自变量认为,在具身智能这一软硬件深度耦合的前沿领域,构建一个高质量的开源基础模型底座,是加速整个行业生态繁荣的坚实“地基”,也是实现机器人在物理世界大规模、稳定交互的关键。
当前,机器人模型的验证链路冗长,行业里专用小模型、通用大模型质量参差不齐,基础模型、专用模型、微调模型混杂,且缺乏统一的评价标准。开源是拨开迷雾、推动行业标准化和成熟化的必由之路。
在《硅谷101播客》中,自变量联合创始人兼CTO王昊曾说:“我一直都觉得开源是非常重要的事情,开源意味着我们可以站在巨人的肩膀上继续前进。我们可以基于已有成果做更多的改进,社区开发者的反馈也会帮助到开源的公司,开源公司可以从中吸取到经验,然后把这个技术路线思考得更加深入。”

自变量开源的WALL-OSS正是秉承这种“提供肩膀”的开源理念,所以他们选择更为彻底的开放:不仅开放了预训练模型权重、完整训练代码和数据集接口,甚至还提供了详尽的部署文档。
除了构建行业繁荣生态之外,“站在巨人肩膀上”还在于避免行业陷入重复性研发的低效困境——无需每个企业、每个研究者都从零开始“一手手自建高楼”,而是可以基于开源的基础模型快速迭代创新,将更多精力投入到差异化技术研发与场景化应用落地中,大幅提升整个行业的创新效率。
黄仁勋也曾直白说过,“开源如此重要的原因,在于没有开源初创企业不能蓬勃发展,大学研究人员不能做研究,科学家不能使用人工智能。基本上,你的经济没有能力从根本上提升自己”。这不仅适用于AI,对于具身智能和任何技术来说都是如此。

事实上,技术革命的背后就是一场技术大规模应用并改变生产方式的过程。如果没有应用也就把技术困厄于象牙塔,无法激起涟漪。
如自变量所说“拥抱开源,以透明对抗虚假,以协作代替闭门造车”,具身行业这条厚雪长坡上,需要的是明灯而非迷雾,众人拾柴而非孤芳自赏。而开源,正是那盏能够照亮前路、汇聚众力的灯。

相关攻略
新智元报道编辑:艾伦【新智元导读】华为诺亚方舟实验室主任王云鹤官宣离职。我们梳理了王云鹤的经历。王云鹤今日在朋友圈官宣,将辞去华为诺亚方舟实验室主任职位,告别华为。从 2025 年 3 月到今天,王
脑机接口技术正处于从实验室迈向产业化应用的关键转折点,其发展离不开数据创新的驱动、检测服务的支撑与产业集群的聚合。3月27日,脑机接口创新发展论坛在中关村国际创新中心举行,本次论坛以 "创新集聚·脑智
来源:环球网【环球网科技报道 记者 李文瑶】当AI技术从技术验证走向实际应用,算力供给的结构性调整正成为业界关注的焦点。3月26日,中关村论坛年会现场,中科曙光发布世界首个无线缆箱式超节点——sca
1两年前横空出世的Sora,曾给AI业界和全球网民带来巨大的震撼。到2026年,它突然退场,没能再掀起那样大的波澜。从商业决策的角度看,这其实早就是意料之中的事。极高的视频生成成本、少得可怜的付费用
人工智能(ai)大模型正加速融入医疗健康生态,但其背后的法律责任、伦理边界与风险分担问题仍缺乏明晰框架。如何让ai在守住安全与伦理底线的前提下健康发展?笔者认为,要明确ai辅助诊疗责任,构建一个安全
热门专题
热门推荐
每次系统更新,用户最怕的是什么?不是新功能不够多,而是又卡了、又耗电了、更新了个寂寞,这也导致许多用户不敢尝鲜。不过随着各大厂商的内卷程度加深,以及对系统本身的工艺技术得到了进一步的提升,如今系统更
Excel中定位值最后一次出现位置并提取结果,可用五种公式:一、LOOKUP(2,1 (条件),返回列);二、INDEX+MATCH数组公式;三、XLOOKUP(search,lo
在新能源汽车市场竞争愈发激烈的当下,小米新一代SU7凭借专业媒体试驾反馈中的亮眼表现,成为近期车圈焦点。这款车虽定位运动型轿车,却在日常驾驶舒适性上展现出独特优势,收获众多好评。多家媒体在试驾过程中
深蓝汽车近日迎来重要里程碑,其第100万台电驱系统正式下线,标志着该品牌在电动化领域迈出关键一步。与此同时,全新一代原力超集电驱技术揭开面纱,以94 13%的系统工况效率刷新全球量产电驱纪录,功率密
在南非约翰内斯堡举办的2026年国际太阳能暨储能展上,一场备受瞩目的签约仪式吸引了众多目光。中国建材集团旗下的中建材南非有限公司与吉利控股集团旗下的吉利南非有限公司,正式签署了南非新能源转型战略合作





