自研模型对决：开源自变量的优势与性能解读

时间：2026-01-10 12:52

近日，全球首个大规模多任务的真机基准测试平台RoboChallenge榜单更新，前三名依次为pi0 5、WALL-OSS和pi0。科普时间到，pi0 5、pi0是出自美国公司 Physical In

近日，全球首个大规模多任务的真机基准测试平台RoboChallenge榜单更新，前三名依次为pi0.5、WALL-OSS和pi0。

科普时间到，pi0.5、pi0是出自美国公司 Physical Intelliqence的操作大模型，WALL-OSS是出自中国自变量机器人的全自研开源操作大模型，不仅能完成操作，而且能同时生成复杂推理过程。

这一结果释放出强烈的信号。很长一段时间内，中国具身智能产业陷入“大脑缺位”的争议：我们有较强的本体结构设计和运控算法，但很难让机器人真正“用脑思考”，自主与物理世界交互，进而带来创造生产力的可能。但现在，中国具身智能模型已经与海外顶级模型同台共舞。

更有意思的是，自变量和pi高度默契地选择将模型开源。看似偶然的战略趋同，实则是具身智能产业发展到关键阶段的必然选择。

在RoboChallenge的最新测试中，自变量WALL-OSS展现了极强的竞技状态，总分位居第二，超越了明星模型pi0。在叠洗碗巾、按按钮、浇盆栽等多个任务中，WALL-OSS的得分摘得桂冠，排名第一。

先来划个重点。

RoboChallenge的测试或许更像是一场“开卷考试”，因为数十个桌面任务与场景都是预知的。这就相当于提前布置考题。

而WALL-OSS作为开源模型，某种程度上相当于明牌上场，其每一步操作都真实可见为模型驱动，更多的意义在于给出解题思路，“进一步展示模型的真实性能”。

与用闭源模型参与测评的“黑箱”，不知任务究竟如何完成不同，WALL-OSS作为开源模型，其一举一动相当于“明牌”炸场，换句话说其核心能力均可通过公开的代码和参数得到完整解释和复现，其在榜单上的成绩完全是模型真实能力的直接体现，是无法掺水，难以被“操作”的硬核实力证明。

从技术细节来看，WALL-OSS取得优异成绩的核心在于对“端到端”架构的深度重构：

它依托创新的混合专家（MoE）架构及“共享注意力+专家分流”设计，有效解决了视觉语言模型向具身模型迁移时的“灾难性遗忘”与“模态解耦”难题；

通过“先离散、后连续、再联合”的三阶段训练范式，消除了“认知与动作脱节”的痛点，使模型能精准掌控如浇盆栽时的动作力度；

此外，其内化的跨层级思维链推理能力，实现了高层决策与底层执行的无缝切换，使其在面对各类突发状况时，仍能精准控制关节完成复杂任务。

有个小插曲，WALL-OSS去年9月开源，与Physical Intelligence开源pi0.5相错一天，这也侧面说明了自变量的技术步调一直与国际头部具身大脑公司同频。而今天自变量与Physical Intelligence的模型又在榜单前排聚首，更说明自变量已经站稳了全球第一梯队。

开源之所以重要，在于生态建设，其价值最终体现在生态的繁荣之上。

自变量认为，在具身智能这一软硬件深度耦合的前沿领域，构建一个高质量的开源基础模型底座，是加速整个行业生态繁荣的坚实“地基”，也是实现机器人在物理世界大规模、稳定交互的关键。

当前，机器人模型的验证链路冗长，行业里专用小模型、通用大模型质量参差不齐，基础模型、专用模型、微调模型混杂，且缺乏统一的评价标准。开源是拨开迷雾、推动行业标准化和成熟化的必由之路。

在《硅谷101播客》中，自变量联合创始人兼CTO王昊曾说：“我一直都觉得开源是非常重要的事情，开源意味着我们可以站在巨人的肩膀上继续前进。我们可以基于已有成果做更多的改进，社区开发者的反馈也会帮助到开源的公司，开源公司可以从中吸取到经验，然后把这个技术路线思考得更加深入。”

自变量开源的WALL-OSS正是秉承这种“提供肩膀”的开源理念，所以他们选择更为彻底的开放：不仅开放了预训练模型权重、完整训练代码和数据集接口，甚至还提供了详尽的部署文档。

除了构建行业繁荣生态之外，“站在巨人肩膀上”还在于避免行业陷入重复性研发的低效困境——无需每个企业、每个研究者都从零开始“一手手自建高楼”，而是可以基于开源的基础模型快速迭代创新，将更多精力投入到差异化技术研发与场景化应用落地中，大幅提升整个行业的创新效率。

黄仁勋也曾直白说过，“开源如此重要的原因，在于没有开源初创企业不能蓬勃发展，大学研究人员不能做研究，科学家不能使用人工智能。基本上，你的经济没有能力从根本上提升自己”。这不仅适用于AI，对于具身智能和任何技术来说都是如此。

事实上，技术革命的背后就是一场技术大规模应用并改变生产方式的过程。如果没有应用也就把技术困厄于象牙塔，无法激起涟漪。

如自变量所说“拥抱开源，以透明对抗虚假，以协作代替闭门造车”，具身行业这条厚雪长坡上，需要的是明灯而非迷雾，众人拾柴而非孤芳自赏。而开源，正是那盏能够照亮前路、汇聚众力的灯。

声明：个人原创，仅供参考

来源：https://www.163.com/dy/article/KIS4GG1H0511FMIQ.html

算法 pi 具身明牌正式版模型

上一篇比尔·盖茨警示AI风险：防范技术落入恶意行为者之手 下一篇CES观察：硅谷正布局AI Agent驱动的新硬件浪潮

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-01

优必选CEO周剑：家庭机器人生态核心投入过半精力

先说几个核心判断：优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上，直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进，现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景，另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间，技术路线尚未收敛

6月30日，申银万国在光连接系列研报中重点指出，MPO光连接器领域的投资机会值得高度关注。通俗来说，随着AI算力集群持续扩张，光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件，如今它直接决定着链路插损、可

科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上，区级部门一次性推出了7个AI“龙搭子”。其中，名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解，依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”，已在今年五一假期发布了内测版本。经过一个月市场验证后，该项目正式启动面向全社会的

科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日，南下资金持续大举买入港股，单日净流入金额高达58 95亿港元。接下来，我们直接盘点哪些个股获得资金青睐、哪些遭到减持：净买入方面，中芯国际领跑全场，单日吸金19 33亿港元；建滔积层板紧随其后，净买入10 59亿港元；腾讯控股获得7 65亿港元净流入；智谱（02513 HK）也有6 5

科技数码 · 2026-07-01

电动汽车电池新国标7月实施热失控不起火不爆炸

自2026年7月1日起，两项关乎电动汽车安全的核心强制性国家标准将正式实施，为行业加装“安全锁”——《电动汽车安全要求》（GB 18384-2025）与《电动汽车用动力蓄电池安全要求》（GB 38031-2025）同步落地。此次标准升级，从整车架构与电池系统两大维度，精准填补了近年来多起事故暴露出的