首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
自研模型对决:开源自变量的优势与性能解读

自研模型对决:开源自变量的优势与性能解读

热心网友
18
转载
2026-01-10



近日,全球首个大规模多任务的真机基准测试平台RoboChallenge榜单更新,前三名依次为pi0.5、WALL-OSS和pi0。

科普时间到,pi0.5、pi0是出自美国公司 Physical Intelliqence的操作大模型,WALL-OSS是出自中国自变量机器人的全自研开源操作大模型,不仅能完成操作,而且能同时生成复杂推理过程。

这一结果释放出强烈的信号。很长一段时间内,中国具身智能产业陷入“大脑缺位”的争议:我们有较强的本体结构设计和运控算法,但很难让机器人真正“用脑思考”,自主与物理世界交互,进而带来创造生产力的可能。但现在,中国具身智能模型已经与海外顶级模型同台共舞。

更有意思的是,自变量和pi高度默契地选择将模型开源。看似偶然的战略趋同,实则是具身智能产业发展到关键阶段的必然选择。



在RoboChallenge的最新测试中,自变量WALL-OSS展现了极强的竞技状态,总分位居第二,超越了明星模型pi0。在叠洗碗巾、按按钮、浇盆栽等多个任务中,WALL-OSS的得分摘得桂冠,排名第一。



先来划个重点。

RoboChallenge的测试或许更像是一场“开卷考试”,因为数十个桌面任务与场景都是预知的。这就相当于提前布置考题。

而WALL-OSS作为开源模型,某种程度上相当于明牌上场,其每一步操作都真实可见为模型驱动,更多的意义在于给出解题思路,“进一步展示模型的真实性能”。

与用闭源模型参与测评的“黑箱”,不知任务究竟如何完成不同,WALL-OSS作为开源模型,其一举一动相当于“明牌”炸场,换句话说其核心能力均可通过公开的代码和参数得到完整解释和复现,其在榜单上的成绩完全是模型真实能力的直接体现,是无法掺水,难以被“操作”的硬核实力证明。

从技术细节来看,WALL-OSS取得优异成绩的核心在于对“端到端”架构的深度重构:



它依托创新的混合专家(MoE)架构及“共享注意力+专家分流”设计,有效解决了视觉语言模型向具身模型迁移时的“灾难性遗忘”与“模态解耦”难题;

通过“先离散、后连续、再联合”的三阶段训练范式,消除了“认知与动作脱节”的痛点,使模型能精准掌控如浇盆栽时的动作力度;

此外,其内化的跨层级思维链推理能力,实现了高层决策与底层执行的无缝切换,使其在面对各类突发状况时,仍能精准控制关节完成复杂任务。

有个小插曲,WALL-OSS去年9月开源,与Physical Intelligence开源pi0.5相错一天,这也侧面说明了自变量的技术步调一直与国际头部具身大脑公司同频。而今天自变量与Physical Intelligence的模型又在榜单前排聚首,更说明自变量已经站稳了全球第一梯队。



开源之所以重要,在于生态建设,其价值最终体现在生态的繁荣之上。

自变量认为,在具身智能这一软硬件深度耦合的前沿领域,构建一个高质量的开源基础模型底座,是加速整个行业生态繁荣的坚实“地基”,也是实现机器人在物理世界大规模、稳定交互的关键。

当前,机器人模型的验证链路冗长,行业里专用小模型、通用大模型质量参差不齐,基础模型、专用模型、微调模型混杂,且缺乏统一的评价标准。开源是拨开迷雾、推动行业标准化和成熟化的必由之路。

在《硅谷101播客》中,自变量联合创始人兼CTO王昊曾说:“我一直都觉得开源是非常重要的事情,开源意味着我们可以站在巨人的肩膀上继续前进。我们可以基于已有成果做更多的改进,社区开发者的反馈也会帮助到开源的公司,开源公司可以从中吸取到经验,然后把这个技术路线思考得更加深入。”



自变量开源的WALL-OSS正是秉承这种“提供肩膀”的开源理念,所以他们选择更为彻底的开放:不仅开放了预训练模型权重、完整训练代码和数据集接口,甚至还提供了详尽的部署文档。

除了构建行业繁荣生态之外,“站在巨人肩膀上”还在于避免行业陷入重复性研发的低效困境——无需每个企业、每个研究者都从零开始“一手手自建高楼”,而是可以基于开源的基础模型快速迭代创新,将更多精力投入到差异化技术研发与场景化应用落地中,大幅提升整个行业的创新效率。

黄仁勋也曾直白说过,“开源如此重要的原因,在于没有开源初创企业不能蓬勃发展,大学研究人员不能做研究,科学家不能使用人工智能。基本上,你的经济没有能力从根本上提升自己”。这不仅适用于AI,对于具身智能和任何技术来说都是如此。



事实上,技术革命的背后就是一场技术大规模应用并改变生产方式的过程。如果没有应用也就把技术困厄于象牙塔,无法激起涟漪。

如自变量所说“拥抱开源,以透明对抗虚假,以协作代替闭门造车”,具身行业这条厚雪长坡上,需要的是明灯而非迷雾,众人拾柴而非孤芳自赏。而开源,正是那盏能够照亮前路、汇聚众力的灯。



声明:个人原创,仅供参考
来源:https://www.163.com/dy/article/KIS4GG1H0511FMIQ.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

许哲诚计算性设计展演评析:数字逻辑与物质建构的生成境域
科技数码
许哲诚计算性设计展演评析:数字逻辑与物质建构的生成境域

数字逻辑与物质建构的深度对话 ——评许哲诚“境域·生成”计算性设计展演 □ 丁雅力(江苏省美术馆策展人) 当代设计与造物的核心范式,正经历着由计算性设计带来的深刻变革。2026年3月20日,南京艺术学院教师许哲诚于南京莫玄空间呈现的“境域·生成”个人专场展演,正是这一前沿趋势的集中体现。本次展览超越

热心网友
05.18
具身智能研发框架Dexbotic重塑机器人开发流程
AI
具身智能研发框架Dexbotic重塑机器人开发流程

近日,开源具身智能原生框架Dexbotic宣布正式支持以RLinf作为其分布式强化学习后端。对具身智能开发者而言,这不仅是一次普通的工程适配,更意味着VLA模型研发中长期存在的「SFT与RL割裂」问题,正在被真正打通。 这是一种典型的「乐高式协作」:双方不强行Fork、不粗暴揉合代码,而是保持清晰边

热心网友
05.13
RMS-MoE模型通过检索记忆优化专家路由调度效率
AI
RMS-MoE模型通过检索记忆优化专家路由调度效率

随着大模型参数规模不断增长,混合专家(Mixture-of-Experts, MoE)架构因其稀疏激活特性,成为平衡模型性能与计算开销的主流方案。然而,在实际的Web级应用部署中,一个关键挑战日益凸显:传统MoE的路由机制通常是“无记忆”的。 试想,在搜索引擎、智能问答或多轮对话等高并发场景下,用户

热心网友
05.12
编程入门指南从零基础到理解核心概念
编程语言
编程入门指南从零基础到理解核心概念

编程十年的一点分享 在软件开发的路上走过十几年,从一个爱好者到以此为业,有些体会或许值得聊聊,就当是抛砖引玉吧。 最早接触编程,是从BASIC和C语言开始的。工作后,随着需要,陆续学习了dBase、Access这类桌面数据库的开发。真正以开发为职业,可以说始于FoxPro 5 0,之后技术栈随着项目

热心网友
05.07
编程初学者入门指南与核心思维解析
编程语言
编程初学者入门指南与核心思维解析

引言 编程,是一门实践科学。这意味着,学习它的最佳方式就是动手去敲代码。但这是否意味着,我们可以因此轻视理论的学习呢? 入门编程 如果你去各大技术社区提问“该如何入门编程”,五花八门的答案会瞬间涌来。 不过,仔细梳理一下,无外乎以下几种流派: 学院派 他们推荐从C语言入手,并辅以数据结构、操作系统等

热心网友
05.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

算力时代电力价值重估 能源如何支撑数字经济
AI
算力时代电力价值重估 能源如何支撑数字经济

近日,国家能源局联合发改委、工信部、国家数据局正式印发《关于促进人工智能与能源双向赋能的行动方案》。这份重磅文件的核心思路非常清晰:一方面,以坚实的能源基础支撑人工智能(AI)的快速发展;另一方面,利用AI技术赋能能源行业转型升级。其核心目标是推动能源、算力、应用场景、数据与算法模型五大关键要素深度

热心网友
05.20
智谱清影与Runway Gen3视频生成模型对比评测
AI
智谱清影与Runway Gen3视频生成模型对比评测

在挑选文生视频工具时,若您正在智谱清影与Runway Gen-3之间权衡,那么了解两者在生成效果上的具体差异,将有助于您做出更明智的选择。本文将从画质清晰度、细节纹理、运动自然度与视频连贯性等核心维度,通过实测对比为您详细解析。 一、画质与分辨率表现 首先对比硬性指标。智谱清影基于CogVideoX

热心网友
05.20
通义万象制作数据可视化科技背景的实用教程
AI
通义万象制作数据可视化科技背景的实用教程

想用通义万相生成一张科技感十足的数据可视化背景,但出来的画面总觉得少了点“内味儿”?数字界面、粒子流、电路纹理这些关键元素一个不见,画面平平无奇?这通常不是工具的问题,而是提示词没有精准锚定科技可视化的核心要素,或者模型参数没调到最佳状态。别急,下面这几种方法,能帮你把想法精准地“翻译”成画面。 一

热心网友
05.20
Vidu视频慢动作与快进效果制作教程
AI
Vidu视频慢动作与快进效果制作教程

想要在Vidu生成的视频中实现流畅的慢动作或快进效果?虽然模型界面没有提供直接调整播放速度的滑块,但通过巧妙的提示词设计、利用内置功能,或结合后期处理工具,你完全可以精准掌控视频的节奏与时间感。本文将为你详细解析四种实用方法,从生成前到生成后,全方位满足你的创作需求。 一、通过精准提示词引导运动节奏

热心网友
05.20
海螺AI学术论文查重降重功能实测与效果分析
AI
海螺AI学术论文查重降重功能实测与效果分析

当您使用海螺AI生成的英文论文在提交查重时遭遇高重复率或AIGC检测异常,请不要急于归咎于工具本身。核心原因在于,尽管AI生成的文本格式标准、语法地道,但其语言模式和常见短语组合,并未针对知网、维普、万方等中文查重数据库的语义比对逻辑进行专门优化。换言之,机器认为流畅自然的表达,在查重系统的算法看来

热心网友
05.20