具身智能新突破:VLA大模型以π*0.6超越极限登顶世界第一

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
新智元报道
编辑:艾伦
【新智元导读】极佳视界具身大模型 GigaBrain-0.5M*,以世界模型预测未来状态驱动机器人决策,并实现了持续自我进化,超越π*0.6实现 SOTA!该模型在叠衣、冲咖啡、折纸盒等真实任务中实现接近 100% 成功率;相比主流基线方法任务成功率提升近 30%;基于超万小时数据训练,其中六成由自研世界模型高保真合成。
具身世界模型新一代原生范式重磅登场!
继具身基础模型 GigaBrain-0.1 斩获 RoboChallenge 全球第一后,性能更强大的 GigaBrain-0.5M* 又来了。

作为依托世界模型实现自我进化的 VLA 大模型,GigaBrain-0.5M* 在家庭叠衣、服务冲煮咖啡、工业折纸盒等多个真实机器人任务中,均实现零失误、可持续稳定运转。
GigaBrain-0.5M* 作为一款基于世界模型条件驱动(World Model-Conditioned)的 VLA 大模型,以世界模型对未来状态与价值的预测结果作为条件输入,可显著提升模型在长时程任务中的鲁棒性。
在此基础上,GigaBrain-0.5M* 创新引入人在回路(Human-in-the-Loop)持续学习机制,系统依托经人工筛选与校正的模型推演轨迹开展迭代训练,基于真实环境交互反馈持续优化决策策略,最终实现「行动 — 反思 — 进化」的闭环式持续学习与自主迭代升级。

论文链接:https://arxiv.org/pdf/2602.12099
项目链接:https://gigabrain05m.github.io/
基于世界模型的强化学习的训练范式
在 GigaBrain-0.5M* 的研发中,极佳视界提出基于世界模型的强化学习范式,并采用迭代式四阶段闭环训练流程:
基于大规模机器人操作数据完成世界模型预训练,实现对未来状态及对应价值的精准预测;
以世界模型输出的未来状态预测与价值评估为条件,对策略网络进行微调,以指引动作决策;
将条件化策略部署至真实物理环境,依托人在环干预机制,采集模型自主推演轨迹数据;
利用经筛选后的有效轨迹数据集,联合优化世界模型与决策策略,实现模型持续学习与自主进化。

连续零失误执行
在与 AWR、RECAP 等主流模仿学习与强化学习基线方法的系统对比中,GigaBrain-0.5M* 展现出显著优势,在相同任务设定下,相较于由 π*0.6所提出的 RECAP 基线,任务成功率提升近 30%,并实现了稳定可靠的模型效果。
尤其在高难度长时程任务中,面对折纸盒、咖啡制备、衣物折叠等包含多阶段操作、精细感知与持续决策的复杂场景,GigaBrain‑0.5M* 均实现接近 100% 的任务成功率,并可稳定复现成功执行轨迹,充分彰显出卓越的策略鲁棒性。

折纸盒
咖啡制备☕️
衣物折叠
高效且准确的价值预测
实验结果表明,基于世界模型的价值预测方案在执行效率与预测精度上,均优于 π*0.6提出的 VLM 方案。
该方案的核心优势源自对未来状态的显式建模与世界模型单步降噪机制,可为价值函数提供关键的时序上下文支撑,让价值估计实现更高效、更精准、更稳定的输出。
以叠衣服任务为例:
任务初期,机械臂反复调整衣物姿态时,预测价值呈现合理波动;
当衣物摆正、进入稳定叠放阶段,价值曲线稳步上升;
若中途出现干扰物,价值骤降以反映任务受阻;
待干扰物被移除后,价值迅速恢复增长趋势。
这种与任务物理进程高度对齐的价值演化,正是世界模型提供「认知先验」的直接体现。

上万小时的训练数据
GigaBrain-0.5M* 的基座模型 GigaBrain-0.5 基于总计 10931 小时的多样化机器人操作数据进行预训练,其中 61%(6653 小时)由自研具身世界模型 GigaWorld 高保真合成,覆盖纹理迁移、视角变换、人手到机械臂映射等丰富场景;
剩余 39%(4278 小时)源自真实机器人采集,确保策略在物理世界中的可执行性。
海量数据的引入显著拓展了模型的任务覆盖广度与策略鲁棒性,使其在面对复杂、长时程操作任务时具备更强的泛化能力;
而 GigaWorld 生成的合成数据则有效突破了真实采集的长尾瓶颈。
通过可控地生成新纹理、新物体位姿与新观测视角下的训练样本,增强了模型在分布外场景中的适应性,为具身智能走向开放世界奠定了数据基石。

关于极佳视界
极佳视界是一家具身智能和通用机器人公司,围绕「基模— 本体 —场景」三位一体,为工业、商业、家庭等场景提供软硬一体的具身智能机器人解决方案,推动通用机器人服务千行百业、走进千家万户。
公司核心团队包括清华、北大、中科院、中科大、WashU、CMU 等全球知名院校顶尖研究人员,以及来自微软、三星、地平线、百度、博世等全球知名企业高管,核心团队在物理 AI 方向兼具业内领先的研究能力和大规模的产业落地经验。
极佳视界是国内第一家布局世界模型的科技公司,以世界模型平台 GigaWorld、通用具身大脑 GigaBrain、原生本体 Maker 构建闭环生态,致力实现 10-100 倍以上的数据、训练、测试全链路效率提升,推动通用具身智能机器人、通用自动驾驶等物理 AGI 大规模爆发。
参考资料:斩获全球第一后,更强大的GigaBrain-0.5M*来了,世界模型原生的新一代范式登场!
论文链接:https://arxiv.org/pdf/2602.12099
项目链接:https://gigabrain05m.github.io/
相关攻略
允中 发自 凹非寺量子位 | 公众号 QbitAI还得是咱国产世界模型牛!极佳视界最新力作GigaWorld-1,直接击穿谷歌英伟达,WorldArena登顶全球第一。而且还是唯一一个综合得分突破6
田晏林 发自 凹非寺量子位 | 公众号 QbitAI春分之后的北京海淀,暖意至,万物生。人工智能产业的发展更是如火如荼。过去五天里,位于“宇宙中心”五道口的AI原点社区,30多场派对狂欢不停。这是在
新智元报道编辑:犀牛【新智元导读】AIGram 在情人节推出「AI 互动视界」,将社交从传统的点赞评论升级为可触碰、可共创的数字事件。当社交的基本单位从账户变为AI 身份,人与人的连接将不再止于信息
新智元报道编辑:艾伦【新智元导读】极佳视界具身大模型 GigaBrain-0 5M*,以世界模型预测未来状态驱动机器人决策,并实现了持续自我进化,超越π*0 6实现 SOTA!该模型在叠衣、冲咖啡、
IT之家 1 月 5 日消息,杜比实验室与抖音今日宣布达成合作,面向抖音用户开放将杜比视界体。据悉,iPhone 用户现可通过抖音 App 分享和观看杜比视界视频,并可使用抖音内置编辑工具或剪映等其
热门专题
热门推荐
腾讯生态整合新动向:QQ全面接入微信小程序 7月1日,腾讯QQ小程序开发者平台发布了一项重要更新。核心内容是,为了帮助开发者降低双端开发与维护成本,QQ将全面接入微信小程序体系。这意味着,未来用户可以直接在QQ内搜索并打开微信小程序。 对于现有的存量QQ小程序,此次调整并未“一刀切”。它们目前仍可正
下半年芯片市场巅峰对决提前揭幕 今年下半年,全球芯片市场的战火将空前炽热。两位重量级选手——联发科与高通,已经准备好亮出各自的王牌。天玑9600系列与骁龙8E6系列,这两大迭代旗舰平台的正面交锋,注定会成为今年科技行业最值得关注的戏码。 双芯策略:精准卡位旗舰市场 有意思的是,联发科这次玩了个新花样
在当今数字化社交的时代,微信已成为人们日常沟通交流的重要工具。不少人都发现,微信好友申请居然可以通过搜索 qq 号来添加,这背后有着诸多有趣的原因和便利之处。 一、社交关系的延续与拓展 要知道,微信与QQ同属腾讯旗下,两者之间存在着千丝万缕的联系。很多用户的社交关系其实根植于QQ时代,那些好友列表里
高德地图如何更改定位?三种方法详解及注意事项 无论是日常通勤、外出旅行还是朋友相聚,高德地图已经成了我们依赖的“导航神器”,精准定位和路线规划是其核心功能。不过,现实场景有时会有点特殊——比如,你可能需要模拟一个位置来测试应用,或者在某个游戏中“签到”,又或者只是想和朋友开个无伤大雅的玩笑。这个时候
巧学宝App绑定手机号全程指南 在巧学宝App上完成手机号绑定,是解锁其完整功能的关键一步。这个看似简单的操作,能为你后续的学习之旅带来不少实实在在的便利。那么,该如何快速搞定呢?下面这张流程图,能帮你一眼看清完整的操作路径。 第一步:进入个人中心 首先,打开你的巧学宝App。进入主界面后,注意力可





