全球首个0.5M极佳视界斩:GigaBrain的进化之道
机器之心发布
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
具身世界模型新一代原生范式重磅登场!继具身基础模型 GigaBrain-0.1 斩获 RoboChallenge 全球第一后,性能更强大的 GigaBrain-0.5M* 又来了。

作为依托世界模型实现自我进化的 VLA 大模型,GigaBrain-0.5M* 在家庭叠衣、服务冲煮咖啡、工业折纸盒等多个真实机器人任务中,均实现数小时零失误、持续稳定运转。

https://mp.weixin.qq.com/s/CCIAKyB9fw00WD9qD-HcMQ
GigaBrain-0.5M* 作为一款基于世界模型条件驱动(World Model-Conditioned)的 VLA 大模型,以世界模型对未来状态与价值的预测结果作为条件输入,可显著提升模型在长时程任务中的鲁棒性。
在此基础上,GigaBrain-0.5M* 创新引入人在回路(Human-in-the-Loop)持续学习机制,系统依托经人工筛选与校正的模型推演轨迹开展迭代训练,基于真实环境交互反馈持续优化决策策略,最终实现「行动 — 反思 — 进化」的闭环式持续学习与自主迭代升级。

论文链接:https://arxiv.org/pdf/2602.12099项目链接:https://gigabrain05m.github.io/
01
基于世界模型的强化学习训练范式
在 GigaBrain-0.5M* 的研发中,极佳视界提出基于世界模型的强化学习范式,并采用迭代式四阶段闭环训练流程:
基于大规模机器人操作数据完成世界模型预训练,实现对未来状态及对应价值的精准预测;以世界模型输出的未来状态预测与价值评估为条件,对策略网络进行微调,以指引动作决策;将条件化策略部署至真实物理环境,依托人在环干预机制,采集模型自主推演轨迹数据;利用经筛选后的有效轨迹数据集,联合优化世界模型与决策策略,实现模型持续学习与自主进化。

02
数小时连续零失误执行
在与 AWR、RECAP 等主流模仿学习与强化学习基线方法的系统对比中,GigaBrain-0.5M* 展现出显著优势,在相同任务设定下,相较于由 π*0.6 由所提出的 RECAP 基线,任务成功率提升近 30%,并实现了稳定可靠的模型效果。
尤其在高难度长时程任务中,面对折纸盒、咖啡制备、衣物折叠等包含多阶段操作、精细感知与持续决策的复杂场景,GigaBrain‑0.5M* 均实现接近 100% 的任务成功率,并可稳定复现成功执行轨迹,充分彰显出卓越的策略鲁棒性。


https://mp.weixin.qq.com/s/CCIAKyB9fw00WD9qD-HcMQ

https://mp.weixin.qq.com/s/CCIAKyB9fw00WD9qD-HcMQ

https://mp.weixin.qq.com/s/CCIAKyB9fw00WD9qD-HcMQ
03
高效且准确的价值预测
实验结果表明,基于世界模型的价值预测方案在执行效率与预测精度上,均优于 π*0.6 所提出的 VLM 方案。该方案的核心优势源自对未来状态的显式建模与世界模型单步降噪机制,可为价值函数提供关键的时序上下文支撑,让价值估计实现更高效、更精准、更稳定的输出。
以叠衣服任务为例:任务初期,机械臂反复调整衣物姿态时,预测价值呈现合理波动;当衣物摆正、进入稳定叠放阶段,价值曲线稳步上升;若中途出现干扰物,价值骤降以反映任务受阻;待干扰物被移除后,价值迅速恢复增长趋势。这种与任务物理进程高度对齐的价值演化,正是世界模型提供「认知先验」的直接体现。


https://mp.weixin.qq.com/s/CCIAKyB9fw00WD9qD-HcMQ
04
上万小时的训练数据
GigaBrain-0.5M* 的基座模型 GigaBrain-0.5 基于总计 10,931 小时的多样化机器人操作数据进行预训练,其中 61%(6,653 小时)由自研具身世界模型 GigaWorld 高保真合成,覆盖纹理迁移、视角变换、人手到机械臂映射等丰富场景;剩余 39%(4,278 小时)源自真实机器人采集,确保策略在物理世界中的可执行性。
海量数据的引入显著拓展了模型的任务覆盖广度与策略鲁棒性,使其在面对复杂、长时程操作任务时具备更强的泛化能力;而 GigaWorld 生成的合成数据则有效突破了真实采集的长尾瓶颈。通过可控地生成新纹理、新物体位姿与新观测视角下的训练样本,增强了模型在分布外场景中的适应性,为具身智能走向开放世界奠定了数据基石。

公司及团队介绍
极佳视界是一家具身智能和通用机器人公司,围绕「基模 - 本体 - 场景」三位一体,为工业、商业、家庭等场景提供软硬一体的具身智能机器人解决方案,推动通用机器人服务千行百业、走进千家万户。
公司核心团队包括清华、北大、中科院、中科大、WashU、CMU 等全球知名院校顶尖研究人员,以及来自微软、三星、地平线、百度、博世等全球知名企业高管,核心团队在物理 AI 方向兼具业内领先的研究能力和大规模的产业落地经验。
极佳视界是国内第一家布局世界模型的科技公司,以世界模型平台 GigaWorld、通用具身大脑 GigaBrain、原生本体 Maker 构建闭环生态,致力实现 10-100 倍以上的数据、训练、测试全链路效率提升,推动通用具身智能机器人、通用自动驾驶等物理 AGI 大规模爆发。
相关攻略
这项由MiroMind团队开展的研究发表于2026年3月16日的arXiv预印本平台,论文编号为arXiv:2603 15726v1。有兴趣深入了解的读者可以通过这个编号查询完整论文内容。说到人工智
这项由SenseTime Research联合南洋理工大学、加州大学伯克利分校、加州大学圣地亚哥分校、卡内基梅隆大学等多所知名院校合作的研究,发表于2026年3月的arXiv预印本平台,论文编号为a
这项由艾伦人工智能研究院(Allen Institute for AI)领导的突破性研究发表于2026年,论文编号为arXiv:2603 16861v1。研究团队包含来自华盛顿大学、普林斯顿大学、加
这项由上海科技大学联合腾讯混元团队共同完成的研究发表于2026年3月的arXiv预印本平台,论文编号为arXiv:2603 01142v1。对于想要深入了解技术细节的读者,可以通过该编号查询完整的学
新华社赫尔辛基3月6日电(记者朱昊晨 徐谦)芬兰阿尔托大学参与的一项最新研究发现,一些介观尺度的微小生物并非靠“更用力”或“长得更大”来游得更快,而是通过让运动在时间上呈现更强的不对称性来提升推
热门专题
热门推荐
持续三年的咖啡市场价格竞争,在2026年初迎来了关键转折点,各大品牌集体展现出告别低价策略的趋势。 库迪咖啡已将大部分产品价格调整至11 9元至16 9元区间,部分核心单品的价格上调幅度达到30%至60%;瑞幸咖啡则更早一步,显著收窄了其标志性的9 9元优惠活动的适用范围。行业已形成一个清晰共识:仅
2026年5月13日,全球权威指数编制机构MSCI(明晟公司)正式发布了其季度指数审议结果。此次调整备受资本市场瞩目,所有变更将于5月29日收盘后正式生效。 在本次MSCI指数季度调整中,MSCI中国指数的成分股变动成为市场焦点。根据最新公告,该指数新增了22家中国上市公司,涵盖光库科技、长飞光纤、
在汽车制造业的可持续发展浪潮中,一场源自中国广西柳州的绿色材料革命正备受瞩目。上汽通用五菱成功构建了以本土竹资源为核心的汽车零部件创新产业链,通过前沿科技将这一可再生材料转化为高性能汽车部件,为全球汽车产业的低碳转型探索出一条独具特色的中国路径。 这一产业链的核心价值,在于其显著降低了对石油基塑料的
对于经常驾驶电动汽车进行长途出行的车主而言,高速续航焦虑、服务区充电排队、途中电量不足等问题,都是真实存在的困扰。这曾是许多新能源车主在跨城出行时最担心的情况。然而,通过多次长途实测的经验总结与策略优化,一套能够显著提升电车长途旅行安心度与便利性的实用方法已经得到验证。 车载电器:容易被忽视的“耗电
本文解答了抹茶MEXC新用户在注册过程中最常遇到的五个问题,涵盖账户注册、身份验证、审核时长、安全设置以及后续操作。内容旨在帮助用户清晰了解流程,顺利完成从开户到交易的全部步骤,确保账户安全与合规使用。





