首页 游戏 软件 资讯 排行榜 专题
首页
AI
GigaBrain-0开源:VLA模型突破10倍数据,真机碾压SOTA

GigaBrain-0开源:VLA模型突破10倍数据,真机碾压SOTA

热心网友
25
转载
2025-10-30

国内首个基于世界模型生成数据的端到端VLA具身基础模型GigaBrain-0重磅面世。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

近日,在武汉东湖高新区,极佳视界与湖北人形机器人创新中心达成战略签约,并联合发布了端到端VLA「具身基础模型」GigaBrain-0。

这是国内首次运用「世界模型」生成数据实现真机泛化的视觉-语言-动作基础模型,旨在以世界模型为核心,彻底改变通用机器人大脑的开发模式。

GigaBrain-0采用了当前最前沿的VLA模型架构,支持图像、点云、文本和本体状态的多模态输入,能够直接输出结构化的任务规划和运动轨迹。该模型依托海量数据进行预训练,可实现更精准的移动导航和复杂的长序列操作。

结合极佳视界自研的「世界模型平台GigaWorld」,构建了业界最完整的具身数据体系,可快速实现多种本体上的复杂机器人操作任务。后续GigaBrain-0将全面开源。

项目链接:https://gigabrain0.github.io/

论文链接:https://arxiv.org/pdf/2510.19430

01 核心架构升级

针对当前机器人操作精准度不足和推理能力较弱的问题,GigaBrain-0重点强化了3D空间感知能力和结构化推理能力。通过引入这两项关键能力,GigaBrain-0可实现更精准的移动导航和更复杂的长序列操作。这是全球首个通过「一脑多形」架构实现端到端全身控制的模型,能够一键完成衣物整理等需要柔性和长程移动的复杂操作任务。

1. 3D空间感知能力:融入深度信息输入,实现更精准的移动导航

GigaBrain-0通过引入深度信息输入,显著提升了物体3D位置和空间布局的感知能力,这对于实现精准的双臂操作和移动导航至关重要。

2. 结构化推理能力:实现更稳定的长程复杂任务表现

GigaBrain-0通过子目标拆解和机械臂末端轨迹输出,大幅提升了在开放场景中的任务规划能力。具体体现在:

子目标拆解:模型在推理过程中可同步输出子任务的自然语言描述,使GigaBrain-0对长程任务的分解更加合理。末端轨迹输出:模型在推理过程中增加了机械臂执行器运动路径在图像平面上的2D投影输出,增强了整体动作规划能力。

02 全球首个世界模型驱动的数据体系

世界模型无论在数据侧还是模型侧,对具身智能发展都具有关键价值。极佳视界以「世界模型」为核心,打造了全球首个最完整的具身智能数据体系,具体包括:

Sim2Real迁移数据:利用Isaac Sim等仿真环境合成多样化的机器人操作数据,通过GigaWorld的Sim2Real变换,实现逼真的外观渲染,同时保持原始场景几何和动作语义。

Real2Real迁移数据:将真实世界采集的视频数据,通过文本提示控制前景和背景的材质、纹理、光照条件,同时保持机器人动作和交互的一致性,有效将真实数据的多样性提升约10倍。

视角转换数据:利用GigaWorld的3D空间场景重建能力,将单个真实数据片段生成新视角的数据片段。

视频生成数据:GigaWorld可根据单张输入图像和不同的文本提示,生成多样化的具身机器人操作视频,并通过逆动力学模型推演出相应的机器人动作序列,合成训练数据。

Human迁移数据:通过视频变换和运动学重定向,将大规模第一人称视频中的人手替换为机械臂,生成稳定且可由机器人执行的动作序列。

03 高效的跨本体适配能力

极佳视界联合湖北人形机器人创新中心,共同完成了大规模预训练数据的采集。数据覆盖了工业、商业、办公、家居、实验室等5大类场景,细分为超市、酒店大堂、咖啡店、奶茶店、便利店、餐厅、仓库搬运、工业流水线、茶水间、住宅、公寓家居、会议室、办公室工位、实验室等14个具体场景。

结合场景丰富的预训练数据和先进的模型架构,GigaBrain-0具备了优秀的任务规划能力。借助极佳视界的「世界模型平台」,可在不同本体上快速实现复杂的机器人操作任务。

极佳视界联合湖北人形机器人创新中心,基于高集成度人形机器人本体,首次实现了实时、长程、复杂、柔性操作的端到端控制。

04 实验结果验证

GigaBrain-0通过真实机器人实验进行了全面评估,涵盖灵巧操作任务、长程任务和移动操作任务三大类别。评估结果表明,GigaBrain-0在多项任务上的成功率显著优于现有SOTA方法。

关于极佳视界

极佳视界专注于「世界模型平台 × 具身基础模型」的技术路线,致力于通过双轮闭环推动物理世界通用智能的发展。

在「世界模型」方向,极佳视界是国内技术创新和产业落地的领跑者,相关产品技术广泛应用于自动驾驶、具身智能、内容创作等方向。

在「具身大脑」方向,极佳视界通过全球领先的「世界模型平台」提供大规模高质量数据,训练效率比纯真机数据提升1-2个数量级,同时真机效果达到国内领先水平。

极佳视界由黄冠博士带领团队于2024年创立,是国内首家专注于「世界模型 × 具身大脑」方向的科技公司。

公司核心团队汇聚了来自清华、北大、中科院、中科大、WashU、CMU等全球知名院校的顶尖研究人员,以及微软、三星、地平线、百度、博世、NBC环球影业等全球知名企业高管,兼具业内领先的研究能力和产业化落地经验。

极佳视界是国内少数在「世界模型」和「具身大脑」方向都具备世界级综合实力的团队。在自动驾驶方向已与多个头部主机厂达成签约合作,在具身世界模型、具身大脑等方向已与多个具身本体、终端公司达成签约合作,应用于科研、教育、展览、数据采集、工业服务、家庭等多个场景。

极佳视界致力于通过「世界模型平台 × 具身基础模型」,创造物理世界通用智能。

来源:https://www.51cto.com/article/828340.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

谷歌推出Veo 3.1 Lite视频模型,每秒生成成本仅0.05美元
AI
谷歌推出Veo 3.1 Lite视频模型,每秒生成成本仅0.05美元

IT之家 4 月 1 日消息,谷歌 DeepMind 昨日推出 Veo 3 1 Lite 视频模型,是该公司迄今为止最实惠的视频生成工具。最新数据显示,Lite 版的生成速度和 Fast 版本保持一

热心网友
04.01
DeepSeek三天两发故障透露信号:V4版更新在即?
AI
DeepSeek三天两发故障透露信号:V4版更新在即?

今天傍晚,DeepSeek再度出现服务异常,社交平台上不少用户反馈,对话过程中频繁遭遇“请检查网络后重试”或“服务器繁忙”等提示。目前,服务已恢复正常。这是三天之内DeepSeek第二次发生服务故障

热心网友
04.01
DeepSeek编码风格巨变:连续“罢工”背后的大招是什么?
AI
DeepSeek编码风格巨变:连续“罢工”背后的大招是什么?

3月29日晚至30日上午,在经历长达12小时的宕机后,DeepSeek“崩”上热搜。大量用户反映网页端和App提示“服务器繁忙”或无法响应,据了解,这是DeepSeek有史以来最长的一次“罢工”。而

热心网友
04.01
雷军公布小米MiMo V2 Pro大模型Text Arena刷榜全球前五战绩
AI
雷军公布小米MiMo V2 Pro大模型Text Arena刷榜全球前五战绩

IT之家 3 月 31 日消息,小米创办人、董事长兼 CEO 雷军今日分享了 MiMo-V2-Pro 大模型最新“战绩”。在大模型权威评测榜单 Text Arena,MiMo-V2-Pro 凭借在复

热心网友
03.31
古尔曼披露:苹果Apple Intelligence在中国意外上线后下线
礼仪与书信
古尔曼披露:苹果Apple Intelligence在中国意外上线后下线

3月31日,苹果于今日凌晨开始分批推送国行Apple Intelligence Beta版,需升级至iOS 26 4及以上系统方可体验。彭博社记者马克·古尔曼今日发文称Apple Intellig

热心网友
03.31

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化
游戏资讯
《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化

《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照

热心网友
04.02
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀
科技数码
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀

雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战

热心网友
04.02
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验
科技数码
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验

借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动

热心网友
04.02
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情
游戏攻略
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情

冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让

热心网友
04.02
iPhone 18 Pro设计挤牙膏了 继续用前代模具
科技数码
iPhone 18 Pro设计挤牙膏了 继续用前代模具

iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消

热心网友
04.02