银河通用发布全球首个端到端具身抓取基础大模型 GraspVLA,预训练数据十亿帧“视觉-语言-动作”对
银河通用联合智源发布 GraspVLA:全球首个十亿帧数据训练的端到端具身抓取基础大模型
就在昨天,具身智能领域传来了一个重磅消息。银河通用联合北京智源人工智能研究院、北京大学及香港大学的研究团队,正式发布了名为GraspVLA的端到端具身抓取基础大模型。这事儿在业内可谓期待已久。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

(先简单科普一下:这里的“具身智能”,简单理解就是把人工智能装进机器人这样的物理身体里,让它们能像人一样去感知、学习,并实实在在地与环境互动和操作。)
那么,这个模型到底有何过人之处?关键在于其训练路径与数据规模。GraspVLA的训练分为预训练和后训练两大阶段,而其中预训练阶段的数据体量,直接刷新了行业纪录——达到了前所未有的十亿帧“视觉-语言-动作”配对数据。并且,全部数据均为合成数据。正是依靠这个庞大的数据基座,模型才得以掌握泛化的闭环抓取能力,真正晋升为“基础模型”。
这意味着什么?最直接的好处是强大的“开箱即用”能力。经过预训练的模型,能够直接实现从模拟到现实世界的跨越,在面对从未见过的、千变万化的真实场景和陌生物体时,无需额外调整即可进行“零样本”测试。官方表示,这一基础能力已经能够覆盖大多数产品的应用需求。
当然,现实应用需求多种多样。针对一些特殊或极致的场景,也不必推倒重来。通过后续的小样本学习进行微调,就能将模型强大的基础能力快速迁移到特定任务上。这样一来,既保持了模型的高泛化性,又让它掌握了符合特定产品需求的“专业技能”。
话说回来,衡量一个具身智能模型能否被称为“基础模型”,总得有个硬杠杠。银河通用也公布了他们提出的七大泛化“金标准”,具体包括:照明条件变化、背景环境切换、平面摆放位置偏移、操作空间高度调整、抓取动作策略选择、动态环境干扰应对,以及物体类别泛化。可以说,这七条标准,基本涵盖了一个抓取机器人在现实世界中可能遇到的各种不确定性挑战。
热门专题
热门推荐
2026年第16周剧集热度榜:六部破亿作品,谁主沉浮? 2026年第16周(4月20日至4月26日)的剧集市场,可谓热闹非凡。猫眼数据显示,本周全网有效播放量突破一亿大关的电视剧与网络剧,足足有六部。这份含金量十足的榜单,究竟藏着哪些爆款?它们的制胜法宝又是什么?我们不妨来仔细盘一盘。 Top 1
美国情报机构研判伊朗将如何回应特朗普单方面宣布胜利 全链网4月29日消息,一场持续了两个月、已造成数千人丧生的冲突,正日益成为白宫的整治包袱。此刻,美国情报界接到了一项特殊任务。据两名美国官员及一位知情人士透露,他们正在紧急分析一个关键问题:如果美国总统特朗普单方面宣布在这场冲突中获胜,伊朗会作何反
一个前军情六处特工,靠“古怪魅力”撬开罪犯的嘴 前军情六处特工,凭借“古怪魅力”撬开罪犯的嘴——这设定听起来,像是《神探夏洛克》混搭了《Lie to Me》。但福克斯这次押注的新剧《审讯者》,其选角逻辑,可能比剧情本身更有看头。 谁演谁的朋友? 最新消息是,迈克尔·比奇确认加盟。他在剧中的定位很明确
还记得五阿哥和小燕子表白的时候闹了多大的笑话吗? 五阿哥第一次向女子表白,多少有些不好意思。他把小燕子约出来,支支吾吾地说,自己喜欢上了身边的一个人。 小燕子的嘴,向来比脑子快得多。 在她心里,这世上最美丽、最值得爱的女子只有一个,那就是紫薇。所以她张口就嚷:“不行不行!紫薇已经有尔康了,你这么做,
凯威发布美式巡航新车极光C652V,650cc V缸+全铝合金车架 国产凯威品牌正式发布了全新的美式巡航摩托车——极光C652V,官方售价定在了两万四千九百八十元。这个价格一出来,市场里不少人的目光就被吸引过来了。 先看外观,这款车在设计上可以说是深得美式巡航的精髓。它的整体轮廓,和那些我们耳熟能详





