用游戏训练机器人公司估值达23亿美元_AI热点日报

用游戏训练机器人公司估值达23亿美元

类型：热点整理2026-07-04

投资人们被说服了。两年多前，OpenAI 开出一张5亿美元支票，意图收购一家名为 Medal 的游戏录像分享平台，创始人 Pim de Witte 选择了拒绝。当时，外界普遍认为这个决定不够明智。General Intuition 创始人 Pim de Witte｜图片来源：techcrunch然而

投资人们被说服了。

两年多前，OpenAI 开出一张5亿美元支票，意图收购一家名为 Medal 的游戏录像分享平台，创始人 Pim de Witte 选择了拒绝。

当时，外界普遍认为这个决定不够明智。

General Intuition 创始人 Pim de Witte｜图片来源：techcrunch

然而，到了2026年6月，de Witte 旗下的 AI 企业 General Intuition 交出了一份令人瞩目的答卷：顺利完成3.2亿美元A轮融资，公司估值达到23亿美元。本轮融资由 Khosla Ventures 领投，Jeff Bezos、Eric Schmidt 以及来自 Google DeepMind 和 MIT 的研究人员共同参与。如果算上去年10月启动时的1.34亿美元，累计融资总额已超过4.54亿美元。

回顾 OpenAI 当初5亿美元的报价，如今 General Intuition 的估值已是其五倍之多。市场用真金白银向所有人宣告：这批游戏录像的价值，远超绝大多数人的想象。

游戏录像中隐藏的AI训练价值

要理解 General Intuition 的商业模式，首先需要回答一个根本问题——机器人究竟缺少哪种训练数据。

传统机器人AI训练通常遵循两条路径：一是在真实环境中采集数据，成本高昂且周期漫长；二是在仿真器中训练，速度快，但存在一个致命短板——「仿真与现实之间的差距」。在 Unity 或 Unreal 引擎中训练出的模型，一旦面对真实的地板和墙壁，往往表现得像一个迷路者。

General Intuition 的独特切入点在于：游戏数据既非纯粹的仿真，也非真实环境，但它可能成为连接两者的关键桥梁。

Medal 平台积累了数十亿小时的游戏画面，但这些并非普通视频。据 Crypto Briefing 分析，General Intuition 所拥有的数据特点是：「每一帧都配对了玩家的实际输入——鼠标移动、按键操作、战略决策」。

用于训练的AI游戏录像｜图片来源：General Intuition

这与纯粹的游戏录屏有本质区别：你不仅能看到角色在移动，还能清晰了解人类玩家在那一时刻做出的具体决策。

从《堡垒之夜》的第一人称穿越建筑，到《Apex 英雄》中快速识别地形并选择落点，这些游戏场景蕴含着丰富的空间推理信息。人类玩家每天都在训练自己的大脑处理三维空间、预判物体轨迹、在动态环境中做出实时决策——这些能力，恰恰是真实机器人最迫切需要的。

de Witte 在接受采访时指出了 LLM 路线的局限性：「作为人类，我们创造文字来描述世界上发生的事情，但这样做，会丢失大量信息。」他们追求的是更原始、更贴近感知层的数据，而非人类事后用语言总结出的文字。

8分钟数据的神奇效果

在纽约的发布会现场，General Intuition 进行了一次展示，其中细节值得深入解读。

他们利用游戏数据预训练了一个空间推理模型，随后仅用8分钟的真实机器人运动数据对其进行微调。这个机器人在街道上采集了8分钟数据后，被放入一个从未去过的室内办公室，依然能够正常导航。

8分钟，这个数字才是关键所在。

游戏录屏中汇聚了各类虚拟空间数据｜图片来源：General Intuition

通常情况下，机器人训练需要在目标环境中反复采集大量数据，或在高度精确的仿真环境中进行无数轮迭代。而 General Intuition 的逻辑是：游戏数据已经为模型建立了足够强大的空间推理基础，迁移到真实世界所需的「真实数据微调量」因此被大幅压缩。

这个思路听起来很优雅。但有一个方面目前尚不明朗：这种迁移能力的泛化边界究竟在哪里。

从街道到办公室是一次成功的演示，但对于复杂的真实工业场景、各种光线条件、地面材质变化，这些能否同样被8分钟的数据所桥接？AI CERTs News 的评论也指出了这一点：「仿真与现实的迁移差距仍然存在，需要严格的基准测试。」

General Intuition 承诺，今年晚些时候将发布公开评估结果。

资本正涌向世界模型

General Intuition 的这轮融资并非孤立事件，而是今年一波融资浪潮的一部分。

World Labs 在2月完成了10亿美元融资；Decart 在5月获得3亿美元；Odyssey 在6月关闭了3.1亿美元的轮次，亚马逊和 AMD 参与其中。这些公司的共同关键词是「世界模型」——利用大量真实或仿真的视觉数据，让AI建立对物理世界的深入理解。

资本正在形成一致判断：下一阶段的AI竞争，不在语言层面，而在物理世界。

但在这场竞赛中，General Intuition 的护城河相对具体。游戏数据这条资产线，其他公司难以复制。Medal 积累的数十亿小时录屏，是多年沉淀的结果，并非今天开始采集明天就能拥有的资源。这也是 OpenAI 当年愿意出价5亿美元的原因——数据本身就是壁垒。

关于新一轮融资的用途，公司透露大部分将投入算力扩容，同时计划在今年夏末将 API 开放给更多开发者。从封闭研发走向开放生态系统，这是 General Intuition 从一个「有趣的研究项目」转型为「平台级公司」的关键一步，也是其23亿美元估值能否站稳的真正考验。

至于游戏开发者可能存在的另一个疑问，de Witte 在播客采访中回应过：他认为担心游戏模型取代开发者是「言过其实」，训练 AI agent 的空间推理能力与游戏内容生成是两条完全不同的赛道。

游戏画面是原材料，而非竞争对手。

虚拟到现实的距离有多远

将游戏中的虚拟物理迁移到现实，这个想法并不新鲜。

游戏引擎在机器人仿真领域早已得到广泛应用，NVIDIA Isaac、Unity Robotics 都在从事类似工作。General Intuition 的不同之处在于，它拥有的不是引擎本身，而是人类在游戏中的实际行动痕迹——带有意图的数据，而非纯粹的物理仿真输出。

这个差异可以用一个简单类比来理解：就像教一个人开车，你可以给他看物理教材中关于摩擦力和转弯半径的所有公式，也可以让他坐在老司机旁边，观看一千个小时的真实驾驶录像，然后感受方向盘在手中的力道。后者效率不一定更高，但建立了一种更接近于本能的能力。游戏录像对于机器人空间推理的价值，大概就在于此。

当然，驾驶游戏与真实驾驶之间存在差距，《堡垒之夜》里的物理引擎与现实世界的物理规律同样存在差距。这个差距有多大、能被多少数据弥合，是 General Intuition 接下来需要用产品和基准来回答的问题，而非依靠演示和估值就能给出答案。

在世界模型融资浪潮中，每家公司都在讲述「物理AI」的宏大故事。但真正的分水岭，往往出现在 API 开放之后——开发者拿到它，能做出什么，做不出什么，很快就会有定论。General Intuition 的夏末 API 计划，或许比这轮融资更值得密切关注。

游戏行业用了几十年训练人类大脑处理三维空间，如今这些数据反哺过来训练机器人的大脑——这个轮回本身，已经足够耐人寻味。

*头图来源：General Intuition

来源：https://www.163.com/dy/article/L0JEP87005119FMA.html

机器人

延伸阅读

补充最近整理过的热点入口。