投资人们被说服了。
两年多前,OpenAI 开出一张5亿美元支票,意图收购一家名为 Medal 的游戏录像分享平台,创始人 Pim de Witte 选择了拒绝。
当时,外界普遍认为这个决定不够明智。

General Intuition 创始人 Pim de Witte|图片来源:techcrunch
然而,到了2026年6月,de Witte 旗下的 AI 企业 General Intuition 交出了一份令人瞩目的答卷:顺利完成3.2亿美元A轮融资,公司估值达到23亿美元。本轮融资由 Khosla Ventures 领投,Jeff Bezos、Eric Schmidt 以及来自 Google DeepMind 和 MIT 的研究人员共同参与。如果算上去年10月启动时的1.34亿美元,累计融资总额已超过4.54亿美元。
回顾 OpenAI 当初5亿美元的报价,如今 General Intuition 的估值已是其五倍之多。市场用真金白银向所有人宣告:这批游戏录像的价值,远超绝大多数人的想象。
游戏录像中隐藏的AI训练价值
要理解 General Intuition 的商业模式,首先需要回答一个根本问题——机器人究竟缺少哪种训练数据。
传统机器人AI训练通常遵循两条路径:一是在真实环境中采集数据,成本高昂且周期漫长;二是在仿真器中训练,速度快,但存在一个致命短板——「仿真与现实之间的差距」。在 Unity 或 Unreal 引擎中训练出的模型,一旦面对真实的地板和墙壁,往往表现得像一个迷路者。
General Intuition 的独特切入点在于:游戏数据既非纯粹的仿真,也非真实环境,但它可能成为连接两者的关键桥梁。
Medal 平台积累了数十亿小时的游戏画面,但这些并非普通视频。据 Crypto Briefing 分析,General Intuition 所拥有的数据特点是:「每一帧都配对了玩家的实际输入——鼠标移动、按键操作、战略决策」。

用于训练的AI游戏录像|图片来源:General Intuition
这与纯粹的游戏录屏有本质区别:你不仅能看到角色在移动,还能清晰了解人类玩家在那一时刻做出的具体决策。
从《堡垒之夜》的第一人称穿越建筑,到《Apex 英雄》中快速识别地形并选择落点,这些游戏场景蕴含着丰富的空间推理信息。人类玩家每天都在训练自己的大脑处理三维空间、预判物体轨迹、在动态环境中做出实时决策——这些能力,恰恰是真实机器人最迫切需要的。
de Witte 在接受采访时指出了 LLM 路线的局限性:「作为人类,我们创造文字来描述世界上发生的事情,但这样做,会丢失大量信息。」他们追求的是更原始、更贴近感知层的数据,而非人类事后用语言总结出的文字。
8分钟数据的神奇效果
在纽约的发布会现场,General Intuition 进行了一次展示,其中细节值得深入解读。
他们利用游戏数据预训练了一个空间推理模型,随后仅用8分钟的真实机器人运动数据对其进行微调。这个机器人在街道上采集了8分钟数据后,被放入一个从未去过的室内办公室,依然能够正常导航。
8分钟,这个数字才是关键所在。

游戏录屏中汇聚了各类虚拟空间数据|图片来源:General Intuition
通常情况下,机器人训练需要在目标环境中反复采集大量数据,或在高度精确的仿真环境中进行无数轮迭代。而 General Intuition 的逻辑是:游戏数据已经为模型建立了足够强大的空间推理基础,迁移到真实世界所需的「真实数据微调量」因此被大幅压缩。
这个思路听起来很优雅。但有一个方面目前尚不明朗:这种迁移能力的泛化边界究竟在哪里。
从街道到办公室是一次成功的演示,但对于复杂的真实工业场景、各种光线条件、地面材质变化,这些能否同样被8分钟的数据所桥接?AI CERTs News 的评论也指出了这一点:「仿真与现实的迁移差距仍然存在,需要严格的基准测试。」
General Intuition 承诺,今年晚些时候将发布公开评估结果。
资本正涌向世界模型
General Intuition 的这轮融资并非孤立事件,而是今年一波融资浪潮的一部分。
World Labs 在2月完成了10亿美元融资;Decart 在5月获得3亿美元;Odyssey 在6月关闭了3.1亿美元的轮次,亚马逊和 AMD 参与其中。这些公司的共同关键词是「世界模型」——利用大量真实或仿真的视觉数据,让AI建立对物理世界的深入理解。
资本正在形成一致判断:下一阶段的AI竞争,不在语言层面,而在物理世界。
但在这场竞赛中,General Intuition 的护城河相对具体。游戏数据这条资产线,其他公司难以复制。Medal 积累的数十亿小时录屏,是多年沉淀的结果,并非今天开始采集明天就能拥有的资源。这也是 OpenAI 当年愿意出价5亿美元的原因——数据本身就是壁垒。
关于新一轮融资的用途,公司透露大部分将投入算力扩容,同时计划在今年夏末将 API 开放给更多开发者。从封闭研发走向开放生态系统,这是 General Intuition 从一个「有趣的研究项目」转型为「平台级公司」的关键一步,也是其23亿美元估值能否站稳的真正考验。
至于游戏开发者可能存在的另一个疑问,de Witte 在播客采访中回应过:他认为担心游戏模型取代开发者是「言过其实」,训练 AI agent 的空间推理能力与游戏内容生成是两条完全不同的赛道。
游戏画面是原材料,而非竞争对手。
虚拟到现实的距离有多远
将游戏中的虚拟物理迁移到现实,这个想法并不新鲜。
游戏引擎在机器人仿真领域早已得到广泛应用,NVIDIA Isaac、Unity Robotics 都在从事类似工作。General Intuition 的不同之处在于,它拥有的不是引擎本身,而是人类在游戏中的实际行动痕迹——带有意图的数据,而非纯粹的物理仿真输出。
这个差异可以用一个简单类比来理解:就像教一个人开车,你可以给他看物理教材中关于摩擦力和转弯半径的所有公式,也可以让他坐在老司机旁边,观看一千个小时的真实驾驶录像,然后感受方向盘在手中的力道。后者效率不一定更高,但建立了一种更接近于本能的能力。游戏录像对于机器人空间推理的价值,大概就在于此。
当然,驾驶游戏与真实驾驶之间存在差距,《堡垒之夜》里的物理引擎与现实世界的物理规律同样存在差距。这个差距有多大、能被多少数据弥合,是 General Intuition 接下来需要用产品和基准来回答的问题,而非依靠演示和估值就能给出答案。
在世界模型融资浪潮中,每家公司都在讲述「物理AI」的宏大故事。但真正的分水岭,往往出现在 API 开放之后——开发者拿到它,能做出什么,做不出什么,很快就会有定论。General Intuition 的夏末 API 计划,或许比这轮融资更值得密切关注。
游戏行业用了几十年训练人类大脑处理三维空间,如今这些数据反哺过来训练机器人的大脑——这个轮回本身,已经足够耐人寻味。
*头图来源:General Intuition
