机器人通用大脑如何实现这家公司给出创新方案

时间：2026-05-14 16:10

旧金山初创公司PhysicalIntelligence致力于为机器人打造通用“大脑”，以解决莫拉维克悖论。公司通过海量数据与算法训练，使机器人掌握叠衣、制作咖啡等复杂技能，并展现泛化能力。投资人看好其团队与进展，目标是将人类从枯燥危险的劳动中解放，企业级应用已可见曙光。

“让计算机在智力测试或下棋时表现出乘人水平相对容易，但要让它们在感知和行动方面拥有1岁儿童的技能，却很困难甚至不可能。”1988年，机器人研究员汉斯·马鲁韦克（Hans Mora vec）提出了这个后来被称为“莫拉维克悖论”的观察。近四十年过去了，这依然是横亘在机器人技术面前的最大障碍。

然而，一家位于旧金山的初创公司——Physical Intelligence（物理智能），正试图彻底解决这个问题。他们的野心是打造世界上第一个通用的“机器人大脑”，一个能够适应现实世界各种混乱场景的基础模型。这家由来自澳大利亚的洛基·格林（Loki Green）联合创立的公司，已筹集超过10亿美元资金，估值达到56亿美元。

我们走进了他们的实验室，亲眼见证了他们的工作，并与创始团队和投资人进行了一场深度对话。

一、从咖啡机到叠衣服：机器人正在学会“动手”

走进Physical Intelligence的办公室，首先迎接访客的是一台全自动咖啡制作机器人。它流畅地拿起手柄、放入咖啡机、按下按钮，整个过程一气呵成。“这是我喝过最好喝的机器人咖啡。”采访者半开玩笑地评价道。

但这仅仅是冰山一角。旁边，一台机械臂正在处理一件从未见过的短裤，试图将其折叠整齐。通过观察和大量的遥操作数据，机器人学会了如何处理这类可变形物体——这在过去几乎是机器人不可能完成的任务。“我叠衣服叠得特别差，”公司联合创始人洛克·格林坦言，“所以看到机器人能帮我做这件事，真的很有帮助。”

团队还展示了削水果皮、组装包装等其他任务。这些在人类看来简单的家务活，对机器人而言却是巨大的挑战，因为它们涉及对可变形物体的精细操控、复杂的物理交互以及对混乱环境的实时适应。

二、为什么机器人技术过去几十年一直“掉链子”？

在采访中，洛克解释了机器人技术长期未能走出工厂、进入日常生活的根本原因。“之前的机器人几乎完全是预先设定好的，”他分析道，“你把它们部署到流水线上，它在同一个位置拾取同一个零件，以同样的方式操作，周而复始。这没问题，但它是完全确定性的。”

后来出现的机器人引入了计算机视觉，但仍然是针对特定场景的高度定制化方案。核心瓶颈在于，它们无法处理“变异性”。现实世界是混乱且不可预测的：厨房里的光线、桌上物体的位置、衣物的褶皱状态……每一秒都可能不同。

“对计算机来说容易的事（比如算术、下棋），对人类很难；对人类来说微不足道的事（比如走路、抓取、叠衣服），对计算机却极其困难。”洛克将这种能力的缺失称为“物理智能”的空白，而这正是他的公司立志要填补的领域。

三、数据、算法、部署：Physical Intelligence的研发引擎

那么，他们打算如何攻克这一难题？洛克给出的方法论与其他深度学习领域相似，但执行层面更为复杂：“收集海量数据，重新设计并编写能够从这些数据中学习和拟合的算法，然后逐步完成部署。”

在公司开放式的办公空间里，景象颇具未来感：一边是研究人员在激烈讨论算法架构，另一边则是数据收集员正通过“遥操作”界面，控制机械臂演示各种家务任务。这些收集来的动作数据会被仔细标注、混合、增强，然后用于训练模型，最终再回到同一台机器人上进行效果评估。

“我们拥有一个庞大的研究团队，”洛克介绍道，“他们提出假设，这些假设通常需要收集特定量的数据来验证。接着我们训练模型，并在收集数据的那些实体站点上评估模型性能。通过结果，我们能清晰地判断这个研究想法是否有效——可能是一种新算法，一种新的数据收集策略，或者一种新的数据混合方式。”

四、从洗衣到泛化：三个版本，三次突破

Physical Intelligence的技术演进路径清晰可见。他们的首个版本（代号Pi-0）专注于功能证明——让机器人做到以前不可能的事情，例如折叠衣物。选择这个任务不仅因为其物理复杂性，更因为“人人都知道怎么叠衣服”，数据收集的门槛相对较低，是理想的试验平台。

第二个版本（Pi-0.5）则转向泛化能力的验证。团队证明，机器人只需在大约100个不同的家庭环境中进行训练，就能将学到的技能推广到第101个从未见过的家庭中。这个结果出乎意料，他们原本预估可能需要成千上万甚至上百万个样本才能达到类似效果。

最新的版本重点攻坚性能。团队正在开发能让机器人自主提升任务成功率的方法，目标是在洗衣、制作咖啡、组装包装等任务上达到极高的可靠度。“这是一个以前从未实现过的水平，”洛克指出，“但要大规模部署机器人，它们需要表现得极其出色，而这一点一直难以捉摸。我们还没有完全解决这个问题，甚至不能说已经接近。”

五、投资人视角：时机、团队和超预期的速度

菲利普·克拉克（Philip Clark），Thrive Capital的投资合伙人，是Physical Intelligence最早的投资人之一，从公司只有四人在客厅创业时便已介入。“所有伟大的公司投资最终都归结为两件事：人和时机，”菲利普总结道，“很明显，这些人是世界上最优秀的科研人员在攻克这个问题。而时机也恰到好处——如果回到十年前，底层的大模型能力根本还不具备。”

他透露，Physical Intelligence的进展速度比他最乐观的预期还要快两到三倍。“我原以为可能需要三到五年才能达到现在的水平，但他们只用了一年半。”菲利普特别提到了洛克·格林的背景：这位来自珀斯的澳大利亚人，17岁便飞赴硅谷，加入Stripe成为早期员工，在那里展现了非凡的职业道德。之后他一直投资并关注机器人领域，直到2023年，他听说DeepMind机器人团队的几位顶尖科学家（包括卡尔·豪斯曼、谢尔盖·莱文、切尔西·芬恩）打算离开，于是果断联手创办了Physical Intelligence。

六、未来十年：机器人做无聊、危险、无意义的工作

当被问及“如果成功，十年后世界会是什么样”时，洛克沉思了片刻。“世界将会变得非常不同，简直难以想象，”他说，“但我认为这会是一个更好的世界。”

他强调，许多人一生中花费大量时间从事的并非令人愉悦的工作——洗衣服、打扫房间、重复性的工厂劳动。“他们这样做并非出于自愿，而是迫不得已。为了让社会正常运转，有大量必须完成的事情，而人们从中获得的乐趣或意义寥寥无几。”

“人们从工作中获得意义，但我认为未来的工作不必和过去一样。我们的成功，很大程度上将取决于能否改变那些枯燥、危险、无趣、毫无意义的工作——那些本应由机器人来完成的工作。而人们真正想做的事情，他们应该被解放出来去做。这就是我做这一切的真正希望。当然，在这两者之间会有许多困难和复杂的情况需要应对，但我对人性充满信心和乐观。”

七、展望：GPT-2时刻已经到来？

洛克将目前机器人技术的发展阶段，比作大语言模型的早期。“这更像是GPT-2的时刻，而不是GPT-3、GPT-4的时刻。我们看到了‘生命’的迹象，看到了潜力，但还需要巨大的努力去扩大规模，才能让它真正变得实用，对世界各地的每个人都有用。”

对于接下来的一到三年，他持谨慎乐观态度：“很难想象在未来几年内，实用性强的机器人就会进入千家万户。有些事情需要一定的‘智力’，以及应对变化的能力——哪怕只是洗碗或叠衣服。我们正走在解决问题的路上，但企业级的产品似乎触手可及，消费级领域也将迎来新一波浪潮。”

八、独特的文化：研究+工程，寻求真相

Physical Intelligence的团队文化给采访者留下了深刻印象。这里融合了顶尖的学术研究人员和来自Stripe等公司、注重实战的工程师。“我没想到这家公司会是这样，”采访者感叹，“我以为会有很多刻板印象，但这里的研究人员和工程师与最终目标有着出奇紧密的联系。有一种对最终目标的执念，以及尽快达成目标的执念。”

洛克将这种文化归结为“一种探寻真相的渴望，一种雄心壮志”。最优秀的研究人员所具备的好奇心、创造力和开放心态，在这里得到了充分的尊重和发挥。

从折叠衣物到制作咖啡，从实验室的数据收集到未来真实的场景部署——Physical Intelligence正站在机器人技术的一个历史性转折点上。他们相信，通用的“机器人大脑”不再是科幻小说的专属，而是即将到来的现实。而这场变革的终极目标，始终清晰：将人类从无意义的体力劳动中解放出来，让人们得以投身于真正热爱、并能创造价值的事业中去。

来源：https://36kr.com/p/3808591107284487

OpenAI

上一篇索塔无界创始人再创业押注机器人大脑出海新机遇 下一篇OpenAI确认TanStack攻击未泄露数据macOS用户需立即更新

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。