机器人通用大脑如何实现这家公司给出创新方案
“让计算机在智力测试或下棋时表现出乘人水平相对容易,但要让它们在感知和行动方面拥有1岁儿童的技能,却很困难甚至不可能。”1988年,机器人研究员汉斯·马鲁韦克(Hans Mora vec)提出了这个后来被称为“莫拉维克悖论”的观察。近四十年过去了,这依然是横亘在机器人技术面前的最大障碍。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
然而,一家位于旧金山的初创公司——Physical Intelligence(物理智能),正试图彻底解决这个问题。他们的野心是打造世界上第一个通用的“机器人大脑”,一个能够适应现实世界各种混乱场景的基础模型。这家由来自澳大利亚的洛基·格林(Loki Green)联合创立的公司,已筹集超过10亿美元资金,估值达到56亿美元。

我们走进了他们的实验室,亲眼见证了他们的工作,并与创始团队和投资人进行了一场深度对话。
一、从咖啡机到叠衣服:机器人正在学会“动手”
走进Physical Intelligence的办公室,首先迎接访客的是一台全自动咖啡制作机器人。它流畅地拿起手柄、放入咖啡机、按下按钮,整个过程一气呵成。“这是我喝过最好喝的机器人咖啡。”采访者半开玩笑地评价道。
但这仅仅是冰山一角。旁边,一台机械臂正在处理一件从未见过的短裤,试图将其折叠整齐。通过观察和大量的遥操作数据,机器人学会了如何处理这类可变形物体——这在过去几乎是机器人不可能完成的任务。“我叠衣服叠得特别差,”公司联合创始人洛克·格林坦言,“所以看到机器人能帮我做这件事,真的很有帮助。”
团队还展示了削水果皮、组装包装等其他任务。这些在人类看来简单的家务活,对机器人而言却是巨大的挑战,因为它们涉及对可变形物体的精细操控、复杂的物理交互以及对混乱环境的实时适应。
二、为什么机器人技术过去几十年一直“掉链子”?
在采访中,洛克解释了机器人技术长期未能走出工厂、进入日常生活的根本原因。“之前的机器人几乎完全是预先设定好的,”他分析道,“你把它们部署到流水线上,它在同一个位置拾取同一个零件,以同样的方式操作,周而复始。这没问题,但它是完全确定性的。”

后来出现的机器人引入了计算机视觉,但仍然是针对特定场景的高度定制化方案。核心瓶颈在于,它们无法处理“变异性”。现实世界是混乱且不可预测的:厨房里的光线、桌上物体的位置、衣物的褶皱状态……每一秒都可能不同。
“对计算机来说容易的事(比如算术、下棋),对人类很难;对人类来说微不足道的事(比如走路、抓取、叠衣服),对计算机却极其困难。”洛克将这种能力的缺失称为“物理智能”的空白,而这正是他的公司立志要填补的领域。
三、数据、算法、部署:Physical Intelligence的研发引擎
那么,他们打算如何攻克这一难题?洛克给出的方法论与其他深度学习领域相似,但执行层面更为复杂:“收集海量数据,重新设计并编写能够从这些数据中学习和拟合的算法,然后逐步完成部署。”
在公司开放式的办公空间里,景象颇具未来感:一边是研究人员在激烈讨论算法架构,另一边则是数据收集员正通过“遥操作”界面,控制机械臂演示各种家务任务。这些收集来的动作数据会被仔细标注、混合、增强,然后用于训练模型,最终再回到同一台机器人上进行效果评估。
“我们拥有一个庞大的研究团队,”洛克介绍道,“他们提出假设,这些假设通常需要收集特定量的数据来验证。接着我们训练模型,并在收集数据的那些实体站点上评估模型性能。通过结果,我们能清晰地判断这个研究想法是否有效——可能是一种新算法,一种新的数据收集策略,或者一种新的数据混合方式。”
四、从洗衣到泛化:三个版本,三次突破
Physical Intelligence的技术演进路径清晰可见。他们的首个版本(代号Pi-0)专注于功能证明——让机器人做到以前不可能的事情,例如折叠衣物。选择这个任务不仅因为其物理复杂性,更因为“人人都知道怎么叠衣服”,数据收集的门槛相对较低,是理想的试验平台。
第二个版本(Pi-0.5)则转向泛化能力的验证。团队证明,机器人只需在大约100个不同的家庭环境中进行训练,就能将学到的技能推广到第101个从未见过的家庭中。这个结果出乎意料,他们原本预估可能需要成千上万甚至上百万个样本才能达到类似效果。
最新的版本重点攻坚性能。团队正在开发能让机器人自主提升任务成功率的方法,目标是在洗衣、制作咖啡、组装包装等任务上达到极高的可靠度。“这是一个以前从未实现过的水平,”洛克指出,“但要大规模部署机器人,它们需要表现得极其出色,而这一点一直难以捉摸。我们还没有完全解决这个问题,甚至不能说已经接近。”

五、投资人视角:时机、团队和超预期的速度
菲利普·克拉克(Philip Clark),Thrive Capital的投资合伙人,是Physical Intelligence最早的投资人之一,从公司只有四人在客厅创业时便已介入。“所有伟大的公司投资最终都归结为两件事:人和时机,”菲利普总结道,“很明显,这些人是世界上最优秀的科研人员在攻克这个问题。而时机也恰到好处——如果回到十年前,底层的大模型能力根本还不具备。”
他透露,Physical Intelligence的进展速度比他最乐观的预期还要快两到三倍。“我原以为可能需要三到五年才能达到现在的水平,但他们只用了一年半。”菲利普特别提到了洛克·格林的背景:这位来自珀斯的澳大利亚人,17岁便飞赴硅谷,加入Stripe成为早期员工,在那里展现了非凡的职业道德。之后他一直投资并关注机器人领域,直到2023年,他听说DeepMind机器人团队的几位顶尖科学家(包括卡尔·豪斯曼、谢尔盖·莱文、切尔西·芬恩)打算离开,于是果断联手创办了Physical Intelligence。
六、未来十年:机器人做无聊、危险、无意义的工作
当被问及“如果成功,十年后世界会是什么样”时,洛克沉思了片刻。“世界将会变得非常不同,简直难以想象,”他说,“但我认为这会是一个更好的世界。”
他强调,许多人一生中花费大量时间从事的并非令人愉悦的工作——洗衣服、打扫房间、重复性的工厂劳动。“他们这样做并非出于自愿,而是迫不得已。为了让社会正常运转,有大量必须完成的事情,而人们从中获得的乐趣或意义寥寥无几。”
“人们从工作中获得意义,但我认为未来的工作不必和过去一样。我们的成功,很大程度上将取决于能否改变那些枯燥、危险、无趣、毫无意义的工作——那些本应由机器人来完成的工作。而人们真正想做的事情,他们应该被解放出来去做。这就是我做这一切的真正希望。当然,在这两者之间会有许多困难和复杂的情况需要应对,但我对人性充满信心和乐观。”
七、展望:GPT-2时刻已经到来?
洛克将目前机器人技术的发展阶段,比作大语言模型的早期。“这更像是GPT-2的时刻,而不是GPT-3、GPT-4的时刻。我们看到了‘生命’的迹象,看到了潜力,但还需要巨大的努力去扩大规模,才能让它真正变得实用,对世界各地的每个人都有用。”
对于接下来的一到三年,他持谨慎乐观态度:“很难想象在未来几年内,实用性强的机器人就会进入千家万户。有些事情需要一定的‘智力’,以及应对变化的能力——哪怕只是洗碗或叠衣服。我们正走在解决问题的路上,但企业级的产品似乎触手可及,消费级领域也将迎来新一波浪潮。”
八、独特的文化:研究+工程,寻求真相
Physical Intelligence的团队文化给采访者留下了深刻印象。这里融合了顶尖的学术研究人员和来自Stripe等公司、注重实战的工程师。“我没想到这家公司会是这样,”采访者感叹,“我以为会有很多刻板印象,但这里的研究人员和工程师与最终目标有着出奇紧密的联系。有一种对最终目标的执念,以及尽快达成目标的执念。”
洛克将这种文化归结为“一种探寻真相的渴望,一种雄心壮志”。最优秀的研究人员所具备的好奇心、创造力和开放心态,在这里得到了充分的尊重和发挥。

从折叠衣物到制作咖啡,从实验室的数据收集到未来真实的场景部署——Physical Intelligence正站在机器人技术的一个历史性转折点上。他们相信,通用的“机器人大脑”不再是科幻小说的专属,而是即将到来的现实。而这场变革的终极目标,始终清晰:将人类从无意义的体力劳动中解放出来,让人们得以投身于真正热爱、并能创造价值的事业中去。
相关攻略
OpenAI近期在语音AI领域动作频频,正式发布了三款全新的实时语音模型。官方表示,此举旨在“为开发者开启全新的语音应用类别”,推动语音交互技术的创新边界。这三款模型分别聚焦推理、翻译与转录三大核心功能,各具特色,预示着实时语音应用将迎来更丰富的可能性。 简单来说,这三款新品分别瞄准了实时对话推理、
最近,科技圈有个大动作,你可能已经听说了。由OpenAI牵头,拉上了AMD、博通、英特尔、微软和英伟达这些响当当的名字,组成了一个“全明星”联盟。他们共同发布了一项新的网络协议,目标直指一个困扰行业已久、并且随着AI算力需求爆炸而愈发棘手的老大难问题——网络拥塞。 这个新协议有个挺直白的名字,叫“多
本周,一批法庭文件的披露,让我们得以窥见微软与OpenAI早期合作关系中那些鲜为人知的细节。这段如今看来堪称“天作之合”的联盟,在萌芽之初,也曾经历过一番审慎的权衡与深刻的忧虑。 故事的开端,颇具戏剧性。时间回到2017年夏天,当OpenAI的AI机器人刚刚在《Dota 2》的战场上击败人类职业选手
从Siri到ChatGPT,我们与机器的对话似乎总隔着一层无形的屏障——一问一答,规规矩矩,却少了人与人之间那种流畅自然的互动感。问题出在哪?关键在于,目前绝大多数大模型仍固守于“轮次式交互”的框架。用户说完,模型再答;模型生成时,无法同步接收新的信息。所谓的“实时对话”,本质上还是靠外部工程框架,
OpenAI首席执行官萨姆·奥特曼今日在法庭上的公开证词,正式回应了前联合创始人埃隆·马斯克对公司治理结构的诉讼。奥特曼不仅驳斥了马斯克关于“窃取非营利资产”的指控,更首次披露了一个关键细节:马斯克曾有过让其子女继承公司控制权的提议。 针对马斯克指控OpenAI成立营利性子公司是“违背信托责任”的说
热门专题
热门推荐
旧金山初创公司PhysicalIntelligence致力于为机器人打造通用“大脑”,以解决莫拉维克悖论。公司通过海量数据与算法训练,使机器人掌握叠衣、制作咖啡等复杂技能,并展现泛化能力。投资人看好其团队与进展,目标是将人类从枯燥危险的劳动中解放,企业级应用已可见曙光。
开普勒前CEO胡德波二次创业,成立索塔无界,聚焦研发具身智能“大脑”。公司以世界动作模型为核心,旨在让机器人理解并预测物理世界。目前从欧美商超分拣场景切入,计划结合中国供应链优势,提供涵盖硬件、部署的完整解决方案,以满足海外市场对机器人替代劳动力的需求。
2026年Web3交易平台格局呈现多元化发展,头部平台在安全、资产与用户体验上持续领先。去中心化交易平台(DEX)在交易深度与跨链互操作性方面取得突破,聚合器服务优化了交易路径。新兴平台凭借细分领域创新获得关注,而合规与安全已成为用户选择的核心考量因素。未来,平台竞争将更侧重于技术整合与生态构建能力。
本文梳理了2026年Web3交易平台的格局,重点分析了几个具有代表性的平台。内容涵盖去中心化与中心化混合型平台、纯去中心化交易所以及新兴的跨链聚合器,分别探讨了它们在安全性、流动性、用户体验和创新功能方面的优势与潜在不足,旨在为用户提供多维度的选择参考。
本文梳理了2026年Web3交易平台的格局,从去中心化交易所、聚合器与跨链平台、新兴趋势与挑战三个维度进行分析。重点探讨了DEX在流动性、用户体验与合规方面的进展,聚合器如何优化交易路径,以及跨链技术的成熟度。同时,也审视了平台面临的监管、安全与可持续性等核心挑战,为理解未来交易生态提供参考。





