物理人工智能时代谁来定义新的正确操作标准

首页/科技数码/文章详情

物理人工智能时代谁来定义新的正确操作标准

时间：2026-06-17 12:08

物理AI进场后，验收标准缺失使多数项目停滞在试点阶段：79%组织接触，仅4%规模化。单步99%可靠性串成一小时任务跌至0 2%；1%仓库损伤损失3500万英镑。效率仅人工20%的机器人拿到500台意向订单，但缺少考核表难达复购。

当机器人将料箱精准送达工位，后台日志随即标记任务已完成。

然而箱子偏离了约一个手掌的位置。工人不得不转身，多伸出一次手臂，将其挪至顺手区域。后续工序因此多等待了十几秒。

这十几秒的延误不会出现在产品后台系统中，班组长的日报大概率也不会单独记录这次微调。当客户抱怨生产节拍被打断，而供应商坚持任务已按流程完成时，双方陈述的都是事实——因为始终没有人坐下来明确界定过，这一单究竟算不算“执行正确”。

物理AI真正进入生产现场后，“能否执行”很快会让位于另一个更本质的问题：做到什么程度才算合格交付。这套标准能否被写入合同验收条款，直接决定了一个试点项目是转化为长期合作，还是沦为下一轮融资PPT中的素材。

79%在尝试，仅4%实现规模化

Capgemini研究院2026年4月发布的报告，对16个国家的1678位企业高管进行了调研：79%的组织已开始接触physical AI，27%处于部署或扩展阶段，仅有4%表示已实现规模化运行。从79%到4%之间那段陡峭的落差，正是本文希望深入探讨的核心议题。

图1　物理AI的采用漏斗。数据来源：Capgemini Research Institute，2026年4月

将问题归咎于基础设施不足已越来越站不住脚。英伟达已将Cosmos世界模型、Isaac仿真框架与GR00T模型串联成一条完整的开发路径，训练速度在加快，仿真成本在降低，机器人进入现场的门槛逐年走低。门槛降低之后，客户提出的问题反而更加尖锐：进来可以，但做到什么程度才算达标？

不足1%的损伤，换来3500万英镑的代价

数字世界中AI出错，只需点击重新生成即可。物理世界则会记账，而且账目记录得极其细致。

2024年7月16日，Ocado位于英国Erith的自动化仓库发生火灾，起因是三台机器人在网格系统上发生碰撞。火势控制相对及时，受损面积不到整个网格的1%。但Ocado后续披露，这场火灾导致约30万个订单损失、约3500万英镑营收损失，另有约1000万英镑的直接损失未获保险覆盖。而这已经是Ocado三年内的第三起仓库火灾——2019年，Andover的整座仓库被完全烧毁。

1%的受损面积，对应3500万英镑的损失账单。这个比例关系，值得每一位正在洽谈物理AI项目的人认真记录。

火灾毕竟是极端事件，日常运营中的代价更多隐藏在概率之中。2024年，论文《Demonstrating Mobile Manipulation in the Wild》研究了一台在真实杂货店中作业的移动操作机器人，研究者进行了推算：单步动作可靠性为99%，每分钟执行10个动作，一小时的连续任务整体可靠性将骤降至0.2%。这个数字基于理论推算，并未真正跑满一小时实测，但它精准揭示了连续性的残酷本质——单步动作看似再稳定，串联成一小时的真实任务后，每一个微小瑕疵都在做乘法效应。

图2　单步99%可靠性串成一小时连续任务后的衰减。推算依据：Demonstrating Mobile Manipulation in the Wild，2024

论文还记录了一个实验室环境中难以感受的细节：在真实门店里，机器人一旦卡住、撞到货架或意外停止，都必须有人走过去手动处理，无法像实验环境那样一键重置。单次人工干预只需几分钟，但乘以一整天的运营量，就构成了一项全新的劳动力成本科目。

Amazon的Vulcan项目已将这一问题摆上台面。最新介绍措辞相当克制：它能处理履约中心约75%的物品类型，剩余部分则由人类同事接手。相比那些精心剪辑的演示视频，这句话更接近采购合同的语言。采购方真正想知道的正是边界：你能处理哪些环节，无法处理时如何停止，由谁接手，接手的这一单如何计价。

效率仅为人工的20%

Figure 02在BMW斯帕坦堡工厂累计运行超过1250小时，装载了9万多个钣金件，参与了3万多辆X3的生产。比这些数字更具信息价值的是Figure披露的考核维度：周期时间、放置成功率、人工干预次数。翻译成车间语言就是节拍、精度、干预——三个指标中没有一个与“智能”直接相关。

后来Figure 03发布，Figure 02从BMW返回总部。它进入过现场、跑过班次、留下了数据，但公开信息中找不到它距离一份长期采购合同还差几步。差距在于成本？维修体系？还是BMW压根没有打算将这类任务转化为可复用的验收条款？外界无从判断。一个运行了1250小时的项目，最关键的信息依旧可以只字不披露。

国内方面，《人民日报》2025年的报道留下了一组更直观的数据。2024年7月，优必选Walker S Lite进入吉利极氪5G智慧工厂，连续实训21天，任务为搬运物料。它动作较慢，还需扫描料箱托盘上的二维码进行辅助定位，作业效率仅为人工的20%。三个月后迭代的Walker S1将搬运速度提升了约25%，优必选随后陆续获得了车厂超过500台的意向订单。

行业给这个阶段起的名字耐人寻味：实训。车间里只有实习生才会被称为实训。从实习生到正式员工，中间隔着一张考核表——效率达到人工的多少算合格，放置偏差超过几毫米算失败，一天内人工接管次数在多少以内可以接受。行业中有一种判断：如果这张考核表继续缺失，这500台意向订单中的大多数将无法进入复购阶段。意向订单购买的是一个观察窗口，复购购买的才是生产能力，两者之间隔着的，恰恰是那套尚未被书写出来的验收标准。

供应商说“测试顺利”，客户在数另一组数据

公开材料通常将“完成动作”拍得很清晰：抓起了什么，走到哪里，放入哪个位置。但后续信息就变得稀薄——连续运行了多久，哪几次需要人工介入，异常如何记录，客户最终依据什么标准签收。

未必是供应商刻意隐瞒。仓库、工厂、医院、养老院中，“干得对”的定义各不相同，很多场景本身就没有形成稳定的标准；而那些已经在项目中磨合出来的误差范围、接管阈值、SLA条款，又往往属于商业机密。于是行业呈现出一种错位：台前一直在展示动作，真正稀缺的运行记录和验收语言，都锁在抽屉里。

采购会议上，这种错位会变得十分具体。供应商汇报测试顺利：运行一天，无碰撞，无停机，无抓料错误。客户低头翻看的却是另一组记录：人工介入过几次，异常是否留有日志，同类问题下次如何应对，责任归属于设备、算法、集成商还是现场条件。这一连串问题指向同一个担忧：这套系统出问题后，能否追溯，能否修正，修完之后能否再次通过验收。

工业自动化行业长期使用OEE、MTBF、MTTR、节拍时间、良率等看似不性感的指标来筛选设备。机器人想要进入产线，最终也必须被纳入同一套核算体系。对位置精度要求高的工位，零件放置稍有偏差，机器仍在运行，但这一单已经作废。这笔账算不清楚，机器人就只能停留在演示阶段。

磨合出来的规则，比模型更难复制

一家物理AI公司真正把某类任务跑通后，留给客户现场的除了机器人本体，还有几条双方默认的规则：放置偏差多少算失败，慢几秒会影响节拍，哪些异常必须停机交由人工处理，停机后多久需恢复，出现问题优先调取哪段记录。

一旦更换供应商，这些规则全部需要重新验证。MassRobotics的AMR互操作标准处理了更基础的一层——不同厂商的移动机器人如何共享位置、速度和健康状态，在同一厂区内互不干扰——但任务验收那一层，它触及不到。某个工位上的失败定义、接管阈值、责任划分，只能在具体项目中一轮一轮磨合。磨合得越细，更换供应商的成本就越高；只会做演示的公司，未来很可能要按别人磨出来的标准去参与竞标。

这条逻辑也解释了试点选址的规律。最缺人的小厂反而做不了第一批客户：其产线经不起试错，停一次线的损失就可能吞噬全部预算。大制造企业的真正优势是场景多、容错深，机器人这个月没调试好，可以换条线继续调。同理，工厂、仓库、封闭园区会排在医院和养老院前面。工厂中的失败有地方记账，节拍、返工、停机、接管，每一项都可以折算成成本；而送药机器人导航到护士站，系统显示“已到达”，但药物是否被正确接收，延误十分钟该由谁负责，病人家属中途拦住机器人又该如何处理——“到达”这两个字，一个都回答不了。这类场景连“失败”的定义都尚未明确。

写到这里必须承认两个尚未想透的地方。一是验收标准需要通过一轮轮试错磨合出来，但试错的成本该由谁承担？供应商垫付，相当于用亏损换取一套行业标准，换来的标准还可能被竞争对手免费沿用；客户支付，则相当于为别人的产品交学费。Figure与BMW、优必选与极氪是如何分摊这笔账的，双方均未披露。二是将验收标准视为规模化的关键卡点，但4%这个数字背后，机器人单价相对于人工成本的回收期算不过来、可靠性本身未达标、产能爬不上去，每一个都可能是更大的障碍——验收标准或许只是其中被低估的一个，未必是最致命的那一个。这两点都没有确定答案，行业里似乎也还没有。

许多物理AI项目卡住的位置，恰恰在试点与长期预算之间。订单需要拆开来看：有的购买的是测试窗口，有的购买的是示范效应，有的购买的是战略合作中的一个席位。只有当客户愿意基于同一套验收标准进行复购、扩展场景，并将人工接管和停机责任写入正式合同，这一步才算真正跨过去。

回到开头那个箱子。下一次机器人把它放偏一掌距离时，有的现场会像今天一样，由工人顺手扶正，十几秒的延误无人提及；有的现场则会翻出一份文件，上面写着偏差超过多少毫米记一次失败，当月失败超过几次重新议价。第二种现场，今天还很少见。

来源：https://www.163.com/dy/article/KV5HE4EJ05118O92.html

上一篇华硕灵耀14领衔618 AI轻薄本选购清单 下一篇千元机内存倒退至6GB网友吐槽像十年前

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。