游乐游手机版
首页/科技数码/文章详情

物理人工智能时代谁来定义新的正确操作标准

时间:2026-06-17 12:08
物理AI进场后,验收标准缺失使多数项目停滞在试点阶段:79%组织接触,仅4%规模化。单步99%可靠性串成一小时任务跌至0 2%;1%仓库损伤损失3500万英镑。效率仅人工20%的机器人拿到500台意向订单,但缺少考核表难达复购。

当机器人将料箱精准送达工位,后台日志随即标记任务已完成。

然而箱子偏离了约一个手掌的位置。工人不得不转身,多伸出一次手臂,将其挪至顺手区域。后续工序因此多等待了十几秒。

这十几秒的延误不会出现在产品后台系统中,班组长的日报大概率也不会单独记录这次微调。当客户抱怨生产节拍被打断,而供应商坚持任务已按流程完成时,双方陈述的都是事实——因为始终没有人坐下来明确界定过,这一单究竟算不算“执行正确”。

物理AI真正进入生产现场后,“能否执行”很快会让位于另一个更本质的问题:做到什么程度才算合格交付。这套标准能否被写入合同验收条款,直接决定了一个试点项目是转化为长期合作,还是沦为下一轮融资PPT中的素材。

79%在尝试,仅4%实现规模化

Capgemini研究院2026年4月发布的报告,对16个国家的1678位企业高管进行了调研:79%的组织已开始接触physical AI,27%处于部署或扩展阶段,仅有4%表示已实现规模化运行。从79%到4%之间那段陡峭的落差,正是本文希望深入探讨的核心议题。


图1 物理AI的采用漏斗。数据来源:Capgemini Research Institute,2026年4月

将问题归咎于基础设施不足已越来越站不住脚。英伟达已将Cosmos世界模型、Isaac仿真框架与GR00T模型串联成一条完整的开发路径,训练速度在加快,仿真成本在降低,机器人进入现场的门槛逐年走低。门槛降低之后,客户提出的问题反而更加尖锐:进来可以,但做到什么程度才算达标?

不足1%的损伤,换来3500万英镑的代价

数字世界中AI出错,只需点击重新生成即可。物理世界则会记账,而且账目记录得极其细致。

2024年7月16日,Ocado位于英国Erith的自动化仓库发生火灾,起因是三台机器人在网格系统上发生碰撞。火势控制相对及时,受损面积不到整个网格的1%。但Ocado后续披露,这场火灾导致约30万个订单损失、约3500万英镑营收损失,另有约1000万英镑的直接损失未获保险覆盖。而这已经是Ocado三年内的第三起仓库火灾——2019年,Andover的整座仓库被完全烧毁。

1%的受损面积,对应3500万英镑的损失账单。这个比例关系,值得每一位正在洽谈物理AI项目的人认真记录。

火灾毕竟是极端事件,日常运营中的代价更多隐藏在概率之中。2024年,论文《Demonstrating Mobile Manipulation in the Wild》研究了一台在真实杂货店中作业的移动操作机器人,研究者进行了推算:单步动作可靠性为99%,每分钟执行10个动作,一小时的连续任务整体可靠性将骤降至0.2%。这个数字基于理论推算,并未真正跑满一小时实测,但它精准揭示了连续性的残酷本质——单步动作看似再稳定,串联成一小时的真实任务后,每一个微小瑕疵都在做乘法效应。


图2 单步99%可靠性串成一小时连续任务后的衰减。推算依据:Demonstrating Mobile Manipulation in the Wild,2024

论文还记录了一个实验室环境中难以感受的细节:在真实门店里,机器人一旦卡住、撞到货架或意外停止,都必须有人走过去手动处理,无法像实验环境那样一键重置。单次人工干预只需几分钟,但乘以一整天的运营量,就构成了一项全新的劳动力成本科目。

Amazon的Vulcan项目已将这一问题摆上台面。最新介绍措辞相当克制:它能处理履约中心约75%的物品类型,剩余部分则由人类同事接手。相比那些精心剪辑的演示视频,这句话更接近采购合同的语言。采购方真正想知道的正是边界:你能处理哪些环节,无法处理时如何停止,由谁接手,接手的这一单如何计价。

效率仅为人工的20%

Figure 02在BMW斯帕坦堡工厂累计运行超过1250小时,装载了9万多个钣金件,参与了3万多辆X3的生产。比这些数字更具信息价值的是Figure披露的考核维度:周期时间、放置成功率、人工干预次数。翻译成车间语言就是节拍、精度、干预——三个指标中没有一个与“智能”直接相关。

后来Figure 03发布,Figure 02从BMW返回总部。它进入过现场、跑过班次、留下了数据,但公开信息中找不到它距离一份长期采购合同还差几步。差距在于成本?维修体系?还是BMW压根没有打算将这类任务转化为可复用的验收条款?外界无从判断。一个运行了1250小时的项目,最关键的信息依旧可以只字不披露。

国内方面,《人民日报》2025年的报道留下了一组更直观的数据。2024年7月,优必选Walker S Lite进入吉利极氪5G智慧工厂,连续实训21天,任务为搬运物料。它动作较慢,还需扫描料箱托盘上的二维码进行辅助定位,作业效率仅为人工的20%。三个月后迭代的Walker S1将搬运速度提升了约25%,优必选随后陆续获得了车厂超过500台的意向订单。

行业给这个阶段起的名字耐人寻味:实训。车间里只有实习生才会被称为实训。从实习生到正式员工,中间隔着一张考核表——效率达到人工的多少算合格,放置偏差超过几毫米算失败,一天内人工接管次数在多少以内可以接受。行业中有一种判断:如果这张考核表继续缺失,这500台意向订单中的大多数将无法进入复购阶段。意向订单购买的是一个观察窗口,复购购买的才是生产能力,两者之间隔着的,恰恰是那套尚未被书写出来的验收标准。

供应商说“测试顺利”,客户在数另一组数据

公开材料通常将“完成动作”拍得很清晰:抓起了什么,走到哪里,放入哪个位置。但后续信息就变得稀薄——连续运行了多久,哪几次需要人工介入,异常如何记录,客户最终依据什么标准签收。

未必是供应商刻意隐瞒。仓库、工厂、医院、养老院中,“干得对”的定义各不相同,很多场景本身就没有形成稳定的标准;而那些已经在项目中磨合出来的误差范围、接管阈值、SLA条款,又往往属于商业机密。于是行业呈现出一种错位:台前一直在展示动作,真正稀缺的运行记录和验收语言,都锁在抽屉里。

采购会议上,这种错位会变得十分具体。供应商汇报测试顺利:运行一天,无碰撞,无停机,无抓料错误。客户低头翻看的却是另一组记录:人工介入过几次,异常是否留有日志,同类问题下次如何应对,责任归属于设备、算法、集成商还是现场条件。这一连串问题指向同一个担忧:这套系统出问题后,能否追溯,能否修正,修完之后能否再次通过验收。

工业自动化行业长期使用OEE、MTBF、MTTR、节拍时间、良率等看似不性感的指标来筛选设备。机器人想要进入产线,最终也必须被纳入同一套核算体系。对位置精度要求高的工位,零件放置稍有偏差,机器仍在运行,但这一单已经作废。这笔账算不清楚,机器人就只能停留在演示阶段。

磨合出来的规则,比模型更难复制

一家物理AI公司真正把某类任务跑通后,留给客户现场的除了机器人本体,还有几条双方默认的规则:放置偏差多少算失败,慢几秒会影响节拍,哪些异常必须停机交由人工处理,停机后多久需恢复,出现问题优先调取哪段记录。

一旦更换供应商,这些规则全部需要重新验证。MassRobotics的AMR互操作标准处理了更基础的一层——不同厂商的移动机器人如何共享位置、速度和健康状态,在同一厂区内互不干扰——但任务验收那一层,它触及不到。某个工位上的失败定义、接管阈值、责任划分,只能在具体项目中一轮一轮磨合。磨合得越细,更换供应商的成本就越高;只会做演示的公司,未来很可能要按别人磨出来的标准去参与竞标。

这条逻辑也解释了试点选址的规律。最缺人的小厂反而做不了第一批客户:其产线经不起试错,停一次线的损失就可能吞噬全部预算。大制造企业的真正优势是场景多、容错深,机器人这个月没调试好,可以换条线继续调。同理,工厂、仓库、封闭园区会排在医院和养老院前面。工厂中的失败有地方记账,节拍、返工、停机、接管,每一项都可以折算成成本;而送药机器人导航到护士站,系统显示“已到达”,但药物是否被正确接收,延误十分钟该由谁负责,病人家属中途拦住机器人又该如何处理——“到达”这两个字,一个都回答不了。这类场景连“失败”的定义都尚未明确。

写到这里必须承认两个尚未想透的地方。一是验收标准需要通过一轮轮试错磨合出来,但试错的成本该由谁承担?供应商垫付,相当于用亏损换取一套行业标准,换来的标准还可能被竞争对手免费沿用;客户支付,则相当于为别人的产品交学费。Figure与BMW、优必选与极氪是如何分摊这笔账的,双方均未披露。二是将验收标准视为规模化的关键卡点,但4%这个数字背后,机器人单价相对于人工成本的回收期算不过来、可靠性本身未达标、产能爬不上去,每一个都可能是更大的障碍——验收标准或许只是其中被低估的一个,未必是最致命的那一个。这两点都没有确定答案,行业里似乎也还没有。

许多物理AI项目卡住的位置,恰恰在试点与长期预算之间。订单需要拆开来看:有的购买的是测试窗口,有的购买的是示范效应,有的购买的是战略合作中的一个席位。只有当客户愿意基于同一套验收标准进行复购、扩展场景,并将人工接管和停机责任写入正式合同,这一步才算真正跨过去。

回到开头那个箱子。下一次机器人把它放偏一掌距离时,有的现场会像今天一样,由工人顺手扶正,十几秒的延误无人提及;有的现场则会翻出一份文件,上面写着偏差超过多少毫米记一次失败,当月失败超过几次重新议价。第二种现场,今天还很少见。

来源:https://www.163.com/dy/article/KV5HE4EJ05118O92.html
上一篇华硕灵耀14领衔618 AI轻薄本选购清单 下一篇千元机内存倒退至6GB网友吐槽像十年前
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。