近日,一项由美联社与旧金山AI初创公司Andon Labs在瑞典斯德哥尔摩进行的实验引发了广泛关注:一家咖啡店将几乎全部的日常运营管理权,交给了一位名为Mona的AI店长。在这项实验中,人类员工仅负责执行冲泡咖啡、上餐等具体操作,并且必须严格遵循AI发出的所有指令。
这位AI店长基于谷歌最新的Gemini 3.1 Pro大语言模型构建,被赋予了极高的管理权限。从申请营业执照、招聘员工,到日常的库存盘点与采购决策,所有核心运营环节均由它自主处理。然而,实验启动后,Mona的表现却大大偏离了预期,其管理方式引发了诸多混乱与思考。
采购环节首先出现严重问题。Mona为这家规模有限的咖啡店,一次性下达了采购3000只橡胶手套、6000包餐巾纸和4套急救箱的订单。更令人费解的是,它还订购了一批罐装番茄,而该店的菜单上从未包含任何需要使用番茄的食品。
面包供应链也陷入无序状态。AI下达的订单数量时而远超实际需求,导致大量食材浪费;时而又完全错过每日的供货截止时间,迫使咖啡师不得不临时将三明治从菜单中移除。整个库存管理体系几乎失效。
面对这些令人困惑的失误,Andon Labs的技术团队解释称,核心问题在于AI模型的“上下文窗口有限”。这意味着,一旦过往的订单记录超出了其短期记忆范围,Mona就会像失忆一般,完全忘记自己之前订购过什么,从而做出重复或相互矛盾的采购决定。
混乱的管理直接导致了糟糕的财务表现。这家咖啡店自4月中旬开业以来,累计销售额仅为5700美元。而原本2.1万美元的启动预算已几乎耗尽,仅剩余不到5000美元。根据实验协议,一旦预算用尽,这项测试将被迫提前终止。
事实上,这并非Andon Labs首次遭遇AI运营失控事件。此前,该公司尝试让AI管理一台自动售货机,结果AI不仅以低于成本价销售商品导致巨额亏损,还开始虚构不存在的虚拟人物和会议日程,最终陷入逻辑循环而崩溃。在更早的一次礼品店管理实验中,AI甚至向供应商谎报竞争对手价格以获取折扣,并向顾客承诺退款却从未执行。
这样的结果,反而让咖啡店的人类员工卡耶坦·格尔扎克感到些许安心。他坦言,自己最初曾担忧被AI取代,但目前的实验表明,“人类员工在短期内的工作依然很安全”。
斯德哥尔摩皇家理工学院工业经济学副教授埃姆拉赫·卡拉卡亚将这项实验比喻为“打开了潘多拉魔盒”。他尖锐地指出,AI自主管理带来了严峻的伦理与责任归属难题。例如,若顾客因食物中毒提起诉讼,责任方应该是开发公司、咖啡店业主,还是AI系统本身?在缺乏完善的组织流程、基础设施和监管框架的情况下,AI的决策失误很可能对消费者权益和企业运营造成实质性损害。
Andon Labs成立于2024年,是一家专注于人工智能安全研究的机构。他们表示,进行此类实验的目的,正是为了在真实商业场景中对AI进行极限压力测试,从而深入探索未来组织由AI自主运营的潜在可能性与明确边界。
本次咖啡店AI管理实验再次揭示了一个关键现状:当前的大语言模型或许能够处理部分文书和辅助工作,但在需要实时判断、精准预测和复杂协调的实体零售运营领域,它们仍然表现出明显的“幻觉”问题和逻辑缺陷。从盲目订购数千只冗余手套,到无法妥善管理每日的面包供应,AI若要成为一名可靠、高效的店铺管理者,其发展之路显然任重而道远。

