6月2日消息,一个未设置消费上限的Claude账号,正让整个硅谷重新审视“AI的经济账本”。
据Axios近日披露,一家不愿公开名称的全球500强企业,管理层在批量开通Claude企业账号时,漏掉了勾选“消费上限”选项。结果呢?员工在短短一个月内,硬生生“烧”掉了5亿美元的AI服务费用。
消息一出,企业界和资本市场瞬间炸开了锅。
这起令人哭笑不得的事故,恰好为两周前百度Create 2026大会上李彦宏抛出的论断,提供了一个最生动的现实注脚。当黄仁勋还在极力鼓吹“Token就是AI时代的货币”,无数企业埋头囤积算力的时候,李彦宏提出的DAA(日活跃智能体数),正以一种全新的衡量标准,悄然终结旧时代的狂欢。

Token这把双刃剑,开始割疼巨头的手了。
Axios那篇报道描绘的场景极具讽刺意味:这家企业的IT部门原本想为数千名员工快速配置Claude最高权限以提升效率,结果完全忘记在管理后台设置消费上限。一个月后,财务部门收到了Anthropic发来的账单——近5亿美元。算下来,相当于每个员工平均消耗了几十万美金。
这当然是个极端案例,但冰山浮出的,远不止这一角。
5月中旬,开源项目OpenClaw的创始人Peter Steinberger在X上贴出一张截图:30天,OpenAI API账单高达130万美元。他那团队总共只有三个人,但100个Codex智能体在并行运行,一个月烧掉6030亿个Token,产生760万次请求。
过去两个月里,科技巨头们不约而同地开始收紧AI支出。
Uber的COO Andrew Macdonald上个月公开表示:AI Token的消耗与最终发布的有价值产品之间,似乎并不存在明显的线性关系。“我们正在为智能体签下巨额支票,但真不清楚买回来的到底是什么东西。”
有报道称,亚马逊已经悄悄取消了内部AI使用排行榜——因为员工们为了冲榜,开始疯狂刷Token,甚至执行大量毫无实际价值的任务。
微软那边的动静更大。他们宣布将在6月30日之前,取消Experience + Devices部门(负责Windows、Microsoft 365、Outlook等产品)的大部分Claude Code授权,工程师们被要求迁移到自家GitHub Copilot CLI。要知道,Claude Code进入微软内部才不过6个月时间。微软内部甚至流传出一份“Token审计”备忘录,要求各部门严格审查智能体调用频率,防止“预算失控”。
Meta也经历了类似的转变。在内部建立Claude使用排行榜、单月消耗数十亿Token之后,Meta开始逐渐收紧相关激励,从鼓励“多用、多刷”转向更关注实际产出。
事实上,越来越多的亚马逊云服务和微软Azure企业客户,正在私下做一道冷酷的算术题:AI生成的Token成本与人类劳动力的性价比,到底谁更划算?
一家大型零售企业的CFO直接对媒体抱怨:用顶级模型生成一份包含动态数据的市场分析报告,Token消耗轻松上百万,单次费用高达数千美元。而雇佣一名初级分析师,一天薪水不过几百美元。在大量非核心、非实时的内容生成场景中,人工反而重新变得“便宜”了。
“Token经济学”的黄仁勋公式,正接受前所未有的压力测试。
这一幕,跟过去两年黄仁勋反复描绘的Token经济学蓝图,形成了尖锐的对比。这位英伟达掌门人曾在多个顶级峰会上高调宣称:“未来一切移动的、计算的,都是Token。Token就是AI世界的石油和货币。”
在他的叙事逻辑里,Token消耗量的指数级增长,等同于智能进化的必然代价,也是企业拥抱AI时必须跨越的门槛。这套逻辑成功驱动全球企业疯抢GPU,把英伟达推上了万亿美元市值,但也埋下了巨大隐患:企业为Token付了钱,却怎么也测不准这些Token到底带来了多少真实回报。
问题的核心在于,Token数量与智能价值之间,从来就不是线性关系。大量的Token消耗在模型“自言自语”、重复生成和低效试错上。一位硅谷AI工程师在社交媒体上调侃:“我们用昂贵的Token让AI写了一首十四行诗,然后让它解释这首诗,接着再写一篇评论,最终全部丢进回收站。”这种“Token空转”,在企业级应用里普遍存在。
当CFO们开始用“每个有效任务消耗多少Token”的尺度去衡量支出时,黄仁勋那套以“算力军备竞赛”为基石的Token世界观,自然就站到了悬崖边上。
李彦宏的DAA,成为AI时代的新度量衡。
有意思的是,恰恰在这波对Token的集体反思到来之前,百度创始人李彦宏在5月中旬的百度Create 2026大会上,已经提前给出了答案。他提出了一个全新概念——DAA,也就是Daily Active Agents,日活跃智能体数,并将其定义为“AI时代的度量衡”。
李彦宏的观点很明确:DAA衡量的是,每天有多少个智能体在真实场景中成功、可靠地完成了用户任务,而不是模型输出了多少字、多少代码。他认为:“未来AI的竞争,不是谁生成了更多Token,而是谁能让数以百万计的智能体,像水电一样融入每一个工作流,日复一日地创造价值。”
更为关键的是,百度已经开始推动以DAA为导向的商业模型,允许企业按智能体有效执行任务的结果付费,直接跳过了按Token计费那个黑洞。

从“Token狂欢”到“智能体精耕”,AI商业正回归本质。
回看这场成本风暴,那张5亿美元的Claude账单虽然是个意外,却是一声必然的警钟。它宣告了一个粗放式的、以Token消耗堆砌智能幻觉的时期,正在走向终结。
黄仁勋的Token经济学,好比建造了四通八达的高速公路,但路上的车辆空转、迷路、兜圈成风,而收费站却一分不少地收取过路费。基础设施的繁荣,并没有转化成为经济的有效性。用大模型生成的Token数量来衡量AI能力,就像用汽车排出的尾气量来衡量车速一样荒谬。李彦宏提出的DAA,则像是给每辆车装上了导航和任务清单——只有安全抵达目的地的行程,才有计量的意义。
当CEO们开始问询“我们部署的智能体每天真正解决了多少问题”,而不是“我们买了多少张H100”时,AI产业才算真正走出了青春期的幻觉。
Anthropic这样的模型厂商已经意识到危险,紧急修补计费风控缺口。而更大的转向在于,衡量AI商业成功的标尺,正从芯片厂商定义的“算力吞吐”,移交到平台和用户手中的“任务达成”。
一场由荒唐账单引发的连锁反应,最终可能将AI经济的话语权,从鼓吹算力无限膨胀的一方,转移到那些致力于让智能体真正有用、每天被唤醒的价值创造者手中。李彦宏的预言来得不早不晚,为新世界的度量衡,画下了最关键的一笔。
