大模型天价成本高达每月7500美元 Token竞赛转向节流模式

时间：2026-06-20 14:25

企业AI支出从鼓励Token消耗转向严格管控，AT&T、Meta、Uber等巨头纷纷限制AI使用权限。成本压力是主因，高使用强度企业月人均AI支出达7500美元。这一转变催生了AI成本监控与优化工具的需求，微软、Databricks等公司迎来增长机会。

企业AI支出正在经历一场方向性的逆转。回想前两年，不少科技巨头为了激励员工多使用AI、多消耗Token，甚至推出了内部排行榜，比拼谁用得更多、更猛。然而如今风向骤变——AT&T、Meta、Uber、沃尔玛、亚马逊这些Fortune 500巨头，纷纷开始给AI使用戴上“紧箍咒”。曾经备受追捧的“tokenmaxxing”（极限消耗），迅速被“tokenminimizing”（极限节流）取代。一场席卷全球的AI预算管控浪潮，已经全面到来。

据The Information报道，AT&T已经开始限制部分员工使用微软旗下GitHub Copilot的权限；Meta则在收紧员工在Anthropic及其他AI服务商上的支出——这与几个月前员工们争相消耗Token的热闹场面，形成了鲜明对比。彭博此前报道，Uber和沃尔玛已经对AI编程工具的使用设置了上限；英国《金融时报》则提到，亚马逊干脆废除了按AI使用量给员工排名的内部排行榜。

驱动这一转变的核心原因，是成本压力的迅速膨胀。AI使用强度最高的企业，每名员工每月的AI支出已经高达7500美元。即便各模型的单Token价格持续走低，但反复调用模型的智能体工具，让企业AI账单较此前翻了三倍。成本压力已经超出了许多企业的预算承受范围。

这场转变正在重新定义AI市场的受益方。能够帮助企业监控、限制和优化AI支出的“网关”工具与模型路由器需求快速上升。微软、Databricks以及英伟达旗下投资的Factory等公司，正迎来新的增长窗口。软件供应商Palantir和Snowflake，也被视为这一结构性趋势的潜在受益者。

账单触目惊心：成本失控重塑预算逻辑

成本压力的累积并非没有先兆。Uber是迄今最极端的案例——2026年4月，该公司就已经耗尽了全年的AI编程预算。目前，Uber将每位员工每款工具的月度使用上限调整为1500美元。沃尔玛则对其内部AI智能体的使用设置了上限；亚马逊发现员工为争夺排名而大量消耗算力、推高成本后，直接废除了相关排行榜。

即便在个人层面，成本消耗也令人侧目。微软发现，部分工程师每月仅在Claude Code上消耗的Token费用就高达500至2000美元。

问题的根源在于，智能体工具的普及从结构上改变了Token的消耗模式。与用户手动发送单条指令不同，这类工具在完成一项任务的过程中会反复自动调用模型，大幅推高实际用量。这使得即便单Token价格持续下降，企业整体账单依然居高不下。

反应分化：踩刹车还是继续踩油门？

并非所有企业都选择收紧。Box首席执行官Aaron Levie对此颇为自得：“我们从未庆祝过tokenmaxxing。我们没有排行榜，所以我们没有走偏——没有去激励错误的行为。”

与此形成对比的是Databricks。该公司工程领域负责人Nikita Shamgunov上周在Nebius举办的活动上表示，Databricks对工程师的AI预算不设上限，“因此tokenmaxxing依然存在”。这一立场折射出一种观点：对于相信自身员工能够高效利用AI的企业而言，限制使用未必合算。

这一分歧揭示了Token节流政策内在的张力：控制使用量固然能压降成本，但也可能同步削减AI原本承诺带来的生产率提升——而后者恰恰是企业当初为这笔支出所作的主要辩护理由。

基础设施受益：成本管控工具迎来结构性需求

“Token节流”浪潮的另一面，是对成本管控基础设施的结构性需求上升。

越来越多的企业正将简单任务从高价前沿模型迁移至更廉价或开源的替代模型，以在不削减实际使用量的前提下控制成本。Palantir和Box的高管均表示，来自企业客户的此类需求正在快速增长。

基础设施层供应商正迅速填补这一空白。微软和Databricks已分别推出“网关”工具，可帮助企业监控员工的AI使用并实施支出上限。英伟达旗下投资、估值15亿美元的AI软件开发公司Factory，则于本月初发布了新款模型路由器，旨在将低复杂度任务自动分配给成本更低的模型。

微软首席执行官Satya Nadella在上周末于X平台发布的一篇文章中，对上述趋势有所呼应，主张AI模型应当像可随时替换的商品一样运作。他写道：“我们任何人都不希望看到这样一个世界——每家公司在每个行业都将价值拱手让给少数几个‘通吃一切’的模型。”值得关注的是，这一表态出自一位旗下生产力软件正面临Anthropic和OpenAI竞争压力的科技巨头掌门人，其背后的战略意图同样耐人寻味。

微软两面作战：推出新定价，却主打“成本可控”

在积极呼应客户降本诉求的同时，微软本周揭示了新旗舰AI产品Copilot Cowork的定价结构，其计费逻辑与Anthropic此前推出的模式高度相似。

Copilot Cowork主要依托Anthropic的模型，旨在微软Office 365软件内自动完成复杂的多步骤任务——例如，用户可将一批收据截图发送给该工具，由其自动生成包含相应费用信息的电子表格。这远超现有365 Copilot所能处理的基础任务（如汇总邮件或在Excel中建立财务模型）的范畴。

定价方面，用户须先持有月费起价30美元的365 Copilot授权，再按照Copilot Cowork的实际使用量额外付费。这一“座位费+消耗量”组合计费模式，与Anthropic今年早些时候向企业客户推出的收费方式如出一辙。

面对企业客户对AI成本飙升的普遍担忧，微软执行副总裁Charles Lamanna在周二的博客文章中表示，客户“可以选择管控成本的方式”，包括为员工设置Copilot Cowork的使用上限。与此同时，微软还预告了允许客户将Copilot Cowork中的Anthropic模型替换为来自OpenAI或微软自身的其他模型的功能，声称可在相近效果下实现更低成本；据一位知情员工透露，微软还在测试可在部分场景下替换Anthropic模型的开源模型选项。上述布局表明，在“Token节流”时代，如何在维持产品竞争力的同时缓解客户的成本焦虑，已成为企业软件市场新一轮竞争的核心命题。

来源：https://www.163.com/dy/article/KVQGV3JE05198NMR.html

微软

上一篇筑基AI4S借助摩尔线程全功能GPU加速中国生命科学自主生态 下一篇深圳打造全球具身智能高地的路径与行动重点

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。