年初以来,硅谷掀起了名为“Token最大化”(tokenmaxxing)的热潮。简言之,就是将AI Token的消耗量与员工绩效直接绑定,消耗越多即被视为生产力越高。亚马逊内部设立了排行榜,依据员工使用AI的频次进行排名;Meta同样不甘落后,其内部系统鼓励员工比拼Token消耗量。这股趋势一度被誉为效率革命的关键指标。
然而问题迅速浮现——昂贵的AI账单开始让企业感到“心疼”了。
根据英国《金融时报》6月30日的报道,美国网约车公司Uber就遭遇了一次典型“翻车”。员工积极采用AI编程工具,结果仅四个月便耗尽了原本计划维持到2026全年的AI预算。管理层被迫紧急叫停,现在每位员工每月在这类工具上的支出上限被设定为1500美元。毕马威5月对2145名全球企业领导者开展的调查表明,近半数受访者因成本超过收益,已减少了AI智能体的使用。
OpenAI首席执行官山姆·奥特曼在6月初的一席话,引发广泛共鸣:“今年年初,一个从未被提及的问题突然变得异常严峻……我的公司第一季度就用掉了原本规划到2026年的预算。”
那么,问题究竟出在哪里?
表面上,Token单价确实在下降。但症结在于,AI公司的定价模式已从固定订阅转向按使用量计费。任务步骤日益增多,输入内容不断延长,每项任务的Token消耗变得难以预测。企业面临的并非稳定成本,而是一张张不可预估、价格不菲的账单。
咨询机构Gartner预测,到2028年,AI编程成本将超过一名普通开发者的平均年薪。更令人担忧的是,Gartner调查显示,四分之三的高管预计今年技术预算将增长,其中近半数预期将实现两位数增幅。成本与预算同步攀升,但关键在于:涨幅是否能跑赢回报?
这听起来有些夸张,对吧?但更核心的问题是:是否每一分Token都要投入最昂贵的模型?
答案显然是否定的。飙升的Token账单迫使企业重新审视每一笔AI支出。微软CEO萨蒂亚·纳德拉和网络安全公司Palo Alto Networks的CEO尼科什·阿罗拉等科技巨头高管最近纷纷表态:更小、更便宜的模型完全能够满足企业大部分需求。换言之,杀鸡焉用牛刀。
企业软件公司Atlassian便是典型案例。他们为每位员工在固定周期内设定了Token使用上限,若员工认为不足,需提交申请并经经理审批。CEO迈克·坎农-布鲁克斯一针见血地指出:“许多公司直接选择最贵的模型并随心所欲地使用,这种做法极为危险,因为它会养成非常糟糕的习惯。”
因此,企业开始转向OpenRouter等AI市场平台进行“精打细算”。简单任务交由性价比高的系统处理,而编程等复杂任务才动用高端模型。开源模型成为降低AI成本的关键武器。有趣的是,OpenRouter上目前最受欢迎的四个模型全部来自中国,其中DeepSeek位居榜首。
硅谷AI搜索初创公司Perplexity的CEO阿拉文德·斯里尼瓦斯直言不讳:“如果开源模型在90%的场景下能完成任务,且成本远低于前沿模型,那我就会选择它。”他补充说,前沿智能的未来依然可期,但企业不会再像过去几个月那样不计代价地投入。最终,能将Token消耗转化为最大经济价值的公司,才能获得最高估值。
帮助企业运行AI模型的WEKA公司首席AI官瓦尔·贝尔科维奇则用了一个形象的比喻来总结:“开源模型以10%的成本实现了90%的效果。我们确实无需在每个环节都支付高昂的Token。”
归根结底,这场“Token狂欢”的降温或许象征着更理性的回归。企业正在学会如何精明地花钱,而非盲目地烧钱。至于那些AI实验室,是继续高歌猛进,还是主动降价抢占市场?好戏还在后头。
