游乐游手机版
首页/科技数码/文章详情

大模型天价成本高达每月7500美元 Token竞赛转向节流模式

时间:2026-06-20 14:25
企业AI支出从鼓励Token消耗转向严格管控,AT&T、Meta、Uber等巨头纷纷限制AI使用权限。成本压力是主因,高使用强度企业月人均AI支出达7500美元。这一转变催生了AI成本监控与优化工具的需求,微软、Databricks等公司迎来增长机会。

企业AI支出正在经历一场方向性的逆转。回想前两年,不少科技巨头为了激励员工多使用AI、多消耗Token,甚至推出了内部排行榜,比拼谁用得更多、更猛。然而如今风向骤变——AT&T、Meta、Uber、沃尔玛、亚马逊这些Fortune 500巨头,纷纷开始给AI使用戴上“紧箍咒”。曾经备受追捧的“tokenmaxxing”(极限消耗),迅速被“tokenminimizing”(极限节流)取代。一场席卷全球的AI预算管控浪潮,已经全面到来。

从

据The Information报道,AT&T已经开始限制部分员工使用微软旗下GitHub Copilot的权限;Meta则在收紧员工在Anthropic及其他AI服务商上的支出——这与几个月前员工们争相消耗Token的热闹场面,形成了鲜明对比。彭博此前报道,Uber和沃尔玛已经对AI编程工具的使用设置了上限;英国《金融时报》则提到,亚马逊干脆废除了按AI使用量给员工排名的内部排行榜。

驱动这一转变的核心原因,是成本压力的迅速膨胀。AI使用强度最高的企业,每名员工每月的AI支出已经高达7500美元。即便各模型的单Token价格持续走低,但反复调用模型的智能体工具,让企业AI账单较此前翻了三倍。成本压力已经超出了许多企业的预算承受范围。

这场转变正在重新定义AI市场的受益方。能够帮助企业监控、限制和优化AI支出的“网关”工具与模型路由器需求快速上升。微软、Databricks以及英伟达旗下投资的Factory等公司,正迎来新的增长窗口。软件供应商Palantir和Snowflake,也被视为这一结构性趋势的潜在受益者。

账单触目惊心:成本失控重塑预算逻辑

成本压力的累积并非没有先兆。Uber是迄今最极端的案例——2026年4月,该公司就已经耗尽了全年的AI编程预算。目前,Uber将每位员工每款工具的月度使用上限调整为1500美元。沃尔玛则对其内部AI智能体的使用设置了上限;亚马逊发现员工为争夺排名而大量消耗算力、推高成本后,直接废除了相关排行榜。

即便在个人层面,成本消耗也令人侧目。微软发现,部分工程师每月仅在Claude Code上消耗的Token费用就高达500至2000美元。

问题的根源在于,智能体工具的普及从结构上改变了Token的消耗模式。与用户手动发送单条指令不同,这类工具在完成一项任务的过程中会反复自动调用模型,大幅推高实际用量。这使得即便单Token价格持续下降,企业整体账单依然居高不下。

反应分化:踩刹车还是继续踩油门?

并非所有企业都选择收紧。Box首席执行官Aaron Levie对此颇为自得:“我们从未庆祝过tokenmaxxing。我们没有排行榜,所以我们没有走偏——没有去激励错误的行为。”

与此形成对比的是Databricks。该公司工程领域负责人Nikita Shamgunov上周在Nebius举办的活动上表示,Databricks对工程师的AI预算不设上限,“因此tokenmaxxing依然存在”。这一立场折射出一种观点:对于相信自身员工能够高效利用AI的企业而言,限制使用未必合算。

这一分歧揭示了Token节流政策内在的张力:控制使用量固然能压降成本,但也可能同步削减AI原本承诺带来的生产率提升——而后者恰恰是企业当初为这笔支出所作的主要辩护理由。

基础设施受益:成本管控工具迎来结构性需求

“Token节流”浪潮的另一面,是对成本管控基础设施的结构性需求上升。

越来越多的企业正将简单任务从高价前沿模型迁移至更廉价或开源的替代模型,以在不削减实际使用量的前提下控制成本。Palantir和Box的高管均表示,来自企业客户的此类需求正在快速增长。

基础设施层供应商正迅速填补这一空白。微软和Databricks已分别推出“网关”工具,可帮助企业监控员工的AI使用并实施支出上限。英伟达旗下投资、估值15亿美元的AI软件开发公司Factory,则于本月初发布了新款模型路由器,旨在将低复杂度任务自动分配给成本更低的模型。

微软首席执行官Satya Nadella在上周末于X平台发布的一篇文章中,对上述趋势有所呼应,主张AI模型应当像可随时替换的商品一样运作。他写道:“我们任何人都不希望看到这样一个世界——每家公司在每个行业都将价值拱手让给少数几个‘通吃一切’的模型。”值得关注的是,这一表态出自一位旗下生产力软件正面临Anthropic和OpenAI竞争压力的科技巨头掌门人,其背后的战略意图同样耐人寻味。

微软两面作战:推出新定价,却主打“成本可控”

在积极呼应客户降本诉求的同时,微软本周揭示了新旗舰AI产品Copilot Cowork的定价结构,其计费逻辑与Anthropic此前推出的模式高度相似。

Copilot Cowork主要依托Anthropic的模型,旨在微软Office 365软件内自动完成复杂的多步骤任务——例如,用户可将一批收据截图发送给该工具,由其自动生成包含相应费用信息的电子表格。这远超现有365 Copilot所能处理的基础任务(如汇总邮件或在Excel中建立财务模型)的范畴。

定价方面,用户须先持有月费起价30美元的365 Copilot授权,再按照Copilot Cowork的实际使用量额外付费。这一“座位费+消耗量”组合计费模式,与Anthropic今年早些时候向企业客户推出的收费方式如出一辙。

面对企业客户对AI成本飙升的普遍担忧,微软执行副总裁Charles Lamanna在周二的博客文章中表示,客户“可以选择管控成本的方式”,包括为员工设置Copilot Cowork的使用上限。与此同时,微软还预告了允许客户将Copilot Cowork中的Anthropic模型替换为来自OpenAI或微软自身的其他模型的功能,声称可在相近效果下实现更低成本;据一位知情员工透露,微软还在测试可在部分场景下替换Anthropic模型的开源模型选项。上述布局表明,在“Token节流”时代,如何在维持产品竞争力的同时缓解客户的成本焦虑,已成为企业软件市场新一轮竞争的核心命题。

来源:https://www.163.com/dy/article/KVQGV3JE05198NMR.html
上一篇筑基AI4S借助摩尔线程全功能GPU加速中国生命科学自主生态 下一篇深圳打造全球具身智能高地的路径与行动重点
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。