企业很快会意识到,投入在AI编程Token上的费用,或将与支付给开发者的薪资水平相差无几。

这绝非危言耸听。Gartner最新研究指出,未来两年内,企业在AI编程Token方面的支出,有望达到甚至超过全球软件工程师的月均薪资——这里以全球月均2000美元作为基准来衡量。
为何会形成这种局面?一方面,开发者正大规模拥抱生成式AI与智能体工具,用量自然随之攀升;另一方面,供应商同样面临压力——基础设施投入巨大,为维持盈利,他们不得不从以往按席位收取固定费用的SaaS模式,转向按实际消耗量计费。换言之,过去购买若干席位后费用固定;如今,开发者使用Token就像驾驶跑车耗油,每踩一脚油门都在烧钱。
Gartner高级首席分析师Nitish Tyagi打了个比方:全球月均2000美元仅是平均值,在美国,开发者年薪可达六位数甚至更高,但这并不意味着Token成本就能让人放心。他透露:“我听到过令人心惊的数字,比如‘我的开发者上个月消耗了2万美元’,或者‘一个业务用户花掉了3.2万美元’。”这些数字本身就是警示——若不对Token成本加以管控,后果将十分严峻。
问题在于,众多企业正从AI试水阶段快速转向大规模部署编程智能体,却严重低估了Token带来的账单。软件工程工作负载的成本结构极不稳定,而Token消耗的计算与计费方式又缺乏透明度。供应商目前尚未推出成熟的内置成本优化工具,反而可能因持续扩展模型能力、维持自身盈利而进一步涨价。
于是,企业陷入成本预测与控制的困境:AI发展太快,多数组织来不及建立可靠的ROI评估框架;智能体驱动的工作流难以治理,上下文窗口不断拉长,预算提前耗尽,Token支出的合理性越来越难解释。更不用说那些非开发者的轻度用户——随着他们对AI工具的熟悉甚至依赖,其用量也在持续增长,进一步推高总支出。
那么,Token消耗越多就一定带来更高生产力吗?Tyagi给出了否定答案:大量Token消耗与生产力提升之间没有直接关联。相反,运用上下文工程原则来优化甚至削减Token消耗,才能真正提升质量。“优化Token消耗才是提升生产力的关键,而非盲目堆量。”他说。
当然,这绝不意味着企业应该放弃AI编程智能体。优化的本意是在不牺牲AI带来的质量和价值的前提下按需使用。Tyagi强调:“若不建立受治理约束的工程运营模式,成本增速很可能超过这些工具本应带来的生产力提升。”
当AI几乎能瞬间生成一个完整的Python库时,传统的“代码行数”指标早已过时。Gartner认为,应转向质量、交付速度和用户满意度来度量价值。例如,开发者交付重要功能的速度是否加快?从应用开发到业务、产品和开发团队反馈之间的周期缩短了多少?在保证质量的前提下快速交付本身就是竞争优势,能直接提升用户体验。
具体如何落地?Gartner给出了一套组合拳:
- 建立治理机制:设定Token使用上限,自动监控用量,设置超额预警。将这些管控措施嵌入工程工作流程,才能防止成本失控。
- 场景驱动决策:明确哪些任务适合AI编程智能体,以及赋予它多大自主程度。把任务划分为“开发者主导”、“开发者协同智能体”和“完全智能体主导”三种模式,按需选择。
- 按复杂度选模型:将任务拆解为可由小模型处理的子任务,仅在确有复杂需求时升级到大模型。简单高频的任务交给小模型,前沿大模型仅用于高价值复杂工作。
- 推行上下文工程规范:培训开发者精简输入给AI的信息,只保留相关内容,尽量摘要,剔除冗余数据。这是一项需要刻意练习的技能。
- Token用量审查常态化:把Token用量纳入开发周期,定期审视高消耗工作流,发现效率瓶颈,优化实践。
Tyagi特别提醒:开发者天然追求速度和便利,很少主动考虑成本效率。因此,Token管控不能完全依赖个人自律,领导层必须从机制上兜底。
最后,他对企业领导者的建议是:别因AI编程成本上涨就彻底放弃,或者一股脑转向开源模型。目标始终是“在不损害价值的前提下优化成本”。从小处入手,优先关注上下文工程;评估当前软件工程成熟度,选择合适的智能体自主程度。AI辅助开发最高可带来20%的生产力提升——这已是相当可观的数据。
对于开发者,他的建议同样直接:“把上下文工程作为最重要的个人技能来修炼。这不仅对雇主有利,对你的职业发展更是如此。”
Q&A
Q1:AI编程的Token成本为何会快速上涨,涨到什么程度?
A:根据Gartner预测,企业在开发者AI Token使用上的支出,将在未来两年内达到甚至超过软件工程师的月均薪资(以全球月均2000美元为基准)。成本上涨的原因包括:生成式AI和智能体工具的广泛采用、供应商从固定席位授权转向消费量计费模式,以及供应商持续扩展模型能力推高定价等。
Q2:企业应该如何控制AI编程的Token费用?
A:Gartner建议从多个层面入手:一是建立治理机制,设定Token使用上限、自动监控用量并设立超额预警;二是构建场景驱动的决策框架,明确什么任务用什么模型,简单任务用小模型,复杂任务才动用前沿大模型;三是强制推行上下文工程规范,让开发者学会精简输入信息;四是将Token用量审查纳入常规开发周期,定期优化高消耗流程。
Q3:Token消耗越多,开发者生产力就越高吗?
A:并非如此。Gartner分析师Tyagi明确指出,Token消耗量与生产力提升之间并不存在直接关联。一味追求大量Token消耗并不能带来更高效率,真正有效的做法是通过上下文工程优化Token的使用质量,在不影响AI输出价值的前提下减少不必要的消耗,从而实现成本与效率的双赢。
