AI大模型的调用成本确实在持续走低,然而企业实际使用AI的整体开销却在不断攀升。
这看似矛盾,却恰恰反映了当前Token经济最真实的现状。
以OpenAI公开的价格体系为例:2024年3月GPT-4刚推出时,每百万Token输入费用为30美元、输出费用为60美元;到2024年5月GPT-4o发布时,价格已降至5美元和15美元。如今,大量“够用级”推理模型更是将每百万Token的价格压至几毛美元甚至更低。
若以早期GPT-4的价格作为基准,部分通用推理Token的成本在三年内最高降幅达到99%。
正是基于这一趋势,过去两年业内普遍流行一种观点:大模型将像带宽一样,越用越便宜。
进入2026年,这一判断只正确了一半。确实,部分模型Token的单价变便宜了,但企业的AI运营总支出并未随之缩减。
背后的逻辑并不复杂:通用Token的单价的确在持续下探,但企业自身也在从“简单问答”向Agent协作、代码生成等复杂工作流转型。这类任务的Token消耗量往往是简单问答的十倍甚至百倍。单价降低了,使用量却激增,算力的总投入自然随之大幅增长。
于是便形成了一个有趣的现象——价格撕裂期:通用Token价格不断下探,高价值能力出现分层,而企业的AI支出在调用结构中猛烈膨胀。
不过,这种增长并非平均分配,而是沿着芯片、光模块、云平台直至应用等产业链环节进行重新分配。从投资视角看,这种价格分裂的实质,正是产业利润的再分配。谁掌握了稀缺资源、关键能力和高粘性场景,谁就更有可能在Token用量爆发中持续获得收益。
