2026年,AI发展如何重塑“Token经济学”的计算账本?

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
"Token"正在成为AI行业最热的词。近日召开的2026中关村论坛年会上,Kimi创始人兼CEO杨植麟、智谱CEO张鹏的话题绕不开它。杨植麟将Token定义为未来的GDP,张鹏直言"Token长期靠低价竞争不利于行业发展"。1000多公里外,腾讯高级执行副总裁汤道生和副总裁李强也分别谈及Token,前者称"同样模型能力下,不同的Harness(脚手架)设计,Token成本相差很大",后者认为Token切换很容易,黏性弱、补贴一停客户很容易流失。当OpenClaw(网友昵称"龙虾")们让Token消耗呈指数级爆发,Token不再只是技术名词,而是关乎商业模式的关键变量。
Token"烧穿"成本
龙虾掀起的智能体热潮,让Token消耗量呈指数级爆发。Token是什么?国家数据局的定义是AI大模型处理信息的最小单元,Token可计量、可定价、可交易。
百度千帆平台产品负责人张婷向北京商报记者解释,"它既不完全等于一个字,也不完全等于一个词,而是介于两者之间的一种‘语言碎片’。比如汉字‘我’是一个Token,‘今天’可能是一个Token,但‘国际化’可能被拆成‘国际’和‘化’两个Token。因为大模型面对的语言是全球性的,Token是一种通用的‘最大公约数’,让模型可以用统一的方式处理所有语言和符号"。
根据国家数据局消息,2024年初,中国日均Token调用量为1000亿;至2025年底,跃升至100万亿;2026年3月,已突破140万亿,两年增长超千倍。
云厂商与AI大模型企业的反应从2月开始,智谱取消对GLM Coding Plan的首购优惠,套餐价格整体涨幅30%起。3月上旬,腾讯云已上调两款自研模型价格,其中Tencent HY2.0 Instruct模型涨幅达463%,下旬阿里云、百度智能云同日宣布AI算力涨价,最高涨幅34%。
对于智能体火爆到Token消耗增长的逻辑链路,张鹏近日做了详细解释:Agent在面临复杂任务时,模型思考的链路很长,Token消耗量非常大,模型推理的成本也相应的提高,因此把Token的价格回归到正常的商业价值。长期靠低价竞争也不利于整个行业的发展。
在接受北京商报记者等媒体采访时,李强表示,"Token的经济性很快也会被所有的客户关注到,如果只考虑消耗量不考虑经济性,可能你在用户端的价格或成本会更高,这将对公司的长远健康发展带来负面的影响"。
Harness"脚手架"藏在水面下
Token到底是怎样定价的?张婷向北京商报记者举例拆解,"比如‘今天北京天气怎么样’,加上AI的回答,大概消耗50—100个Token。你让AI写一篇800字的作文,算上你的提示词和完整输出,大概消耗1000—1500个Token"。
"换算成钱:目前百度千帆平台上主流模型的价格,每百万Token几毛钱的水平。也就是说,1块钱可以让AI写大约1000篇800字作文。"张婷表示。
但当Token消耗量以指数级增长,一个更深层的问题浮出水面:这些Token并非都花在了"刀刃"上。"Token像汽油,Agent像汽车引擎。如果只关注油耗,不关注引擎的经济性和输出能力,客户最终也会舍弃。"李强用油耗来解读Token的效率。
Nextie(明日新程)创始人、"小冰之父"李笛也向北京商报记者表示,"Token消耗热指向了一个有趣的现象:Tokenmaxxing(即Token刷量大赛),现在很多开发者和公司在疯狂刷高Token消耗量,甚至将其视为一种‘算力肌肉’的展示。但这种无节制的燃烧会带来巨大的ROI(投资回报率)失衡"。
在以上背景下,另一个概念Harness在硅谷和国内技术圈快速出圈。
李笛向北京商报记者详细解释,Harness的直译是"马具"或"缰绳"。如果说大模型是一匹力大无穷但方向不定的野马,Harness就是那套能让它在既定轨道上奔跑的约束系统。
"AI落地不只是算法题,更是工程题,"汤道生抛出这个判断,"在同样的模型能力下,不同的脚手架或Harness的设计,比如给模型调用什么工具、有层次的上下文工程、长记忆的管理、工作流的实现等,都对实际使用效果与Token成本有很大的影响。"
小米MiMo大模型负责人罗福莉在解读OpenClaw价值时也提到这个名词,"OpenClaw把国内那些‘次闭源’水平模型的上限拉得很高,同时可以靠一套Harness(约束控制体系)等诸多设计,保证模型的任务完成度和准确率,把下限保证得很好"。
云厂商重造"地基"
具体到工程层面,腾讯云智能体开发平台ADP,通过RAG(检索增强生成)、知识库等能力给智能体连接上"图书馆",让行业专家永远在线。然后是Claw跑在Agent Runtime的安全沙箱:Claw作为智能系统的神经中枢,通过从技能库发现与下载Skills,不断学习与积累连接外部系统的能力,借助大模型来对外收发指令,触发行动;AgentRuntime的沙箱方案还能用于大模型强化学习的程序结果验证,提升强化学习的训练效率。
这只是基础设施的冰山一角。
"算力的尽头可能就是电力。"李强在采访中透露,腾讯两年前开始探索算电协同,"与合作伙伴在内蒙古利用当地的风电和光储直接为数据中心供电,结合氢能和储能平衡清洁能源的波峰波谷,同时协调算力的高峰期与低谷期,一方面大幅度降低用电成本,另一方面降低碳排放。"
另一层的变化发生在调度机制。"当前云计算时代的基础设施是为服务人类工程师设计的,而不是为AI设计的。长远来看,基础设施应该是一个整体,这一整套应该能够自我进化、自我迭代,能够形成一个自主的组织,相当于整套基础设施由一个被认可的CEO来管理,它可能是一个Claw,根据它的AI客户需求,自主迭代自己的基础设施",无问芯穹联合创始人兼CEO夏立雪解释道。
值得注意的是,目前头部云厂商拥有双重身份,阿里云、腾讯云、百度智能云都既是Token供给方,也是Token消耗方。
根据阿里云最近公布的目标,未来五年,云和AI商业化年收入将突破1000亿美元。同时,阿里集团向员工提供Token额度,鼓励员工在工作中使用先进的AI模型与工具。
李强称,"Token肯定是腾讯云非常重要的管理指标之一,但没有把Token放在最高优先级,且用极端奖励政策来推动,腾讯更愿意把精力放在研发更好的引擎上,通过提供好用的AI产品产生真实的Token消耗"。2025年腾讯云实现规模化盈利,"2026年我们不想太激进",李强直言。
当140万亿Token冲击产业,又一轮较量已经开始。
北京商报记者 魏蔚
相关攻略
"Token "正在成为AI行业最热的词。近日召开的2026中关村论坛年会上,Kimi创始人兼CEO杨植麟、智谱CEO张鹏的话题绕不开它。杨植麟将Token定义为未来的GDP,张鹏直言 "Token长期
本报(chinatimes net cn)记者石飞月 北京报道从智能体到OpenClaw式智能体,人工智能对人类的影响将达到何种程度?人工智能发展的下个阶段是什么?近日,在2026中国科幻大会上,3
当具身智能走过“量产元年”,接下来该往何处去?2026中关村论坛年会上,几家估值百亿的具身智能企业“掌门人”同台,展开了一场名为《百亿具身智能对话》的圆桌交流。银河通用创始人王鹤作为对话主持人,接连
人工智能(AI)无疑是当下最能提起人们兴趣的话题之一,当AI圈的明星人物齐聚一堂,便自然而然成为聚光灯的焦点。2026年中关村论坛年会一场AI主题论坛上,座无虚席,甚至会场边上都挤满了站着的听众。舞
田晏林 发自 凹非寺量子位 | 公众号 QbitAI春分之后的北京海淀,暖意至,万物生。人工智能产业的发展更是如火如荼。过去五天里,位于“宇宙中心”五道口的AI原点社区,30多场派对狂欢不停。这是在
热门专题
热门推荐
3月30日消息,今晚除了手机之外,vivo还发布了全新的旗舰平板——vivo Pad6 Pro。行业首发13 2英寸4K原彩屏,分辨率3840×2160,347PPI,支持1-144Hz LTPS自
WPS表格中提取括号内容有四种方法:一、单对英文小括号用FIND+MID;二、中英文括号通用需SUBSTITUTE预处理;三、多对括号取最后一对需REVERSESTRING反向查找
3月30日,南京新街口核心商圈,苏豪大厦一楼广场上机器人迎宾起舞,充满科技感。由苏豪资产运营集团与南京新街口金融商务区管理委员会(以下简称“新街口管委会”)共同打造的“数智苏豪”新街口OPC社区揭牌
电 动 知 家消 息,近日,据外媒报道,据福特汽车日前发布的一份文件,该公司首席执行 官吉姆·法利2025年的总薪酬大幅增长了11%,达到约2752万美元(约1 9亿元人民币),这是其自2020年末
白宫里,一台人形机器人缓步走入东厅,与美国“第一夫人”并肩亮相,动作仍带着明显的机械感;仅仅一天后,国会山上,这种“会走路的机器”却被划为潜在安全威胁,写进立法提案。这是上周美国上演的荒诞一幕。两党





