在6月16日举办的“高质量Token服务研讨会”上,全国首个Token服务性能监测平台正式亮相。该平台由中国信通院牵头建设,具备实时覆盖国内外30多个平台、上百款大模型Token服务的能力,并针对调用成功率、输出速度(TPS)、首词时延(TTFT)等数十项核心指标,每日在不同时段、不同地点进行持续性监测。

这个平台的价值何在?简而言之,它能为企业应用提供选型参考——哪家Token服务既快速又稳定,通过监测一目了然;同时为Token服务商提供性能标尺,推动其持续优化;还能为政府机构提供平台部署与监测服务,堪称一套“三位一体”的基础设施。
先看几组数据,感受国内Token服务的增长态势。截至2026年3月,我国日均Token调用量已突破140万亿次。聚焦公有云企业级市场:据中国信通院监测,2025年我国公有云企业级Token调用量达到2000万亿,相较IDC公布的2024年114万亿,增长超16倍;而2026年第一季度的预测值同样约为2000万亿——单季度规模几乎与2025年全年持平。
量在激增,质又如何?中国信通院人工智能研究所所长魏凯提出重要观点:全球领先的开源模型与闭源模型之间的智能差距正在收窄,但不同模型输出的Token“智能含金量”差异显著。换言之,Token数量多并不代表模型能力强,关键在于模型自身的智能水平——这才是Token高质量发展的核心基础。业界对Token服务的关注焦点,已从单纯的“调用量”转向“高质量”。
所谓“高质量”,并非仅指速度快、成本低。魏凯进一步指出,其维度还包括用户体验、绿色能耗、应用价值等。不同业务场景需要匹配不同的Token服务。提升Token服务性价比,本质上是一项多维度平衡的艺术。
下一步,该监测平台将推动行业完善能力评价体系、强化性能监测、健全安全保障、提升运营效能。目标明确:真正释放Token服务的技术价值、产业价值和经济价值。
原标题:《全国首个Token服务性能监测平台发布》
