降价的尽头是一度电的账_AI热点日报

AI进入算账阶段，Token成本取决于电力、数据中心选址等系统工程。乌兰察布因电价低、气候冷、近北京成为优势。降本方向包括使用国内模型、提高每度电产出Token数、模型组合及Prompt管理。Token需求长期增长，Coding与视频是主要场景，国产算力需生态闭环。

AI 开始进入算账阶段

过去一年，模型厂商的价格战打得异常激烈，DeepSeek、通义千问、智谱、MiniMax 等国产大模型，将大模型调用价格拉至全新区间。表面上看，Token 单价是模型厂商之间的竞争结果。但若深入底层，每一个 Token 背后都串联着一条从电力、土地、机柜、制冷、网络、存储、GPU 调度到企业实际应用场景的长链条。

优刻得董事长兼 CEO 季昕华在访谈中指出，如今企业老板最关心的问题大致有三件：第一，如何让员工真正用上、用好 AI；第二，使用一段时间后成本显著上升，如何有效降低 AI 成本；第三，如何切实提升效率。换句话说，企业并非不再使用 AI，而是开始进入“算账”阶段——精细核算 AI 投入产出。

Token 的成本账，远不止 API 标价那么简单。它正演变为一场贯穿“电力—算力—模型—应用—组织”的系统工程，任何环节的优化都可能影响最终成本。

优刻得选择在乌兰察布建设数据中心，最初并非为 AI 布局。

据优刻得副总裁刘杰回忆，2017 年筹划乌兰察布数据中心时，AI 尚未真正爆发。当时主要考虑的是 CPU 业务，首栋楼按 CPU 计划设计，后期才逐步转向 GPU。彼时优刻得的构想是将乌兰察布作为服务北京的“前店后厂”：北京承载用户与业务前台，乌兰察布提供低成本、低时延的数据中心支撑。

选址乌兰察布并非一时冲动。季昕华提到，苹果在国内选择数据中心时，因认可优刻得的技术水平，曾邀请优刻得共同参与选址。团队考察了贵州、四川、重庆、青海、宁夏、甘肃等地，最终发现乌兰察布是建设数据中心的理想地点。

原因十分直接：第一，电价较低；第二，苹果要求 100% 绿电，内蒙古具备实现条件；第三，气候寒冷，利于降低 PUE；第四，距离北京较近，网络时延与人员往来都很便捷。

这些因素在云计算时代已很重要，到了 AI 时代则更加关键。

因为 AI 最终会将所有成本穿透到电力上。季昕华谈到 Token 降本时直言：Token 的终局是电力，电价越低，Token 就越便宜。内蒙古的区域优势正体现在这里。

在现场交流中，刘杰算了一笔账。

“以一台某国外顶级服务器为例，其功耗约 6.5 千瓦，一台服务器通常搭载 8 张 GPU 卡。一个千卡集群大约需要 125 台服务器。仅服务器本身，一年耗电就已相当惊人；再乘上 PUE 系数，才是数据中心实际承担的总用电量。”

这正是数据中心选址、电价、PUE、高功率机柜直接决定 Token 成本的原因。

过去 IDC 行业更关注“机柜数量”，但 AI 时代，“多少个柜子”已无法充分说明问题。优刻得青浦数据中心约 42 亩，设计容量约 5000 个机柜；乌兰察布园区约 212 亩，设计容量约 12000 个机柜。但季昕华和优刻得方面均指出，传统机柜与当下 AI 算力所需的高功率机柜已截然不同。

大模型训练和推理需要更高的功率密度。普通机柜可能无法容纳多台高功耗 GPU 服务器，单机柜的供电能力、散热能力、网络布线、液冷能力，都在重新定义数据中心的实际价值。现场交流提到，液冷单机柜最高可做到 35 千瓦，这需要专门的电路和散热系统改造。

如何真正降低 Token 成本？

这也解释了为何部分传统低功率数据中心出现空置，而高功率数据中心反而供不应求。

季昕华指出，国内一些原有低功率数据中心空闲率较高，但像优刻得这样的高功率数据中心，尚未动工就已收到订单。新建数据中心根据前几栋楼的情况和市场需求判断，满载率预计很高，且已有部分签约订单。

数据中心的成本竞争，正从“有没有楼”转向“能否承载 AI 算力”。

乌兰察布的优势不仅在于电价便宜。

这里海拔较高，年均温度低，天然有利于制冷。PUE（能源使用效率）是数据中心的核心指标。简单来说，数据中心总用电中，用于服务器计算的比例越高，PUE 越低，能源利用效率越优。低温环境能降低制冷能耗，使 PUE 更容易优化。

此外，乌兰察布区域的能源结构相对稳定，包含风电、光电与煤电，供电更可靠。对于 AI 数据中心而言，便宜电固然重要，稳定电力同样关键。

GPU 集群不怕价格略高，怕的是中断和不稳定。训练任务一旦中断，损失的不仅是电费，还有时间、算力窗口和客户信任。

因此，Token 降本的第一层答案，是选对地点：压低电力成本，降低 PUE，建好高功率机柜。

但这只是起点。

季昕华在探讨如何降低 Token 成本时，给出了几个明确方向。

第一个方向，是采用国产模型。相较于海外模型，DeepSeek 等国内模型在价格上具有明显优势，智谱、MiniMax 等客户和模型厂商也在持续提升能力。对于多数企业应用，并非所有任务都需要调用最贵、最强的模型。一个 85 分的模型在某些任务上固然更好，但一个 80 分的模型若也能完成任务且成本更低，则成为更务实的选择。

第二个方向，是从技术层面提高“每度电产生的 Token 数量”。这句话将 AI 成本问题重新拉回基础设施效率。过去大家习惯讨论每百万 Token 的单价，但决定长期成本的关键，是每度电最终能转化成多少有效 Token。GPU 利用率、推理框架、模型部署、网络通信、存储读写等因素均会影响这一指标。

第三个方向，是选择合适的数据中心位置。内蒙古这类电力气候条件优越的地区，能在底层成本上形成优势。乌兰察布更适合训练以及覆盖北方大部分推理需求；而上海的青浦则适合华东地区对时延敏感的业务，如金融、汽车等场景，也适合部分推理任务。这恰好对应“东数西算”的分工逻辑：并非所有算力都必须靠近用户，也非所有算力都适合放在西部，而应按任务类型拆分。

第四个方向，是模型组合策略。季昕华提到，不同模型的能力边界各异，企业不应指望用一个模型解决所有问题。例如，有的模型适合前端代码，有的适合后端，有的适合测试，有的适合需求分析或写作。未来更合理的方式，是将一个任务拆解，让不同模型处理各自擅长的部分，甚至由平台自动为用户选择模型。

这一点至关重要。因为 AI 降本并不等同于一味调用便宜模型，而是在“效果”与“成本”之间实现动态路由。一个复杂任务中，真正需要顶级模型处理的部分可能只有 20%，其余部分可以交给更便宜、更快的模型完成。这才是企业级 AI 应用的真实降本路径。

第五个方向，是 Prompt 管理与 Prompt Engineering。许多企业一边抱怨 AI 成本高，一边未建立内部使用规范。员工如何提问、调用什么模型、是否复用模板、是否重复调用、是否将简单问题交给高价模型，这些都会影响 Token 消耗。季昕华强调，让员工按照一定规则用好 Token，同样是降本的重要手段。

这便将问题从基础设施层面推进到组织管理层面。

企业真正的挑战不是“有没有 AI”，而是“花出去的 AI 成本是否产生了实际价值”。

季昕华谈到，优刻得内部每天都会查看 AI 使用报告，包括多少员工使用了 AI、花费多少、用于什么场景。Coding 是使用量最大的场景，查询、PPT 等场景也在增长。但他也承认，目前最大的难题，是如何衡量这些投入究竟带来了多少产出。

这可能是所有企业都无法回避的问题。

AI 工具铺开后，会出现三类情况：第一，许多员工仍在摸索如何使用，效果尚不稳定；第二，部分调用并非用于公司业务，而是个人行为；第三，真正用于工作的部分，效率提升多少尚待评估。季昕华提到，优刻得正在开发一款产品，帮助企业分析员工使用 AI 是否服务于公司工作，以及使用效率的高低。

Token 需求不会只是一次热闹

这实际上是 Token 时代企业管理的新命题。

SaaS 时代，企业购买软件通常按账号、席位、模块付费。员工越活跃，往往意味着软件价值越高。但 AI 不同：用得越多，成本越高。如果企业没有治理体系，老板推动 AI 后很快会陷入尴尬局面——感觉效率提升不明显，但账单却多了一大块。

因此，便宜 Token 的另一面，不是无限调用，而是 Token 治理。

这也是为什么季昕华将“如何让老板或管理干部评估 Token 带来的效益”视为当前最大的挑战之一。

AI 真正进入企业，不仅是技术升级，还会倒逼生产关系调整。

未来组织中，高层更需要回答“做什么”和“为什么做”，AI 更多解决“怎么做”，中间还需要懂业务、懂架构的人来驾驭 AI，避免 AI 在执行中偏离方向。

他甚至谈到，AI 时代的人才观也会变化。过去企业招聘更看重经验，但有了 AI 之后，学习一门新技术的门槛降低了。主动性、好奇心、自我反思能力、业务理解，可能变得比单纯经验更重要。因为 AI 每天都在变化，真正稀缺的不再只是“会不会写代码”，而是能否判断问题、拆解任务、驾驭工具，并将 AI 产出落地到业务结果上。

这也解释了为什么 Token 需求不会只是一次短暂的热闹。

对于算力需求是否长期持续，季昕华给出了明确判断：Token 增长是长期趋势。年初某些现象级智能体应用带动了普通用户快速体验 AI，但即便热点退去，Token 量仍在快速增长。

原因在于，AI 能力本身在提升，尤其是 Coding 能力已让 AI 真正进入“干活”阶段；视频、图片模型为短剧、漫剧等内容生产释放了大量需求；广告营销、市场推广、财务、HR 等企业内部岗位也开始使用 AI；此外，录音转会议纪要、智能眼镜、智能戒指等 AI 硬件，也在持续消耗 Token。

这几个需求来源有一个共同点：它们不是单次尝鲜，而是工作流、内容流和硬件入口的持续消耗。

其中，Coding 是最明确的增长场景。AI 写代码能力提高后，企业内部研发效率和工作方式发生变化。后端工程师可借助 AI 快速写前端，测试和运维边界被打通，非研发人员也可用 AI 完成部分过去无法独立完成的工作。

图像、视频、漫画、短剧则是另一类消耗大户。生成式内容的特点是计算密集、调用频繁、结果需要反复调整，天然会产生大量 Token 和算力需求。

再往外看，AI 硬件将调用入口从电脑和手机扩展到录音设备、眼镜、汽车、戒指等终端，一旦硬件入口真正铺开，算力需求会更加碎片化、常态化。

这也正是优刻得判断高功率数据中心会持续供不应求的原因。

AI 发展最大瓶颈：物理基础设施跟不上

季昕华将当前国内外瓶颈做了区分：国内最大问题是缺卡，海外则是缺数据中心。国内 GPU 供应受限，所以首先要找到卡；但有卡之后，还需要高功率数据中心来承载。海外许多区域的算力基础设施远落后于中国，除了美国之外，不少国家当前反而有大量存储需求，如数字城市、视频监控数据存储等。

在国内，基础设施瓶颈主要有三个：卡的瓶颈、数据中心审批与统一管控的挑战，以及旧基础设施上的电和水的挑战。中国不缺电，但电力配套需跟随产业发展。比特世界的需求可呈指数级增长，但物理世界是原子世界，电网、水、机房、设备交付、施工周期都有现实约束。

这句话很适合作为观察 AI 基础设施的底层逻辑：数字需求跑得太快，物理供给跟不上。

而在物理供给里，国产算力也是一个绕不开的话题。

季昕华认为，国产 GPU 近年在国家支持和市场需求引导下，性能提升很快，目前已到“可用状态”，但整体性能与海外高端产品仍有差距。不过，美国限制反而推动国内大模型公司和硬件厂商加快适配，未来效率会越来越高。优刻得方面也提到，客户对国产算力的明确需求更多体现在希望国产算力与模型加速适配。英伟达已形成自成体系的生态，国产算力若要真正崛起，不能只靠单卡参数，而要形成模型、框架、工具链和应用端的生态闭环。

这也意味着，国产算力降本不是简单替代英伟达，而是模型和硬件共同适配后的系统优化。

从这个角度看，AI 基础设施的瓶颈总是在移动。

季昕华在回答“运力”问题时，给出了很好的解释：Token 生产由众多组件共同完成。最初可能觉得 GPU 不够，于是先提升 GPU；GPU 提升后，发现内存成为瓶颈；内存做大后，又发现卡与卡之间的网络连接成为瓶颈，于是光通信、互联技术开始重要；网络解决后，CPU 调度又跟不上；再往后，不同机器之间、不同机房之间的连接又会成为新挑战。

因此，整个系统的工作，就是不断找到瓶颈点、突破瓶颈点，然后迎接下一个瓶颈点。主要矛盾解决之后，次要矛盾就会变成新的主要矛盾。

这其实是 AI 基础设施行业最真实的一面：它不是单点技术革命，而是连续的系统调优。

比如跨数据中心推理。季昕华提到，一些算法正在尝试不在同一个数据中心也能实现跨数据中心推理调度，从而将分散算力利用起来，但新的瓶颈会变成不同机房之间的带宽和网络延迟。训练目前还不太适合这样做，但推理有机会。

又比如分布式推理。目前最大的瓶颈不在时延，而在算力资源不足。生图几秒返回、生视频几十秒返回，大多数用户可以接受。反而如果将算力分散到各地，可能导致资源浪费：某个城市节点只有 70% 或 80% 使用率，空闲资源却无法被其他地方共享。

所以当前主流仍然是集中式。未来更可能在边缘侧做缓存，有点像 CDN，通过“以存代算”减少重复计算。例如多个用户询问同一个天气问题，答案相同，就不必每次重新推理，可直接从本地缓存返回。但这套模式还没有完全收敛。

这说明，AI 推理并不会简单复制互联网时代的边缘计算路径。它既要考虑时延，也要考虑算力利用率。当前算力仍然稀缺，将资源集中起来，往往比过早分散更经济。

做中立的 Token 供应商

优刻得在这里找到的定位，是做一个中立的算力和模型服务平台。

季昕华说，优刻得今天已不只是传统意义上的云计算公司，而是扩展成一家数字化公司，云、大数据和算力是技术手段。面对 AI 时代，其目标是发挥中立性质，帮助大家更好地用好 AI，也帮助 AI 公司实现发展。

中立性过去是优刻得面向游戏、电商等行业客户的标签。游戏公司可能不愿用腾讯云，电商公司可能顾虑阿里云，因为它们与平台本身存在业务竞争。到了 AI 时代，这种中立性被重新放大。

阿里有通义千问，腾讯有混元，字节有豆包，对创业型大模型公司来说，选择一家相对中立的第三方云厂商，更容易获得资源支持，也能减少潜在竞争顾虑。

季昕华还提到，优刻得在 Token 层面也可以保持中立，可接入多个 Token 来源，为客户选择最合适的 Token。

从客户结构看，优刻得面对的算力需求主要来自几类：第一类是基础模型公司，如智谱、MiniMax、DeepSeek 等，需要大量卡做训练和推理；第二类是行业模型公司，如金融、证券等拥有自身数据的公司，需在基础模型上训练行业模型；第三类是手机、汽车等智能终端；第四类是各类应用场景；第五类是科学计算。

这些客户未必都有能力自建大规模数据中心，也未必能从巨头那里获得足够细致的资源和技术支持。优刻得的差异化在于，不仅提供机柜和云主机，还试图提供从数据中心、高功率机柜、GPU 算力、模型部署、Token 计费到企业 AI 使用治理的一揽子能力。

这条路并不轻松。

AI 基础设施本质上仍是重资产。数据中心建设需要土地、楼宇、机电、UPS、柴发、制冷、液冷和高功率机柜；GPU 和 AI 服务器价格仍在波动；客户希望成本下降，但上游设备并不便宜。现场交流中提到，硬件价格上涨很快，但终端客户拿到的算力租赁价格并未同步上涨，中间压力需要云厂商和算力服务商消化。

同时，数据中心标准也需要调整。季昕华指出，现有数据中心标准已落后于 AI 行业发展。如今许多高等级标准要求双路供电、两路 UPS、两路柴发等冗余设计，但并非所有 AI 产品都需要如此高标准。未来不同业务可能需要更精细化的数据中心标准，而不是所有负载都按最高标准建设。

这也意味着，AI 基础设施的降本不只是“压价格”，还包括重新定义什么业务需要什么等级的基础设施。

比如训练任务对稳定性要求极高，但部分推理任务对冗余要求可能没那么高；金融和汽车等敏感业务适合放在青浦等靠近客户的区域，普通推理和训练任务则可放在乌兰察布这类电力成本更优的区域。任务分层、资源分层、模型分层，都会成为未来 Token 降本的一部分。

因此，Token 价格战背后的真实战场，已经从模型 API 页面，转移到了电力、数据中心和算力系统深处。

当企业真正开始将 AI 融入代码、营销、财务、HR、会议纪要、智能硬件和行业模型，Token 就不再是技术圈内的抽象单位，而会变成企业账本上的真实支出。

而谁能将一度电更高比例地转化为有效算力，把一张 GPU 跑出更多有效 Token，把不同模型组合成更低成本的工作流，把员工的 AI 使用变成可衡量的业务产出，谁才有机会在下一轮 AI 基础设施竞争中留在牌桌上。

Token 便宜的尽头，不只是模型降价。

是电力，是算力，是工程能力，也是企业重新学会怎么用 AI。