前阵子看到一个惊人数据,不知该说是离谱还是早已在预料之中。

微软某个核心业务部门,为数千名工程师开通了 Claude Code 账号,寄希望于借助 AI 大幅提升开发效率。然而四个月后财务核算账单时发现,全年 AI 算力预算已经耗尽。实际支出超预期三倍以上。既没有审批流程漏洞,也不存在恶意刷量行为。原因很简单:几千人正常使用,且没有设置任何额度上限。
工程圈围绕这一现象展开了多维讨论:有人算架构账,有人谈管理责任。但有一个关键问题几乎没人从技术侧深究:这四个月的预算烧完了,团队的知识库究竟沉淀下了什么?
代码或许留下了一些,但大部分与 AI 的交互并非最终产物,而是过程资产——一段反复调优的 Prompt、一套调试通过后被遗忘的 Skill 配置、一份历经十几轮调整才稳定的 Memory。这些东西都存放在哪?在那个工程师的 Claude 个人账号里。当他离职那天,这些资产便随账号一同消失了。
隐性 AI 知识为何难以成为团队资产?
企业的数字化资产大多有明确的存放位置:代码进 Git,文档进 Confluence,设计稿进 Figma,客户数据进 CRM。每类资产都配有路径、权限和交接流程。
AI 时代的产出物却成了例外。
一位运营同事花了两周调试出一套 Prompt,能将竞品分析时间从三小时压缩到二十分钟。这套 Prompt 在哪?大概率留在她的 AI 工具聊天记录里。一位后端工程师编写了一套 Skill,能自动完成代码审查并输出结构化意见。配置存放在哪?本地某个 JSON 文件中,与项目代码混杂,毫无版本管理可言。还有一位产品经理,花费数月让 AI 记住了团队命名规范、接口风格和用户画像偏好。这套 Memory 是通过上百次对话训练出来的。换人接手后,AI 对这些背景一无所知,Memory 必须从头再来。
换个角度看,这其实是一种知识蒸馏的过程。只不过蒸馏的对象不是模型,而是人。
优秀员工与普通员工的差距,往往不在知识面,而在判断力——知道在什么场景下该用哪个模型、如何编写 Prompt 才能一次命中、怎样编排 Skill 才最高效、采用何种路由策略能在成本与效果间取得最佳平衡。过去这些经验难以提取,因为它们属于隐性知识,藏在大脑里。但如今不同了:员工已将这些经验写进了 Prompt,封装进了 Skill,喂进了 Memory。每一段调优过的指令,本质上都是专业判断的浓缩结晶。
问题在于:这些精心提取的经验产物,团队没能接住。它们留在了个人账号里,沦为私有资产。
AI 调用成本陷入黑箱:看不清,就管不住
如果说产出物无法留存是第一个问题,那么第二个问题是:很多团队根本不清楚钱花在了哪里。
月初充值的额度,月底还剩多少——这是最常见的管理粒度。但哪个项目消耗最大?哪类调用最频繁?是否有人用顶配模型跑简单的文本摘要?通通不清楚。
传统的采购与报销体系,面对「按 Token 计费、调用量按秒波动」的 AI 服务,天然对不上口径。一张月底账单最多显示总数,看不到明细,更无法追踪谁在哪个场景上消耗了哪部分预算。偶尔手工对账还能应付,但当 AI 调用变成日常行为,多个项目、多个模型并发运行时,手工对账就彻底失效了。
回过头来看微软那个案例,「没设额度上限」只是表象。更深层的问题是:消费没有实时跟踪,成本无法归因到使用者和业务场景,预算消耗速度无人能提前感知。等财务拉出账单,一切为时已晚。
在云时代,FinOps 的实践思路已经成熟。以阿里云 AI 网关新上线的 FinOps 能力为例,通过消费者配额将 Token 消耗前置到调用链路中,按使用者、业务线拆分用量,让每一笔消耗都能「看得见、管得住」。这套逻辑在 AI 调用场景下同样适用:在请求发出前带上身份标签,在请求完成瞬间完成记账。拖得越久,信息损失越大,归因就越模糊。
构建企业 AI 资产管理体系:一条技术实现路径
如果要在团队内部搭建这样一套治理机制,技术上需要解决三个层面的问题。
第一层,身份注入。 在调用链路的入口处,需要将使用者身份、所属项目、调用意图等元信息注入请求上下文。这一步可在 API 网关层完成——无论底层模型是阿里云通义千问还是其他 Provider,网关统一签发带身份标签的派生凭证,后续所有环节基于此凭证进行追踪。
第二层,实时计量。 每次调用在返回结果的同时完成 Token 计数和成本估算,写入时序存储。这里的关键设计是将「账单口径」(事后对账)与「估算口径」(实时监控)分开维护。估算口径允许少量误差,但延迟必须控制在秒级;账单口径追求精确,可 T+1 对齐 Provider 的结算数据。
第三层,策略执行。 基于前两层的身份与计量数据,可在调用链路中插入策略点:预算阈值告警、单用户日消耗上限、低成本模型自动降级、异常激增自动熔断。这些策略无需侵入业务代码,作为网关中间件即可实现。
更重要的是,这三层架构天然具备了资产沉淀的基础。当每一次 Prompt 调用、每一次 Skill 编排、每一次 Memory 写入都被记录和归因时,「谁创造了什么、它是否有效、被复用了多少次」就不再是一个需要事后手工收集的问题,而是系统运行的自然产物。
企业为 AI 支付的每一分钱,不应只换来一张月底账单。当 Prompt、Skill、Memory 像代码一样被入库和版本管理,当人走了经验依然留存,当每一笔投入的产出都可追溯、可复用——这才是 AI 时代企业真正需要补齐的那块拼图。
