DeepSeek V4 API调用20亿Token费用揭秘

时间：2026-05-30 10:28

最近一直在打磨RealPLC产品的各个细节，前后试了两套AI方案：Codex和GPT-5 5 High、Claude Code、DeepSeek V4 Pro Flash。Codex用的是Plus方案，额度用完后就切到第二套。这个月几乎每天都在迭代调整。说实话，最大开销不是API费用或订阅费，而是

最近一直在打磨RealPLC产品的各个细节，前后试了两套AI方案：Codex和GPT-5.5 High、Claude Code、DeepSeek V4 Pro/Flash。Codex用的是Plus方案，额度用完后就切到第二套。这个月几乎每天都在迭代调整。

说实话，最大开销不是API费用或订阅费，而是时间。一个地方的改动，很可能把其他地方搞崩。每次调整后docker重启至少要几分钟，来回折腾，时间根本不够用。期间不少朋友催着问内测邀请码，但眼看着要发布了，总因为某个小细节不满意又改一改——优化永无止境，有时候甚至直接重写，这部分损耗巨大。

不过持续优化到现在，方案基本稳定了，前端UI不会再加太多内容，后续主要精力放在服务端的管理和配置上，这背后是大量的工作。简单上线一个网站很容易，但要稳定运行，后台服务的工作量可不小。代码量一旦上了量级，事情就没那么简单了。

这期聊聊DeepSeek V4的费用——毫不夸张，这个月差不多消耗了20亿Tokens。光是API费用，GPT的额度每天都用完。所以RealPLC从诞生起就是AI的产物，也是我们和AI深度结合的综合体。

01

DeepSeek V4费用

之前简单介绍过：DeepSeek V4 Pro跑1个亿Token到底要花多少钱？刚好过去一个月，今天账户欠费了，翻开后台数据，正好和大家分享下具体的使用情况。

总消费：227.27元。具体分配到模型上，这张图不直观。于是把数据导出来，扔给DeepSeek网页端，让它生成一个HTML页面展示——后面详细说。

具体的Tokens分布如下：

大部分用的是Pro：Pro的Tokens约15.5亿，Flash约2.8亿。粗略估算，这个月总共消耗接近20亿。按目前的金额粗算（18亿对应230元），平均1亿Tokens约12元。

02

深度解析

让DeepSeek生成的HTML页面效果不错：

总成本概览

统计周期内，该账号累计调用支出¥227.28元。

deepseek-v4-pro（高精度模型）：¥192.35元，占比84.6%
deepseek-v4-flash（高速轻量模型）：¥34.93元，占比15.4%

Pro模型是绝对的成本主力，日均约¥8.74元；Flash日均仅¥1.59元，适合对实时性要求高、但对成本敏感的任务。

成本构成分析（基于Token级明细）

Pro模型成本构成：

输出Token（¥0.000006/个）：贡献¥43.52，占比22.6%
缓存命中输入（¥0.000000025/个）：贡献¥5.80，仅占3.0%
缓存未命中输入（¥0.000003/个）：贡献¥143.03，占比74.4%

Flash模型成本构成：

输出Token（¥0.000002/个）：贡献¥14.08，占比40.3%
缓存命中输入（¥0.00000002/个）：贡献¥0.92，仅占2.6%
缓存未命中输入（¥0.000001/个）：贡献¥19.93，占比57.1%

缓存命中率与调用频率

Pro模型：缓存命中率93.5%（命中Token约13.8亿，未命中约0.96亿），请求次数13,809次
Flash模型：缓存命中率86.5%（命中Token约2.57亿，未命中约0.40亿），请求次数6,780次

Pro的请求次数是Flash的两倍多，且命中率更高，说明大量重复或相似输入被有效缓存，降低了理论成本。但由于未命中输入的绝对量依然巨大（0.96亿Token），总成本仍然偏高。

每日成本趋势特点

平稳期（5月2日–9日）：Pro日成本1~5元，Flash小于1元
爆发期（5月11日–27日）：Pro多次单日超过12元，最高5月27日达¥27.76；Flash最高单日5月27日¥4.19
5月19日与5月27日是两个明显峰值，可能与业务活动增加或大量长上下文请求有关

03

小结

要降低成本，还得提高输入的命中率。AI给出的建议很实用：

提高缓存复用：尽量复用相同的会话或系统提示词，减少cache_miss输入量。当前未命中输入贡献了Pro约74%的成本，优化这部分收益最大。
评估模型选择：对于非复杂推理任务，可多使用Flash模型，成本仅为Pro的1/5~1/6，且调用延迟更低。
控制输出长度：输出Token在两种模型中都占相当比例（Pro 23%，Flash 40%），适当限制max_tokens或简化回答能直接节约成本。

参考链接：

【1】https://platform.deepseek.com/usage

【2】https://www.realplc.com

来源：https://cloud.tencent.com.cn/developer/article/2676480

DeepSeek V

上一篇阿里云Agent基础设施全景图 ANOLISA成为每个Agent运行底座 下一篇Octoparse VOC数据抓取教程

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-07-01

RAG四标融合企业知识资产体系四库协同GEO优化实践

生成式AI正在彻底改写信息检索的底层逻辑。传统SEO依赖关键词堆砌和外链建设的策略，在大模型的内容采信规则下已经基本失效。取而代之的，是生成式引擎优化（GEO）。它不再关注外链数量，而是重点衡量你的知识是否结构化、证据链是否坚实、信源是否可靠——这些维度才是RAG（检索增强生成）架构真正看重的核心指