游乐游手机版
首页/AI教程/文章详情

DeepSeek V4 API调用20亿Token费用揭秘

时间:2026-05-30 10:28
最近一直在打磨RealPLC产品的各个细节,前后试了两套AI方案:Codex和GPT-5 5 High、Claude Code、DeepSeek V4 Pro Flash。Codex用的是Plus方案,额度用完后就切到第二套。这个月几乎每天都在迭代调整。 说实话,最大开销不是API费用或订阅费,而是

最近一直在打磨RealPLC产品的各个细节,前后试了两套AI方案:Codex和GPT-5.5 High、Claude Code、DeepSeek V4 Pro/Flash。Codex用的是Plus方案,额度用完后就切到第二套。这个月几乎每天都在迭代调整。

说实话,最大开销不是API费用或订阅费,而是时间。一个地方的改动,很可能把其他地方搞崩。每次调整后docker重启至少要几分钟,来回折腾,时间根本不够用。期间不少朋友催着问内测邀请码,但眼看着要发布了,总因为某个小细节不满意又改一改——优化永无止境,有时候甚至直接重写,这部分损耗巨大。

不过持续优化到现在,方案基本稳定了,前端UI不会再加太多内容,后续主要精力放在服务端的管理和配置上,这背后是大量的工作。简单上线一个网站很容易,但要稳定运行,后台服务的工作量可不小。代码量一旦上了量级,事情就没那么简单了。

这期聊聊DeepSeek V4的费用——毫不夸张,这个月差不多消耗了20亿Tokens。光是API费用,GPT的额度每天都用完。所以RealPLC从诞生起就是AI的产物,也是我们和AI深度结合的综合体。

01

DeepSeek V4费用

之前简单介绍过:DeepSeek V4 Pro跑1个亿Token到底要花多少钱?刚好过去一个月,今天账户欠费了,翻开后台数据,正好和大家分享下具体的使用情况。

\

总消费:227.27元。具体分配到模型上,这张图不直观。于是把数据导出来,扔给DeepSeek网页端,让它生成一个HTML页面展示——后面详细说。

具体的Tokens分布如下:

\

大部分用的是Pro:Pro的Tokens约15.5亿,Flash约2.8亿。粗略估算,这个月总共消耗接近20亿。按目前的金额粗算(18亿对应230元),平均1亿Tokens约12元。

02

深度解析

让DeepSeek生成的HTML页面效果不错:

总成本概览

统计周期内,该账号累计调用支出¥227.28元。

  • deepseek-v4-pro(高精度模型):¥192.35元,占比84.6%
  • deepseek-v4-flash(高速轻量模型):¥34.93元,占比15.4%

Pro模型是绝对的成本主力,日均约¥8.74元;Flash日均仅¥1.59元,适合对实时性要求高、但对成本敏感的任务。


成本构成分析(基于Token级明细)

Pro模型成本构成:

  • 输出Token(¥0.000006/个):贡献¥43.52,占比22.6%
  • 缓存命中输入(¥0.000000025/个):贡献¥5.80,仅占3.0%
  • 缓存未命中输入(¥0.000003/个):贡献¥143.03,占比74.4%

Flash模型成本构成:

  • 输出Token(¥0.000002/个):贡献¥14.08,占比40.3%
  • 缓存命中输入(¥0.00000002/个):贡献¥0.92,仅占2.6%
  • 缓存未命中输入(¥0.000001/个):贡献¥19.93,占比57.1%

缓存命中率与调用频率

  • Pro模型:缓存命中率93.5%(命中Token约13.8亿,未命中约0.96亿),请求次数13,809次
  • Flash模型:缓存命中率86.5%(命中Token约2.57亿,未命中约0.40亿),请求次数6,780次

Pro的请求次数是Flash的两倍多,且命中率更高,说明大量重复或相似输入被有效缓存,降低了理论成本。但由于未命中输入的绝对量依然巨大(0.96亿Token),总成本仍然偏高。


每日成本趋势特点

  • 平稳期(5月2日–9日):Pro日成本1~5元,Flash小于1元
  • 爆发期(5月11日–27日):Pro多次单日超过12元,最高5月27日达¥27.76;Flash最高单日5月27日¥4.19
  • 5月19日与5月27日是两个明显峰值,可能与业务活动增加或大量长上下文请求有关

03

小结

要降低成本,还得提高输入的命中率。AI给出的建议很实用:

  • 提高缓存复用:尽量复用相同的会话或系统提示词,减少cache_miss输入量。当前未命中输入贡献了Pro约74%的成本,优化这部分收益最大。
  • 评估模型选择:对于非复杂推理任务,可多使用Flash模型,成本仅为Pro的1/5~1/6,且调用延迟更低。
  • 控制输出长度:输出Token在两种模型中都占相当比例(Pro 23%,Flash 40%),适当限制max_tokens或简化回答能直接节约成本。

参考链接:

【1】https://platform.deepseek.com/usage

【2】https://www.realplc.com

来源:https://cloud.tencent.com.cn/developer/article/2676480
上一篇阿里云Agent基础设施全景图 ANOLISA成为每个Agent运行底座 下一篇Octoparse VOC数据抓取教程
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
WPS AI生成专业PPT模板技巧与工作总结范文
AI教程 · 2026-05-30

WPS AI生成专业PPT模板技巧与工作总结范文

每逢职场汇报高峰期,项目总结、年终述职等任务纷至沓来,你是否也常感到时间紧迫、内容匮乏且思路混乱?此时,一份设计得当的PPT模板,往往能成为你高效表达的得力助手。它不仅关乎专业形象的塑造,更是牢牢抓住听众注意力的核心要素。毕竟,在信息爆炸的时代,观众的耐心可能比金鱼还要短暂。 令人欣慰的是,如今我们

AI提升企业公文写作效率实用指南与范文
AI教程 · 2026-05-30

AI提升企业公文写作效率实用指南与范文

适合需求: 在当今企业与组织机构中,公文撰写几乎已成为每位职场人士必须掌握的“基础技能”。无论是会议记录、通知公告,还是各类总结报告,这类写作需求几乎无处不在。然而,真正动笔时,不少人却感到棘手:如何将思路清晰、准确地表达在纸上? 范文 Demo: 公文的重要性不言自明。它不仅是信息传达的桥梁,更直

Excel两表数据对比技巧,提升工作效率实用方法
AI教程 · 2026-05-30

Excel两表数据对比技巧,提升工作效率实用方法

```html Excel两个表格数据对比的高效方法 在日常工作中,经常需要对比两个Excel表格中的数据,快速找出差异或合并信息。无论是数据分析师还是普通办公人员,掌握这些Excel数据对比技巧都能显著提升工作效率。以下介绍三种实用的表格对比方法,各有侧重,可根据实际需求灵活选用。 方法一:使用条

如何撰写真诚辞职报告?范文与提示词
AI教程 · 2026-05-30

如何撰写真诚辞职报告?范文与提示词

辞职报告适用场景与要求: 辞职报告范文模板 尊敬的领导: 此刻,我怀着复杂与感激的心情向您递交这份辞职申请。首先,衷心感谢您在我任职期间给予的悉心指导与关怀。正是在您的支持与信任下,我得以持续成长、不断进步,并收获了极为宝贵的工作经验。 此次离职决定并非一时冲动,而是经过深思熟虑。主要基于以下几点:

Excel汇总其他表格数据方法,提升工作效率
AI教程 · 2026-05-30

Excel汇总其他表格数据方法,提升工作效率

Excel跨表格汇总数据的4种高效方法(附公式详解) 在日常办公中,很多人经常遇到这样的场景:手头有多个Excel表格,数据分散在不同的文件或工作表中,需要合并进行整体分析,结果要么是手动复制粘贴效率低下,要么是公式写错导致混乱。实际上,Excel内置了多种成熟的数据汇总手段,能帮你快捷准确地将分散