DeepSeek V4价格大幅降低百万token仅需两分钱
昨晚,国内AI圈又被一则消息刷屏了:DeepSeek-V4系列模型,再次祭出“价格屠刀”。
这次降价,瞄准的是“输入缓存命中”这一场景。DeepSeek-V4-Flash和V4-Pro两款模型,其缓存命中后的输入价格,直接被拉低到了首发价的十分之一。具体来看,V4-Flash每百万tokens仅需0.02元,V4-Pro也只要0.025元。

要知道,就在两天前的4月25日晚,DeepSeek-V4-Pro才刚刚宣布过一次“暴降75%”的限时优惠。目前,其缓存未命中的输入价格为每百万tokens 3元,输出为6元。这场价格风暴,将持续到5月5日深夜。
至于V4-Flash,除了这次针对缓存命中的“骨折价”外,其常规价格体系保持不变:缓存未命中的输入价格为1元/百万tokens,输出为2元。

价格优势进一步拉大
这一轮调价之后,DeepSeek在国内大模型市场的价格竞争力,已经变得相当突出。有行业观察者迅速制作了对比表格,将国内几家主流厂商的模型价格放在一起审视,差距一目了然。

▲国内大模型企业模型价格对比表
对于实际使用者而言,这种降价带来的成本削减是实实在在的。有微博用户根据自己过往的使用数据粗略估算,此次调整后,综合成本大约能节省73%。用一位网友的话说,“这感觉,就像是手机流量从5元1G时代,一步跨入了5毛1G的时代。”


市场与开发者的双重反响
如此激进的定价策略,自然引发了广泛猜测。在DeepSeek官方社交账号的推文下,有网友一针见血地指出,这显然是凭借技术优势,在强势抢占市场份额。

更多的声音则来自开发者群体。不少人直言,围绕token缓存的价格战已经正式打响。有开发者感慨“DeepSeek太宠用户了”,并认为眼下正是评估将工作流程从Claude或GPT迁移到DeepSeek的“最佳窗口期”。

另一些评论则着眼于更宏观的产业影响。他们肯定此次降价的意义,认为如此大幅的折扣,将“彻底改变生产级应用的经济格局”。这意味着,过去因成本高昂而难以商业化的创意或工具,现在有了跑通的可能。

综合来看,DeepSeek此次将缓存命中价格压至“地板价”,叠加V4-Pro的限时大幅优惠,再配合其一直坚持的开源策略和长上下文优势,意图非常清晰:快速收拢开发者心智,构筑应用生态护城河。一个直接的信号是,对于广大中小开发团队而言,使用顶级大模型来验证并跑通一个商业模式,门槛正在被急剧拉低。AI应用爆发的“成本堰塞湖”,或许真的到了要泄洪的时刻。
相关攻略
想要基于DeepSeek V4构建一个能够精准理解产品手册内容的智能问答系统?这个需求非常贴合企业知识管理的实际场景。直接对大模型进行微调不仅成本高昂、周期漫长,对于需要即时准确响应的内部知识库应用而言,采用检索增强生成(RAG)架构无疑是当前更高效、更实用的技术路径。 然而,DeepSeek V4
想用上DeepSeek最新的V4 Pro版本,体验它那更强的推理能力?你可能已经接入了API,或者在网页端、APP端看到了相关功能,但感觉效果和预期有差距。这很可能是因为你的会话还运行在默认的“快速模式”上。要真正激活那个拥有1 6T参数、采用MoE 4 0架构并具备R1推理增强的深度模型,你需要手
当您在Ollama中尝试运行DeepSeek V4模型时,如果遇到进程卡死、无响应或直接报错退出的问题,请不要急于归咎于您的硬件设备。这很可能源于一个关键原因:截至目前,DeepSeek V4模型尚未在Ollama的官方模型库中正式发布。更重要的是,其公开发布的原始权重格式(通常是Hugging F
将DeepSeek V4的原始PyTorch权重转换为AWQ格式,是在有限显存条件下实现低延迟、高精度推理的成熟方案。AWQ(激活感知权重量化)的核心原理非常巧妙:它并非对所有参数进行均等压缩,而是通过分析模型在前向传播中的激活分布,精准识别并保留对输出结果影响最显著的“关键权重”。这种方法使得模型
手头已经下载了DeepSeek V4的模型文件,但在llama cpp中直接加载却无法运行?这通常是因为模型尚未转换为llama cpp兼容的GGUF格式,或者没有针对您的硬件配置进行适当的量化优化。别担心,按照以下系统化的操作流程,您就能顺利解决这一问题。 一、确认模型原始格式并获取适配分支 目前
热门专题
热门推荐
机器人行业迎来里程碑式突破。以视频生成模型Vidu著称的生数科技,正式发布了名为Motubrain的“世界动作模型”。这并非一次普通迭代,而是被定位为机器人的“物理大脑”,其核心目标在于:用一个统一的通用模型,彻底取代以往依赖多个专用系统拼凑而成的复杂架构。 正如其“一个大脑,无限可能”的口号所揭示
xAI正式进军AI编程智能体领域,于近日发布了专为软件工程与复杂编程任务设计的Grok Build。 简单来说,Grok Build是一款能在终端里直接跑起来的AI编程助手。它被定位为一个具备智能体能力的命令行工具,开发者用自然语言告诉它要做什么,它就能生成代码,甚至帮你搞定一系列编程和自动化任务。
近日,谷歌对其搜索引擎的核心规则进行了重要更新,此次调整直指当前备受关注的AI搜索领域。具体而言,谷歌在其垃圾内容政策中新增了明确条款,正式将“操纵AI搜索结果”的行为列为违规操作,划定了新的质量红线。 根据权威行业媒体Search Engine Land的报道,本次谷歌算法更新的核心在于,将任何企
硅谷的科技巨头们或许曾以为,自己已经远离了AI数据中心带来的电力压力——毕竟,高昂的地价和电费早就把大型数据中心项目“赶”到了别处。但现实总是出人意料,这场能源危机的涟漪,正悄然涌向他们心爱的度假后院。 没错,说的就是太浩湖。这个湾区精英们钟爱的避世天堂,如今正站在一场电力风暴的边缘。距离它必须找到
这项由高通AI研究院(Qualcomm AI Research)主导的创新研究于2026年5月正式发布,论文预印本编号为arXiv:2605 07721。 研究背景:当AI越想越费内存,我们该怎么办 设想一下,手机导航应用会在出发前规划好整条路线,而一位真正智慧的向导则会边走边思考,遇到路障时灵活应





