国庆长假前夕,AI行业突然掀起一波迅猛的"成本革命"。9月29日深夜,DeepSeek突然推出实验性模型DeepSeek-V3.2-Exp,同时宣布API价格全面跳水,其中输入费用最低降至每百万Token仅0.2元,输出价格更是暴跌75%至3元/百万Tokens。这一大胆定价立刻在业内掀起巨浪,被媒体称为"价格屠刀"。
本次调价采取差异化策略:缓存命中的API调用每百万Token输入价格直接从0.5元砍半至0.2元,未命中情况也从4元降至2元;输出端单价从12元断崖式下跌到3元。与国际竞品对比尤其明显,Anthropic同期发布的Claude Sonnet 4.5单次输入输出分别要价3美元和15美元,换算下来其输出价格竟然是DeepSeek新价格的30多倍。这一波冲击也让国内同行如智谱AI的价格体系遭遇严峻挑战。
支撑这场成本革命的是突破性的技术创新。DeepSeek-V3.2-Exp基于V3.1-Terminus架构,创造性引入稀疏注意力机制,通过精准分配计算资源大幅提升了长文本处理效率。经技术团队反复验证,新模型不仅维持了在AIME数学推理、Codeforces编程竞赛等专业测试中的优异表现,部分指标甚至有所提升,真正做到了"提质降价"。
这场技术革新恰逢全球AI新品爆发期。同一日,Anthropic高调宣传Claude Sonnet 4.5在编程和数学领域的新突破;智谱AI则将GLM-4.5改称为"上代旗舰",暗示GLM-4.6即将问世。三大巨头不约而同选在国庆前夕发力,上演了一场精彩的"假日档"商业对垒。
硬件厂商的快速反应同样惊艳。寒武纪当日就完成适配并开源vLLM-MLU推理引擎代码,次日股价应声大涨4%。华为昇腾实现"零时差"兼容支持,华为云随即推出超节点推理服务。海光信息凭借GPGPU架构优势完成深度优化,主打"秒级部署"概念。这种全产业链的协同速度,彰显了中国AI生态的成熟度。
开发者社区则陷入了幸福的"升级烦恼"。"上周才刚完成V3.1的迁移适配,现在又要重来,国庆假期看来要加班了。"一位工程师在技术论坛留言道。评测团队同样压力陡增,需要同步跟踪DeepSeek、智谱GLM-4.6和Claude Sonnet 4.5的性能表现。更棘手的是,作为实验版本,V3.2-Exp要求开发者在性能突破和系统稳定之间找到最佳平衡点。
这场创新风暴正在重构行业游戏规则。DeepSeek用实际行动证明,通过架构优化可以实现算力效率的质变飞跃。当竞争对手还在比拼参数规模时,这种"小步快跑"的创新策略已经将行业带入效率竞争的新纪元。随着硬件生态的全面跟进,中国AI产业正形成从算法到芯片的完整创新链条。
