DeepSeek 今日发布实验版模型 DeepSeek-V3.2-Exp,作为新一代架构研发的关键过渡版本。该模型基于此前的 V3.1-Terminus 版本进行全面升级,核心突破在于创新性地应用了自主研发的 DeepSeek Sparse Attention 稀疏注意力机制,显著改善了长文本处理的训练效率和推理性能。
最新版本已实现全平台同步更新,包括移动应用、网页端及小程序三大渠道。特别值得注意的是,虽然 V3.2-Exp 已经通过多项权威基准测试,但出于对实际应用场景复杂性的考虑,技术团队决定暂时保留 V3.1-Terminus 的独立 API 接口,以便开发者进行详尽的效果对比与评估。
在市场策略方面,DeepSeek 宣布即日起大幅下调 API 调用费用,调整幅度超过原价的 50%。这项政策调整预计将有效降低企业客户的开发成本,特别有利于需要处理海量文本数据的商业应用场景。据研发团队解释,价格优势主要来源于稀疏注意力机制带来的显著性能提升。
技术资料显示,DeepSeek Sparse Attention 创新性地采用动态关键信息识别技术,在保证模型输出质量的前提下大幅降低冗余计算量。这项技术突破使该模型在法律文件解析、长篇内容创作等专业领域展现出独特优势。目前,研发团队正在全球范围内征集用户体验反馈,为下一阶段的架构优化夯实数据基础。
