DeepSeek全新模型发布基于北大ACL获奖论文优化

首页/科技数码/文章详情

DeepSeek全新模型发布基于北大ACL获奖论文优化

时间：2025-09-30 11:25

DeepSeek最新模型V3 2-Exp发布，推出全新注意力机制DeepSeek Sparse Attention(DSA)，训练推理提效的同时，API同步降价达50%以上！麻将刚刚，De

DeepSeek最新推出V3.2-Exp版本，革命性的DeepSeek Sparse Attention(DSA)注意力机制问世！训练推理效率大幅提升的同时，API价格直接腰斩50%

重磅消息：DeepSeek全新实验性模型DeepSeek-V3.2-Exp正式发布！

DeepSeek-V3.2-Exp发布

V3.2基于DeepSeek-V3.1-Terminus架构升级，首度引入「DeepSeek稀疏注意力」技术(DSA)，让长文本处理速度实现质的飞跃。

特别值得关注的是，这是首个采用「DeepSeek」品牌命名的核心技术！该技术源自DeepSeek与北大合作的ACL 2025最佳论文成果，在原生稀疏注意力(NSA)基础上进行了深度优化。

突破性注意力机制

「DeepSeek稀疏注意力」革命性地实现了细粒度稀疏处理，在不影响输出质量的前提下大幅提升长文本处理效率。

技术论文

论文地址：https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf

与传统模型不同，DSA不再要求每个Token关注所有历史Token，而是创新性地引入「闪电索引器」(lightning indexer)这一高效组件。

该组件能迅速识别当前Token最相关的历史Token，只对关键部分(如2048个)进行精确计算，将复杂度从O(L²)降至O(Lk)，k为远小于L的固定值。

效率提升的同时性能丝毫不减：团队先以「密集预热」初始化索引器，再通过「稀疏训练」使模型适应新模式，最后保持与前代相同的后训练流程(专家蒸馏+GRPO)。

严格测试表明，V3.2在长短文本各项任务中的表现与V3.1-Terminus基本持平，而实际的推理速度和成本优化却非常显著。

架构对比

性能展示

虽然目前还是实验版本，但V3.2展现的"性能不降、成本锐减"特性，为大模型突破长文本处理瓶颈开辟了新方向。

API价格骤降

重磅福利：由于服务成本大幅降低，DeepSeek API价格即日起直降50%以上！

现在访问的API版本已默认为DeepSeek-V3.2-Exp，接口保持不变，但开发者使用成本直接减半。

价格对比

不得不说，这次DeepSeek的发布节奏完全响应了用户期待，为AI开发者送上了最实惠的礼物！

参考文档：

https://api-docs.deepseek.com/zh-cn/news/news250929

来源：https://36kr.com/p/3488379156487046

上一篇马斯克：特斯拉量产"擎天柱"机器人将成价值核心 下一篇红杉报告：95%企业AI投资失败，毕业生就业影响最大

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

最新消息称国行苹果iPhone 18 Pro Max电池容量达到了5391mAh增幅11.78%

科技数码 · 2026-07-05

HMD发布四款诺基亚功能手机配备AI按键与可拆卸电池

HMDGlobal推出4款诺基亚功能手机，均配1450mAh可拆卸电池及独立AI按键，支持语音控制，免费180天后付费。部分机型带摄像头，支持microSD卡扩展至32GB，具双SIM卡、3 5mm接口及蓝牙5 0。

科技数码 · 2026-07-05

云南以旧换新补贴扩围新增智能影音与无人机

云南省自2026年7月起扩大消费品以旧换新补贴范围，新增智能门锁、智能影音、无人机、数码相机等数码智能产品及吸油烟机、燃气灶、洗碗机、净水器等家电。按最终售价15%补贴，每类每件最高1500元，商户报名无限制。

科技数码 · 2026-07-05

小米Redmi 7英寸高性能手机传闻即将发布

最近圈内又有新动静了。据博主 @数码闲聊站今天爆料，某家厂商的子系列下一代打算推出两款屏幕尺寸差异明显的机型：一块是 6 59 英寸的中屏 Pro，另一块则是 7 英寸的巨屏性能机。从该博主以往的爆料习惯来看，基本可以锁定是小米 REDMI 品牌的产品线布局。有意思的是，早在今年 2 月，这位博

科技数码 · 2026-07-05

深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售

深光影像AF35mmF2 2CE全画幅镜头开售，提供E卡口和L卡口，标准版七百三十九元，套装版七百八十九元。全金属机身，重约一百七十五克，高三十六毫米，滤镜口径五十二毫米，光学结构五组七片，九片光圈叶片，最近对焦零点三五米，支持自动对焦。