9月29日,DeepSeek正式推出全新的DeepSeek-V3.2-Exp模型。该版本在V3.1-Terminus的基础上进行了重大升级,创新性地引入了DeepSeek Sparse Attention稀疏注意力机制,显著提升了长文本处理时的训练和推理效率。
值得关注的是,寒武纪在同日宣布已完成对该模型的全面适配工作,并开源了MLU版本的大模型推理引擎vLLM。这意味着开发者可以在寒武纪平台上抢先体验DeepSeek-V3.2-Exp的各项新特性。
作为AI计算领域的领导者,寒武纪始终坚持芯片与算法协同创新的发展路线。公司通过优化软硬件系统架构,持续降低大模型部署成本,提升运行效率。在此之前,寒武纪已经对DeepSeek系列模型进行了深度优化,取得了行业领先的算力利用效率。
面对DeepSeek-V3.2-Exp的全新架构,寒武纪研发团队快速响应,采用Triton算子实现快速适配,通过BangC融合算子获得极致性能,并依托创新的计算通信并行策略,再次突破了计算效率瓶颈。
寒武纪强调,结合DeepSeek-V3.2-Exp的创新稀疏注意力机制和自身卓越的计算优化能力,能够在长序列场景下显著降低训练和推理成本,为客户提供更具竞争力的端到端解决方案。

