游乐游手机版
首页/科技数码/文章详情

寒武纪适配DeepSeek-V3.2模型,开源vLLM-MLU引擎优化AI生态

时间:2025-09-30 20:29
近日,国内AI芯片领域传来重要进展——寒武纪宣布完成对深度求索公司最新实验性模型DeepSeek-V3 2-Exp的适配工作,并同步开源其自主研发的大模型推理引擎vLLM-MLU的完整代码。这一动作

国内AI芯片行业迎来重大突破——寒武纪科技宣布成功适配深度求索最新实验性模型DeepSeek-V3.2-Exp,同时宣布将其自研的大模型推理引擎vLLM-MLU全面开源。这不仅是寒武纪软硬协同能力的集中展现,也为国内AI开发者提供了强大的技术支撑。

技术创新突破

DeepSeek-V3.2-Exp采用了创新的Sparse Attention机制,这种设计显著提升了模型处理复杂任务的能力。与传统架构相比,该技术能够自动优化注意力权重分布,在保证准确率的同时大幅减少计算资源占用,尤其擅长处理长文本等复杂数据。

性能优化优势

寒武纪研发团队采取了双管齐下的优化方案:基于Triton算子实现模型快速移植,同时利用BangC融合算子进行深度性能调优。实测数据显示,模型在寒武纪平台上的推理速度提升了40%,长序列训练成本降低了30%以上。

性能优化效果对比图

开源生态建设

全新开源的vLLM-MLU引擎针对MLU芯片特性进行了专项优化,具备动态批处理、智能内存管理等先进特性。开源首周即在GitHub获得超过800个star,社区贡献者已提交多个关键模块的优化方案。

  • 支持主流AI模型快速部署
  • 提供完整的开发文档和示例
  • 特别适合金融、医疗等专业领域

行业影响深远

此次合作展现了国内企业在AI基础技术领域的快速演进。深度求索方面透露,双方正在筹备新一代模型的联合研发,重点突破模型量化与异构计算的深度融合技术。业内专家预测,这将推动智能计算向更高效、更经济的方向发展。

项目开源地址:https://github.com/Cambricon/vllm-mlu

来源:https://www.itbear.com.cn/html/2025-09/973471.html
上一篇创想三维K2创作大赛启动,奖金10万元等你来拿 下一篇智界R7/S7上市36天大定破3.2万台,销量强劲
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元
科技数码 · 2026-07-03

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售,支持4K165Hz与FHD520Hz双模切换,定价1888元。采用FastIPS面板,97%DCI-P3色域,配备升降支架及双HDMI2 1和双DP1 4接口。

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%
科技数码 · 2026-07-03

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年,DRAM与NAND闪存的供应持续紧张及价格不断攀升,正逐步传导至终端消费市场。可以预见,下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价,最终连苹果也不得不跟进,宣布提升iPad、Mac及家居设备的价格,以应对存储成本的快速上涨。 TrendForce分析指出,苹果全面

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波
科技数码 · 2026-07-03

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果自研C2芯片仅支持Sub-6GHz,不支持5G毫米波。因此,美版iPhone18Pro继续采用高通基带方案以支持毫米波,而其他地区版本则搭载苹果自研C2芯片。这一差异将导致在毫米波覆盖的市场中,用户峰值速率可能显著低于美版用户。

纳睿雷达推出睿宸超精细化短时临近AI气象大模型
科技数码 · 2026-07-03

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达近日释放了一项重磅成果。2026年7月1日,公司正式对外发布了两款自主研发的全新产品:一款是“WDSPT0152型”S波段全极化多功能有源相控阵雷达,另一款则是名为“睿宸”的超精细化短时临近AI气象大模型。从产品战略来看,此次发布直指气象监测与灾害预警领域的技术制高点。 先来看这款S波段雷达

南航国际创新港一期交付 四大专业园区打造空天产业强磁场
科技数码 · 2026-07-03

南航国际创新港一期交付 四大专业园区打造空天产业强磁场

近日,南京航空航天大学与六合区深度合作的标杆项目——南航国际创新港一期正式交付投用。两个地块陆续启用,成功串联起高校科研能量、地方产业载体与市场创新主体,为南京打造全国领先的航空航天产业创新中心、助力江苏布局商业航天全产业链,提供了坚实的物理支撑。 该创新港一期位于六合区雄州街道,分为3号和4号两个