四大国产GPU深度解析：华为昇腾、阿里平头哥、沐曦与壁仞

时间：2026-03-08 16:25

3月8日消息，上海人工智能实验室（上海AI实验室）最新宣布，基于此前的DeepLink混训技术方案、跨千公里多智算中心长稳混训千亿参数大模型，正式推出DeepLink多元算力混合推理加速方案，实现了

3月8日传来的最新消息，上海人工智能实验室（上海AI实验室）正式宣布，在原有DeepLink混训技术方案与跨千里多智算中心长稳混训千亿参数大模型的基础上，推出了DeepLink多元算力混合推理加速方案，实现了对华为昇腾、沐曦、阿里平头哥、壁仞等多款国产GPU芯片的混合调度与协同推理。

据了解，DeepLink混推方案基于统一推理中间件、低时延通信、智能流量路由、策略求解器等原创技术，不仅能对多款芯片进行混合调度与协同推理，性能也实现了大幅提升。与单一芯片方案相比，推理时延TTFT最高可优化34.5%，推理吞吐最多可提升32%。

华为昇腾、阿里平头哥、沐曦、壁仞：四大国产GPU可以在一起了！

近年来，国产AI GPU如雨后春笋般涌现，性能日益强劲，但一方面，各家芯片往往各自为战，互不通联；另一方面，大模型推理技术本身也需要不断优化和效率提升。

上海AI实验室在国产GPU异构算力整合中，运用了预填充-解码分离（PD分离）策略，验证了混合芯片高效协同推理的可行路径。

在同一数据中心内，将不同规格属性的GPU芯片组合优化使用，可以形成最具性价比的异构算力搭配。

具体实现上，上海AI实验室通过四大原创技术底座，实现了对异构算力资源的兼容调度。

推理中间件（DLInfer）：

以标准化融合算子接口打通上层框架与底层硬件壁垒，实现算法模型在多元硬件上的统一推理，降低应用门槛。

高速通信库（DLSlime）：

全面兼容各类主流物理连接协议，实现跨架构设备高速互联，核心场景带宽利用率突破97%；具备较强的异步处理能力，可实现计算与通信的重叠。

智能流量路由系统（DLRouter）：

支持KVCache感知的请求路由，最大限度减少重复或重叠请求，节省计算资源，实现分布式集群负载均衡分配。

策略求解器（DLSolver）：

自动获取异构芯片全方位置性能评测数据，结合模型配置以及用户服务等级目标等输入，匹配最优PD分离配置策略，兼顾推理性能与成本。

华为昇腾、阿里平头哥、沐曦、壁仞：四大国产GPU可以在一起了！

在单一算力平台推理加速方面，方案已在华为昇腾A2平台上，针对千卡规模下的化学数据生成场景，实现了61.9%的吞吐率提升；在沐曦曦云C500上，则使MinerU多模态生成推理加速了60%。

在多款国产GPU芯片的深度混合调度与协同推理方面，千卡规模推理集群实测数据表明，在多模态生成、高并发智能服务等典型场景下，对比单芯片方案，推理时延TTFT最大可优化34.5%。

在科学论文处理等长输入短输出推理任务中，推理吞吐可提升32%。

华为昇腾、阿里平头哥、沐曦、壁仞：四大国产GPU可以在一起了！

值得一提的是，除了以上四家厂商，寒武纪、燧原科技、天数智芯、无问芯穹、商汤科技、中科曙光等也都是上海AI实验室和DeepLink技术方案的重要合作伙伴。

我们相信将看到越来越多的国产GPU并肩作战！

来源：https://m.mydrivers.com/newsview/1107751.html

昇腾平头哥沐曦

上一篇AMD首发1GHz速龙CPU：26年前突破主频千兆赫兹大关 下一篇AMD副总裁用AI撰写显卡驱动，过程和你想的不同

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

电脑教程 · 2026-07-01

网易闪电邮附件下载失败的解决方法

当使用网易闪电邮下载附件时，经常遇到进度条卡在“正在下载”或直接中断、且页面无任何提示的情况，这通常由以下几个原因导致。网易闪电邮附件下载失败的根本问题往往不是表面现象，而是网络环境、本地配置和网易邮箱策略共同作用的结果。下面我们将从根源入手，逐步排查并提供有效的解决方案。先确认是否为超大附件限制

电脑教程 · 2026-07-01

Origin下载卡在0%的解决方法

第一次安装Origin时，很多新手朋友最头疼的莫过于进度条卡在0%不动，光标一闪一闪，等了十几分钟还是老样子。老实说，这根本不是你的网速太慢，而是安装程序压根没连上服务器——要么连接通道被阻断，要么你本地的网络组件出了问题。别急，我们直接上解决方案，分三步轻松搞定。使用离线安装包绕过Origin内

电脑教程 · 2026-07-01

萝卜投研电脑版安装教程与下载方法详解

先说结论：萝卜投研目前确实没有独立的PC客户端，不过别急，通过应用宝电脑版就能在Windows 10 11上运行它的Android原生App，而且手机端的账号、收藏的研报都能同步过来，还能导出到本地，就一个词儿——省心。下面我把整个安装和使用的流程拆开细说。换句话说，这套方案等于直接绕过了传统模拟

电脑教程 · 2026-07-01

小米智能存储规格揭晓：4+32GB存储与40Mbps免费远程访问

7月1日，小米的首款NAS产品终于浮出水面——官方命名为“小米智能存储”，并于今天上午10点正式开启众筹，起售价2299元。对关注智能家居和家庭数据存储的用户来说，这算是一个等了很久的消息。先看看基本规格。机身三围200 5×85×161mm，铝合金中框材质，整机保修三年，做工上对得起小米一向的质

电脑教程 · 2026-07-01

苹果手表充电方法及是否支持无线充电

苹果手表采用磁吸无线充电，基于MagSafe技术，从零充满约需90分钟。需匹配设备型号，快充需20W以上适配器。建议将电量维持在20%-80%，开启优化电池充电功能可降低衰减，充电环境温度应控制在0℃至35℃。