首页 游戏 软件 资讯 排行榜 专题
首页
电脑教程
四大国产GPU深度解析:华为昇腾、阿里平头哥、沐曦与壁仞

四大国产GPU深度解析:华为昇腾、阿里平头哥、沐曦与壁仞

热心网友
38
转载
2026-03-08

3月8日传来的最新消息,上海人工智能实验室(上海AI实验室)正式宣布,在原有DeepLink混训技术方案与跨千里多智算中心长稳混训千亿参数大模型的基础上,推出了DeepLink多元算力混合推理加速方案,实现了对华为昇腾、沐曦、阿里平头哥、壁仞等多款国产GPU芯片的混合调度与协同推理。

据了解,DeepLink混推方案基于统一推理中间件、低时延通信、智能流量路由、策略求解器等原创技术,不仅能对多款芯片进行混合调度与协同推理,性能也实现了大幅提升。与单一芯片方案相比,推理时延TTFT最高可优化34.5%,推理吞吐最多可提升32%。

华为昇腾、阿里平头哥、沐曦、壁仞:四大国产GPU可以在一起了!

近年来,国产AI GPU如雨后春笋般涌现,性能日益强劲,但一方面,各家芯片往往各自为战,互不通联;另一方面,大模型推理技术本身也需要不断优化和效率提升。

上海AI实验室在国产GPU异构算力整合中,运用了预填充-解码分离(PD分离)策略,验证了混合芯片高效协同推理的可行路径。

在同一数据中心内,将不同规格属性的GPU芯片组合优化使用,可以形成最具性价比的异构算力搭配。

具体实现上,上海AI实验室通过四大原创技术底座,实现了对异构算力资源的兼容调度。

推理中间件(DLInfer):

以标准化融合算子接口打通上层框架与底层硬件壁垒,实现算法模型在多元硬件上的统一推理,降低应用门槛。

高速通信库(DLSlime):

全面兼容各类主流物理连接协议,实现跨架构设备高速互联,核心场景带宽利用率突破97%;具备较强的异步处理能力,可实现计算与通信的重叠。

智能流量路由系统(DLRouter):

支持KVCache感知的请求路由,最大限度减少重复或重叠请求,节省计算资源,实现分布式集群负载均衡分配。

策略求解器(DLSolver):

自动获取异构芯片全方位置性能评测数据,结合模型配置以及用户服务等级目标等输入,匹配最优PD分离配置策略,兼顾推理性能与成本。

华为昇腾、阿里平头哥、沐曦、壁仞:四大国产GPU可以在一起了!

华为昇腾、阿里平头哥、沐曦、壁仞:四大国产GPU可以在一起了!

在单一算力平台推理加速方面,方案已在华为昇腾A2平台上,针对千卡规模下的化学数据生成场景,实现了61.9%的吞吐率提升;在沐曦曦云C500上,则使MinerU多模态生成推理加速了60%。

在多款国产GPU芯片的深度混合调度与协同推理方面,千卡规模推理集群实测数据表明,在多模态生成、高并发智能服务等典型场景下,对比单芯片方案,推理时延TTFT最大可优化34.5%。

在科学论文处理等长输入短输出推理任务中,推理吞吐可提升32%。

华为昇腾、阿里平头哥、沐曦、壁仞:四大国产GPU可以在一起了!

值得一提的是,除了以上四家厂商,寒武纪、燧原科技、天数智芯、无问芯穹、商汤科技、中科曙光等也都是上海AI实验室和DeepLink技术方案的重要合作伙伴。

我们相信将看到越来越多的国产GPU并肩作战!

来源:https://m.mydrivers.com/newsview/1107751.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

昇腾生态蝶变:CANN全面开源开放,以“好用易用”重塑AI底座
科技数码
昇腾生态蝶变:CANN全面开源开放,以“好用易用”重塑AI底座

“时代洪水冲天下,长空激浪正当时。” 在昇腾生态媒体沟通会上,这句结语意味深长。会上,昇腾团队系统性地向外界披露了其在生态建设上的最新进展与核心战略,一条清晰而坚定的自主之路展现在眼前。 CANN的底层重构 作为昇腾AI的异构计算架构,CANN是连接底层硬件与上层应用的核心纽带。它的性能与易用性,直

热心网友
04.29
华为2025年报解析:经营稳健,持续增长符合预期
科技数码
华为2025年报解析:经营稳健,持续增长符合预期

3月31日消息,华为今日发布2025年年度报告,报告显示,华为经营结果符合预期,实现全球销售收入8,809亿元人民币,净利润680亿元人民币。2025年研发投入达到1,923亿元人民币,约占全年收入

热心网友
03.31
三年营收获65亿,盛合晶微冲刺科创板拟募资48亿
电脑教程
三年营收获65亿,盛合晶微冲刺科创板拟募资48亿

3月31日消息,盛合晶微披露了科创板上市招股意向书,公司首次公开发行股票数量为25546 6162万股,占发行后总股本约13 71%。盛合晶微近年来呈现爆发式增长态势,2024年至2025年营业收入

热心网友
03.31
端侧AI的密度法则与昇腾算力协同实践
科技数码
端侧AI的密度法则与昇腾算力协同实践

过去几年,大模型行业的注意力更多集中在云端,关注参数规模、推理速度或者能力榜单,而如今,客户关心的不是模型能不能更“强”,而是能不能在真实算力条件下跑起来,能不能稳定服务用户,能不能把成本压到一个可

热心网友
03.30
四大国产GPU深度解析:华为昇腾、阿里平头哥、沐曦与壁仞
电脑教程
四大国产GPU深度解析:华为昇腾、阿里平头哥、沐曦与壁仞

3月8日消息,上海人工智能实验室(上海AI实验室)最新宣布,基于此前的DeepLink混训技术方案、跨千公里多智算中心长稳混训千亿参数大模型,正式推出DeepLink多元算力混合推理加速方案,实现了

热心网友
03.08

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

银河麒麟系统SSH公钥登录配置与安全远程连接指南
系统平台
银河麒麟系统SSH公钥登录配置与安全远程连接指南

在麒麟操作系统上配置SSH公钥登录,不仅能免去每次输入密码的繁琐,更能显著增强远程连接的安全性。整个过程并不复杂,核心步骤围绕密钥生成、公钥部署和服务端配置展开。本文将详细介绍几种主流方法,涵盖从自动化部署到手动配置,助你轻松完成麒麟系统SSH密钥登录设置。 一、使用ssh-keygen与ssh-c

热心网友
05.15
银河麒麟系统登录循环故障解决方法与桌面修复指南
系统平台
银河麒麟系统登录循环故障解决方法与桌面修复指南

登录循环闪退应先删 Xauthority和 ICEauthority文件、修复 tmp权限为1777、重置ukui mate dconf配置、清理磁盘空间、重装lightdm并重新配置。 在银河麒麟操作系统中输入密码后,屏幕一闪又回到登录界面,这种“登录循环”问题确实令人困扰。这通常并非硬件故障,而

热心网友
05.15
GUSD稳定币详解:项目背景、核心用途与投资风险全解析
web3.0
GUSD稳定币详解:项目背景、核心用途与投资风险全解析

GUSD是一种与美元1:1锚定的合规稳定币,由Gemini交易所发行并受纽约州金融服务部监管。其核心价值在于为加密世界提供透明、受监管的美元等价物,主要应用于交易、支付和价值存储。投资者需关注其中心化托管风险、监管政策变化及智能合约潜在漏洞,理解其作为传统金融与加密市场桥梁的定位与局限。

热心网友
05.15
Win11如何设置默认音频输出设备与调整音量
系统平台
Win11如何设置默认音频输出设备与调整音量

在Windows 11系统中,确保系统音频稳定输出到指定设备(如已连接的耳机或已配对的蓝牙音箱),核心在于正确配置默认音频输出设备。您可以通过任务栏快速设置、系统设置应用、控制面板声音对话框、音量混合器下拉菜单或Win+Ctrl+V快捷键这五种主流方案,实现即时切换或永久性配置,彻底解决声音输出错乱

热心网友
05.15
宏胜集团高管变动与业务外包调整深度解析
AI
宏胜集团高管变动与业务外包调整深度解析

宏胜集团近期发生重要人事与业务调整。总裁办主任叶雅琼、销售总经理吴汀燕、法务部部长周卓盈及生产管理科科长吴潘潘等多位高管已离职,该消息已获接近集团人士证实。与此同时,集团启动了部分非生产业务的外包运作,显示出其正在优化内部结构与运营模式。这一系列变动可能意味着公司正处于战略调整期,旨在聚焦核心业务并

热心网友
05.15