游乐游手机版
首页/AI热点日报/热点详情

一文读懂:人工智能时代为何需要DPU核心技术

类型:热点整理2026-07-02
先说一个关键判断:AI时代智算中心的建设热潮已经到来,而DPU正在成为这座新基建中不可或缺的一环。它解决的问题非常明确——释放有效算力、降低基础设施的运营成本。如果你关注数据中心的发展趋势,一定会发现DPU的渗透率正在悄然加速。 AI时代的架构困局 大模型训练对算力的需求是指数级增长的。当ChatG

先说一个关键判断:AI时代智算中心的建设热潮已经到来,而DPU正在成为这座新基建中不可或缺的一环。它解决的问题非常明确——释放有效算力、降低基础设施的运营成本。如果你关注数据中心的发展趋势,一定会发现DPU的渗透率正在悄然加速。

AI时代的架构困局

大模型训练对算力的需求是指数级增长的。当ChatGPT这类大模型把工作负载分布在数千块GPU上时,一个始料未及的问题出现了:突发的梯度数据传输导致网络严重拥塞。业界原本长期关注“算力墙”和“内存墙”,如今却冒出了第三大瓶颈——网络墙。

一组数据很能说明问题:传统架构下,CPU大约有10%的算力都耗在了网络协议处理、存储管理、安全验证这些基础设施任务上。这意味着,你花了100块钱买算力,真正用在刀刃上的只有90块钱,其余10块钱打了水漂。

打个比方:你买了100核的CPU,结果发现真正用在计算上的只有90核,另外10个核压根儿没闲着,它们都在跑数据中心的各种基础设施软件——安全、存储、管理……这种隐形的算力浪费,在传统架构里几乎是不可避免的。既然CPU要被这些“脏活累活”拖后腿,那为什么不专门造一个角色来处理这些杂务呢?这就是DPU诞生的逻辑起点。

DPU,全称数据处理器。它拥有强大的网络处理能力,能把安全、存储和网络卸载功能一并接手。说得直白点,DPU就是专门来干那些“CPU干不好、GPU干不了”的任务的——比如网络协议处理、数据加解密、数据压缩,以及各类资源的统一管理和调度。

DPU的架构革新

DPU的真正革命性,在于它把网络从一条单纯的传输管道,升级成了一个可编程的计算节点——这被称作“数据平面智能”。支持这一判断的核心价值有三:

第一个是算力释放。网络虚拟化(VxLAN)、存储加速(NVMeoF)、安全加密(IPSec)这些基础设施任务,统统可以卸载到DPU上,让CPU和GPU专心做它们最擅长的事——核心计算。

第二个是性能跃迁。在100Gbps网络环境下,DPU可以实现线速处理,延迟直降90%以上。这不是理论值,而是已经验证过的实测数据。

第三个是安全隔离。通过硬件级别的隔离,能够真正构建起零信任架构,即使发生攻击,也能有效阻断其横向扩散。

要理解DPU的发展脉络,可以把它拆成三个阶段来看。

第一阶段:智能网卡时代(2010-2019)

故事要从以色列的Mellanox公司说起。当年,为了降低CPU在数据中心的额外消耗,Mellanox提出了Smart NIC(智能网卡)的概念。在那个虚拟化开始大行其道的年代,CPU的负担已经到了岌岌可危的地步——既要跑OVS(Open Virtual Switch),又要管存储,还得处理数据包的加解密、深度包检测、防火墙管控和复杂路由……这么多活压在一个处理器上,怎么可能不卡脖子?

Smart NIC的出现,算是给CPU做了一次“减负手术”。OVS操作被卸载出去,存储加速、数据加密、深度包检测等关键功能也独立承担。一大批原本耗费在基础设施任务上的CPU周期,被重新释放出来,还给主机CPU做更有价值的事。

第二阶段:DPU元年(2020)

2019年3月,英伟达花了69亿美元收购Mellanox。这笔当时看起来有些激进的交易,很快就被证明是一次极具前瞻性的战略布局。2020年,英伟达正式推出DPU产品,并首次将DPU定义为“第三大算力单元”

那一年,英伟达发布了两款DPU产品:BlueField-2 DPU和BlueField-2X DPU。从此,“DPU”这个概念正式走进了大众视野。

第三阶段:架构创新期(2021至今)

2021年4月,英伟达推出了新一代数据处理器——BlueField-3 DPU。作为全球首款专为AI和加速计算设计的DPU,它从一开始就带着“打破常规”的基因。BlueField-3是业内首款集成400G以太网和NDR InfiniBand的DPU,其网络性能在当时堪称天花板级别。从AI到混合云,从高性能计算到5G无线网络,它的出现重新定义了数据处理的边界。

但英伟达并没有止步。随着大模型的爆发式增长,一个更严峻的挑战摆到了台面上:如何提升GPU集群的分布式计算效率?如何强化集群的横向扩展能力?又如何实现生成式AI云上的业务性能隔离?

于是在2023年底,英伟达拿出了BlueField-3 SuperNIC。

BlueField-3 SuperNIC源自BlueField DPU,用了相同的架构,但角色上做了分工。BlueField DPU主要负责基础设施操作的卸载,加速和优化的是南北向流量;而BlueField-3 SuperNIC则借鉴了InfiniBand网络上的动态路由、拥塞控制和性能隔离技术,同时兼容了以太网在云上的灵活性,专门优化东西向流量——这正是生成式AI云最需要的能力。

整体来看,英伟达的BlueField-3网络平台已经形成了一个双产品矩阵:BlueField-3 DPU负责软件定义网络、存储和安全任务的高速处理;BlueField SuperNIC则专为超大规模AI云设计。二者互补,构成了数据中心领域的技术底座。

国内市场DPU发展趋势

回到国内市场,DPU的研发同样在快速推进。以中科驭数为代表,其首颗国产DPU芯片K2于2022年成功流片上市,标志着国内在DPU技术领域实现了从0到1的突破。随后在2023年6月发布的全功能三代DPU芯片K2Pro,性能表现和应用前景更加亮眼。目前,K2Pro已经在超低延迟网络、云和数据中心、金融计算、大数据处理以及高性能计算等多个关键领域实现落地。

客观来看,中国的DPU产业目前仍处于起步阶段。但市场需求端的潜力不容小觑:中国拥有全球最强劲的互联网产业,庞大的网民基数和丰富的线上生态意味着海量数据正在井喷,而海量数据带来的就是对算力的极致渴求。

与此同时,中国对网络安全的重视程度也在与日俱增。而在网络安全防护这件事上,DPU天然具备独特优势——从精细的数据安全防护,到数据中心全方位的安全守护,都能实现无缝覆盖。安全需求和算力需求的双重驱动,正是DPU产业在中国发展的重要前提条件。

来源:https://www.53ai.com/news/zhinengyingjian/2025031073245.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。