华为在CNCC2025提出网络+模型,破解十万卡智算集群通信瓶颈
第22届中国计算机大会在哈尔滨隆重开幕,这场以“数智赋能,无限可能”为主题的科技盛会吸引了众多业界目光。大会现场,华为数据通信产品线研究部部长郑晓龙发表了题为《大模型推理加速与演进:网络如何破局?》的精彩演讲,首次提出“网络+”破局模型,为万卡智算集群面临的通信难题带来了创新性解决方案。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
郑晓龙在演讲中强调,随着单卡算力提升速度逐步放缓,要实现集群效率的飞跃,必须依靠网络、计算与存储的跨层协同。基于此,华为创新性地提出“网络+”破局模型,系统性地攻克超大规模集群中的通信瓶颈问题。该模型从架构设计、协议优化以及调度策略等多个维度展开,为构建下一代智算基础设施勾勒出完整的技术路线。
随着DeepSeek推动大模型架构向更稀疏的大规模EP部署转变,通信模式和关系呈现出显著变化,表现出随机性和非对称性的新特征。为应对这一挑战,华为推出了网络级负载均衡技术。该技术能够有效适应大规模EP部署带来的动态通信模式难题,将通信性能提升超过20%,同时显著降低P99完成时间,为智算集群的高效运行提供了有力保障。
大模型应用的发展趋势也在持续演进,从对话式的Chat LLM向自主智能的Agentic AI转变,对token生成速度的要求从50ms大幅提升至10ms以下。然而当前部署实践面临诸多挑战:推理阶段以小消息通信为主,控制面时延占比过高;若单纯卸载控制面,又会消耗额外计算资源SM。针对这些问题,华为推出了CloudMatrix 384超节点及对应的超节点网络,为满足极致的TPOT需求提供了可能,助力大模型应用在新的发展阶段实现更高效运行。
在多模态LMM流量混战的大背景下,网络调度发挥着关键作用。郑晓龙特别指出,“网络+”并非简单的带宽升级,而是要让网络成为AI集群的“第七代算力”。华为的网络调度技术恰如“四两拨千斤”,能够有效提升推理性能。最后,郑晓龙呼吁业界各方携手共建标准,与合作伙伴及行业组织共同定义大模型时代下一代智算网络接口,推动整个行业的协同发展。
热门专题
热门推荐
加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这
微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿
稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D
基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一
PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票





