芯片巨头英伟达与意大利大学联盟及大型超算中心Cineca携手合作,正式公布了一项备受瞩目的宏伟规划——打造号称“全球最快的AI超级计算机”。这套名为“Leonardo”的系统,将成为横跨欧洲合作构建的四台新一代超算集群中的重要成员。

简单来说,即将亮相的Leonardo系统将搭载近14000块Nvidia A100 GPU,专门用于执行各类高强度的AI训练与科学计算任务。根据官方披露的数据,其半精度浮点性能(FP16)能够达到惊人的10 ExaFLOPS。
这台超级计算机基于Atos的BullSequana XH2000架构打造。每个计算节点都包含一颗尚未公布具体型号的Intel Xeon处理器、四块Nvidia A100 GPU,以及一张用于节点间高速互联的Mellanox HDR 200Gb/s InfiniBand网卡。刀片采用水冷散热设计,每个HPC机柜内可容纳32个刀片。
换算成更直观的数字:在标准的Top500基准测试中,Leonardo大约能提供200 Petaflops的算力。Nvidia将其定位为“全球最强大的AI系统”,这份底气正是源自那14000块GPU的强大计算能力。这套系统预计从今年年底开始,将彻底改变欧洲超级计算机版图的格局。
这台超算的核心使命,是为欧洲地区的高性能计算(HPC)提供坚实的基础支撑,尤其是要为科学研究和工业应用赋予先进的AI能力。为此,英伟达为整个集群配备了低延迟的Mellanox HDR InfiniBand网络,以确保各项性能指标能够顺利达成。
值得关注的是,Leonardo只是EuroHPC联合项目中的重要一环。同期规划的超级计算机集群还包括:位于卢森堡的MeluXina、斯洛文尼亚的Vega以及捷克的SuperCooling系统。展望未来,CINECA还计划在保加利亚、芬兰、葡萄牙和西班牙增设四台更强大的超算系统,更多细节将在后续陆续揭晓。
这些计算集群未来将服务于基因组分析、新型治疗路径探索、多源数据处理、太空探索与地外行星研究,以及极端天气模式模拟等前沿科学领域。
说到这台超算的硬件基石,对HPC行业有所了解的人一定对“Bull”系统不陌生,尤其是在欧洲市场。这家公司早在2014年就被Atos收购,但从外部视角来看,其技术内核几乎没有发生根本变化——直到今天,他们的HPC产品线(包括“Sequana”系列)依然沿用Bull的品牌。
过去数年间,Bull在欧洲一直是颇具知名度但整体规模并不算大的HPC集成商。尽管也曾取得过一些重要成就,但主要局限于研究机构和学术界,项目数量相对有限。不过,随着那次关键收购的发生,时代正在发生转向。
一个重要背景是,当年IBM将其x86服务器业务出售给联想,这在当时对HPC市场产生了连锁反应。IBM在高性能计算领域长期占据着关键地位,而联想距离欧洲用户较远。由于IBM拥有足够的本地化资源服务于多个计算中心,导致许多欧洲研究机构、政府机构、气象部门甚至大型企业的HPC系统长期依赖IBM的解决方案。
与此同时,另一家公司Cray也一直希望在欧洲市场打开局面,这种趋势持续增长,直到近期被HPE收购。Cray在气象和大型计算设备领域尤其活跃。虽然目前我们还未看到这种供应商格局变化带来的全面影响,但可以预见的是,未来几年内欧洲市场将会出现深刻调整。这并非因为Cray或IBM不合适,也不是技术本身发生了变化,而是因为欧洲一直渴望拥有属于自己的HPC供应商生态系统。
如今,Atos正处于欧洲市场有史以来最为强势的位置。这足以证明,它已经能够提供与Cray/HPE和IBM旗鼓相当、能够支撑多学科科学与工程计算的系统。甚至可以这样说:今天宣布的Leonardo超级计算机,将把Atos真正带入HPC世界的“大时代”。
目前还很难判断Leonardo正式进入Top500榜单时将位列第几名,但200 Petaflops的峰值性能已经足够拔尖(Nvidia将其称为基于FP16的10 ExaFLOPS级AI超级计算机)。在与Nvidia的Ian Buck的一次对话中,对方确认这是欧洲最强的AI超算:超过14000块A100 GPU,分布在Atos Sequana节点上,每个节点包含四块A100 GPU,并搭配了搭载Intel Rapids处理器和Mellanox HDR 200Gb/s网络的配置。
这笔采购由EuroHPC牵头。EuroHPC是欧洲各国政府与欧盟之间的联合合作项目,目标是在欧洲打造世界一流的超算生态和百亿亿次计算能力,并由欧盟委员会通过意大利大学和研究部提供资金支持。
NVIDIA解决方案架构与工程副总裁Marc Hamilton对此评价道:“欧洲的百亿亿次技术路线图为HPC和AI的快速增长与创新敞开了大门。我们正与CINECA和Atos密切合作,在广泛的应用领域加速科学探索,为迎接百亿亿级计算时代铺平道路。”
更具看点的悬念在于:明年会有多少HPC中心选择SuperPOD这种以AI为中心的计算架构?又有多少会选择Sequana中那种更偏向传统HPC工作负载的架构?从AI与HPC融合的大趋势来看,答案显而易见——AI和加速科学计算应用大概率都会是GPU密集型的,一部分专注AI的研发中心,势必将完整拥抱DGX或SuperPOD方案。
英伟达和合作伙伴正在欧洲范围内铺开多个基于SuperPOD的系统,同时也在夯实Sequana的软硬件生态。值得注意的是,这些系统的软件栈与支持体系极其庞大。因此,单纯重建SuperPOD硬件可能利润微薄,但生态层面的支持和粘性建设将是无价的——尤其是在欧洲扮演的角色比以往任何时候都更具雄心的当下。
