GB300与NVL72创MLPerf纪录:10分钟训完4050亿参数大模型

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
2025年11月13日,有技术博客于昨日发布报告指出,在最新一轮的MLPerf人工智能训练基准测试中,基于Blackwell Ultra架构的GB300 NVL72平台在全部七项测试项目中均取得首位,展现出卓越的性能优势。
该报告提到,此次测试中最引人瞩目的成绩是,GB300 NVL72平台仅用10分钟便完成了对参数规模达4050亿的Llama 3.1大模型的训练任务。在其他关键测试中,其表现同样突出:完成Llama 2 70B模型的LoRA微调仅需0.4分钟,训练Llama 3.1 8B模型也仅耗时5.2分钟。
与前代产品相比,Blackwell Ultra架构实现了大幅提升。测试数据显示,在Llama 2 70B模型的微调任务中,使用8块GB300 GPU所达到的性能是相同数量H100 GPU的5倍。在Llama 3.1 405B模型的预训练任务中,GB300的性能超过H100的4倍,同时比同属Blackwell架构的GB200平台快接近2倍。
这一系列性能突破得益于软硬件协同优化的设计理念。硬件配置方面,GB300 NVL72系统搭载了传输速率达800GB/s的Quantum-X800 InfiniBand高速互联网络,每颗GPU配备279GB的HBM3e高带宽内存,整个系统的GPU与CPU总内存容量高达40TB。
在软件技术层面,全面启用FP4精度成为关键因素。通过在模型训练的每一层均采用FP4精度,计算效率相比FP8提升一倍,而Blackwell Ultra架构进一步将这一优势增强至3倍,显著加快了训练速度。
热门专题
热门推荐
清明节假期期间,A 股和港股休市,但比特币行情永不停歇。 4月6日,当多数市场还在假期中沉睡时,比特币已经悄然启动。价格从亚洲早盘的低点67400美元出发,一路向上试探,盘中最高涨破70300美元,不仅刷新了3月26日以来的高位,较日内低点的涨幅也超过了4%。以太坊的表现同样不俗,从2050美元附近
4月5日消息,日前,REDMI K90至尊版通过3C认证,预计将于本月发布。今日,小米中国区市场部总经理魏思琪用小米新机发布微博,不出意外,这正是即将登场的REDMI K90至尊版,这将是小米首款配
WPS演示中图表不随数据更新时,可通过四种方法实现自动同步:一、用OFFSET+COUNTA定义动态名称绑定图表;二、用组合框控件联动VLOOKUP提取数据;三、用数据透视图配合切
聚焦数字技术,释放创新动能。为集中展示静安区区块链技术从“实验室”走向“应用场”的丰硕成果,挖掘一批可复制、可推广的行业解决方案,加速构建区块链产业生态闭环,静安区数据局特推出“静安区区块链创新应用
太空中的马桶堵了,边飞边修还能勉强用。但中东被点燃的火药桶,美国怎么来扑灭?靠一再延期的“最后通牒”?还是靠无底线的轰炸?2300万美元的马桶美国航空航天局4名宇航员1日搭乘“猎户座”飞船升空,执行





