
英伟达发布全球最强GPU A100 80GB正式亮相
2020年11月16日,在加利福尼亚州圣克拉拉市举办的SC20大会上,NVIDIA正式推出A100 80GB GPU,这款旗舰产品将成为HGX AI超级计算平台的核心引擎。与半年前上市的40GB版本相比,GPU内存实现翻倍——研究人员和工程师如今能够将大规模模型与海量数据集直接加载运行,其速度与性能
2020年11月16日,在加利福尼亚州圣克拉拉市举办的SC20大会上,NVIDIA正式推出A100 80GB GPU,这款旗舰产品将成为HGX AI超级计算平台的核心引擎。与半年前上市的40GB版本相比,GPU内存实现翻倍——研究人员和工程师如今能够将大规模模型与海量数据集直接加载运行,其速度与性能提升将驱动AI与科学计算领域的新一轮突破。
先看硬件规格:A100 80GB搭载HBM2e高带宽内存,容量从40GB翻倍至80GB,同时内存带宽突破2TB/s。这一参数意义重大——数据能以极速传输至这颗全球最快的数据中心GPU,加速各类应用处理,从而消除最大规模模型和数据集的性能瓶颈。
NVIDIA应用深度学习研究副总裁Bryan Catanzaro在发布会上表示:“要获得HPC与AI领域的最新成果,就必须构建最大的模型,而这需要的内存容量和带宽远超以往。A100 80GB将内存做到前代的两倍,带宽突破2TB/s,研究人员终于能够直面全球科学和大数据中最棘手的挑战。”
同期,适用于NVIDIA DGX A100和DGX Station A100系统的A100 80GB GPU也同步亮相,计划本季度开始发货。首发厂商包括源讯、戴尔科技、富士通、技嘉科技、慧与、浪潮、联想、云达科技、超微——几乎覆盖全球所有一线服务器制造商。这些厂商将于2021年上半年推出基于HGX A100集成底板的系统,底板支持选配4至8块A100 80GB GPU。
应对大流量数据工作负载需求
A100 80GB继承了40GB版本的全部多样化能力,但内存翻倍后,特别适合那些需要海量存储空间的场景。
例如,推荐系统模型(如DLRM)需要处理涵盖数十亿用户和产品的数据表,A100 80GB可实现高达3倍的训练加速,使企业能够更快地重新训练模型,从而提供更精准的推荐。
在HGX服务器上,A100 80GB还能训练如GPT-2这样的超大参数模型——GPT-2的文本生成能力已相当出色。充足的内存使得数据或模型并行架构不再必要,跨多个节点的低效方案终于得以淘汰。
多实例GPU(MIG)技术同步升级:A100可划分为最多7个独立实例,每个实例配备10GB内存。这种硬件隔离机制可在处理多样小规模工作负载时实现GPU利用率最大化。以自动语音识别模型RNN-T为例,单个A100 80GB的MIG实例能够处理更大批量的数据,推理吞吐量提升1.25倍。
大数据分析方面:在TB级零售大数据基准测试中,A100 80GB将性能提升至2倍,企业能够实时处理动态更新的数据集,迅速做出关键决策。
科学应用亦受益匪浅。材料模拟软件Quantum Espresso在单节点A100 80GB上实现了近2倍的吞吐量提升,对天气预报、量子化学等领域具有重大意义。
RIKEN计算科学中心负责人Satoshi Matsuoka评价道:“快速、充足的内存带宽与容量对高性能超级计算应用至关重要。A100 80GB提供2TB/s的全球最快带宽,可大幅提升应用性能。”
A100 80GB关键特性
A100 80GB集成了NVIDIA Ampere架构的突破性能力:
- **第三代Tensor Core核心**:借助全新TF32,AI吞吐量较Volta架构提升高达20倍;通过FP64,HPC性能提升2.5倍;通过INT8,AI推理性能提升20倍,同时支持BF16数据格式。
- **更大、更快的HBM2e GPU内存**:内存容量翻倍,率先实现超过2TB/s的内存带宽。
- **MIG技术**:每个独立实例的内存同样翻倍,最多可提供7个MIG,每个实例配备10GB内存。
- **结构化稀疏**:将推理稀疏模型的速度提升2倍。
- **第三代NVLink和NVSwitch**:GPU间带宽翻倍,数据密集型工作负载的传输速度可达每秒600GB。
NVIDIA HGX AI 超级计算平台
A100 80GB GPU是NVIDIA HGX AI超级计算平台的核心组件。该平台整合NVIDIA GPU、NVLink、InfiniBand网络以及全面优化的AI与HPC软件堆栈,为各类应用提供卓越性能。研究人员和科学家得以融合HPC、数据分析与深度学习计算技术,共同推动科学前沿。


来源:https://m.elecfans.com/article/1383508.html
相关热点
继续查看同栏目近期热点。
延伸阅读
补充最近整理过的热点入口。
