全球首个搭载NVIDIA M2050 GPU的云实例开启GPU云计算下一个十年_AI热点日报

全球首个搭载NVIDIA M2050 GPU的云实例开启GPU云计算下一个十年

类型：热点整理2026-07-02

十年前，AWS 推出了首款配备 NVIDIA M2050 GPU 的实例。彼时，CUDA 主要用于科学模拟加速，人工智能与深度学习尚未萌芽。此后，AWS 云端 GPU 产品线持续扩展：从 K80（p2）、K520（g3）、M60（g4）、V100（p3 p3dn）到 T4（g4）……硬件迭代不

十年前，AWS 推出了首款配备 NVIDIA M2050 GPU 的实例。彼时，CUDA 主要用于科学模拟加速，人工智能与深度学习尚未萌芽。

此后，AWS 云端 GPU 产品线持续扩展：从 K80（p2）、K520（g3）、M60（g4）、V100（p3 / p3dn）到 T4（g4）……硬件迭代不断提速。

如今，全新的 AWS P4d 实例正式全面上市，搭载最新一代 NVIDIA A100 Tensor Core GPU——这标志着加速计算的又一个十年正式启航。

这款 P4d 实例堪称专为机器学习训练与高性能计算打造的顶级 GPU 平台。与默认 FP32 精度相比，FP16 模型训练时间最多缩短 3 倍，而 TF32 模型训练时间更是直降 6 倍，性能提升幅度显著。

推理性能同样出色。在最新的 MLPerf Inference 基准测试中，NVIDIA A100 表现领先，与 CPU 相比，性能提升高达 237 倍。

每个 P4d 实例内置八颗 A100 GPU，通过 AWS UltraClusters，客户可借助 Elastic Fabric Adapter（EFA）及 Amazon FSx 提供的可扩展高性能存储，按需同时访问超过 4,000 个 GPU。网络带宽高达 400Gbps，结合 NVLink、NVSwitch、NCCL 和 GPUDirect RDMA 等 NVIDIA 核心技术支持，深度学习训练工作负载得到进一步加速。值得一提的是，EFA 上的 GPUDirect RDMA 可在服务器之间直接通过 GPU 传输数据，绕过 CPU 与系统内存，延迟极低。

此外，大量 AWS 服务均已支持 P4d 实例，包括 Amazon Elastic Container Services、Amazon Elastic Kubernetes Service、AWS ParallelCluster 和 Amazon SageMaker。NGC 中经过优化的容器化软件——涵盖 HPC 应用、AI 框架、预训练模型、Helm 图表，以及 TensorRT 和 Triton Inference Server 等推理工具——同样可以直接调用。

目前，P4d 实例已在美国东部和西部区域上线，后续将快速扩展至更多区域。购买方式灵活多样：支持按需实例、Savings Plans、预留实例或竞价型实例，可按需选择。

GPU 云计算的头十年，已为市场累计提供超过 100 exaflops 的 AI 算力。如今，随着 A100 驱动的 P4d 实例落地，下一个十年必将迎来一个精彩的起点。

NVIDIA 与 AWS 持续助力各类应用突破 AI 边界，接下来就看客户如何驾驭这股强大算力了。

来源：https://m.elecfans.com/article/1366821.html

IDIA

延伸阅读

补充最近整理过的热点入口。

全球首个搭载NVIDIA M2050 GPU的云实例开启GPU云计算下一个十年

相关热点

延伸阅读