游乐游手机版
首页/AI热点日报/热点详情

全球首个搭载NVIDIA M2050 GPU的云实例开启GPU云计算下一个十年

类型:热点整理2026-07-02
十年前,AWS 推出了首款配备 NVIDIA M2050 GPU 的实例。彼时,CUDA 主要用于科学模拟加速,人工智能与深度学习尚未萌芽。 此后,AWS 云端 GPU 产品线持续扩展:从 K80(p2)、K520(g3)、M60(g4)、V100(p3 p3dn)到 T4(g4)……硬件迭代不

十年前,AWS 推出了首款配备 NVIDIA M2050 GPU 的实例。彼时,CUDA 主要用于科学模拟加速,人工智能与深度学习尚未萌芽。

此后,AWS 云端 GPU 产品线持续扩展:从 K80(p2)、K520(g3)、M60(g4)、V100(p3 / p3dn)到 T4(g4)……硬件迭代不断提速。

如今,全新的 AWS P4d 实例正式全面上市,搭载最新一代 NVIDIA A100 Tensor Core GPU——这标志着加速计算的又一个十年正式启航。

这款 P4d 实例堪称专为机器学习训练与高性能计算打造的顶级 GPU 平台。与默认 FP32 精度相比,FP16 模型训练时间最多缩短 3 倍,而 TF32 模型训练时间更是直降 6 倍,性能提升幅度显著。

推理性能同样出色。在最新的 MLPerf Inference 基准测试中,NVIDIA A100 表现领先,与 CPU 相比,性能提升高达 237 倍。

每个 P4d 实例内置八颗 A100 GPU,通过 AWS UltraClusters,客户可借助 Elastic Fabric Adapter(EFA)及 Amazon FSx 提供的可扩展高性能存储,按需同时访问超过 4,000 个 GPU。网络带宽高达 400Gbps,结合 NVLink、NVSwitch、NCCL 和 GPUDirect RDMA 等 NVIDIA 核心技术支持,深度学习训练工作负载得到进一步加速。值得一提的是,EFA 上的 GPUDirect RDMA 可在服务器之间直接通过 GPU 传输数据,绕过 CPU 与系统内存,延迟极低。

此外,大量 AWS 服务均已支持 P4d 实例,包括 Amazon Elastic Container Services、Amazon Elastic Kubernetes Service、AWS ParallelCluster 和 Amazon SageMaker。NGC 中经过优化的容器化软件——涵盖 HPC 应用、AI 框架、预训练模型、Helm 图表,以及 TensorRT 和 Triton Inference Server 等推理工具——同样可以直接调用。

目前,P4d 实例已在美国东部和西部区域上线,后续将快速扩展至更多区域。购买方式灵活多样:支持按需实例、Savings Plans、预留实例或竞价型实例,可按需选择。

GPU 云计算的头十年,已为市场累计提供超过 100 exaflops 的 AI 算力。如今,随着 A100 驱动的 P4d 实例落地,下一个十年必将迎来一个精彩的起点。

NVIDIA 与 AWS 持续助力各类应用突破 AI 边界,接下来就看客户如何驾驭这股强大算力了。

来源:https://m.elecfans.com/article/1366821.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。