先说个行业动态:NVIDIA 今日正式推出名为 NVIDIA AI Enterprise 的软件套件,并专门针对 VMware vSphere 7 Update 2 完成了深度优化、认证与全面支持。这并非一次小规模合作,而是两家行业巨头联手,将 AI 工作负载顺利迁移至虚拟化环境——想想看,全球数十万家依托 vSphere 运行数据中心的企业,如今能够使用同一套熟悉的管理工具来驾驭 AI 应用。

该套件的核心价值在于:将 NVIDIA 多年打磨的企业级 AI 工具与框架进行整合打包,确保它们能够在 vSphere 上高效、稳定地运行。过去,AI 几乎完全依赖裸金属服务器,但此次合作打破了这一惯例——NVIDIA 与 VMware 通过业内首创的方式,共同构建了一个 AI 就绪的企业级平台。这意味着,医疗健康领域的高级诊断、制造业的智能工厂、金融行业的欺诈检测等场景,均能更加轻松地落地实施。
对 IT 团队来说,这无疑是释放生产力的重大利好。以往部署 AI 需要单独配备裸机集群,管理复杂且成本高昂。而现在,使用 vSphere 上熟悉的工具链,就能为 AI 应用提供可扩展、多节点的高性能支持,效果与裸金属几乎无异。NVIDIA 副总裁 Justin Boitano 的原话是:“此前全球都在裸金属上运行 AI。借助 NVIDIA AI Enterprise,客户能够将 AI 模型开发周期从 80 周缩短至 8 周。” 这一效率提升堪称惊人。
VMware 方面同样态度积极,云平台营销副总裁 Lee Caswell 直言:每家企业都在思考如何让基础设施跟上 AI 的发展节奏。现在,NVIDIA AI Enterprise 搭配 vSphere 7 Update 2,相当于为虚拟化数据中心装上了一台 AI 引擎,客户能够快速上手,部署经过认证的 AI 就绪型基础设施。
推动先进企业级 AI 的落地与发展
率先尝鲜的企业中,就包括联合健康集团旗下的 Optum Technology。该公司的技术负责人 Justin Potuznik 指出,AI 在其提供的数据驱动型服务中扮演着越来越关键的角色,而在 VMware vSphere 上运行 NVIDIA AI Enterprise,恰好能够支撑现代化应用工作负载,实现企业级 AI 的高效部署。简而言之,这是一个标杆案例——大型企业已经开始采用,效果值得期待。
灵活的混合云 AI 基础设施
NVIDIA AI Enterprise 的兼容性同样值得关注。它支持混合云环境中各种加速 CUDA 应用、主流 AI 框架、预训练模型以及 SDK。经过优化的工作负载能够在多个节点上横向扩展,甚至能够满足大型深度学习训练所需的大规模 GPU 虚拟化需求。底层硬件基于 NVIDIA A100 Tensor Core GPU,且这些服务器均已通过 NVIDIA 认证系统认证——戴尔、新华三、慧与、浪潮、联想、超微等主流厂商的产品均在其列。客户购买 NVIDIA AI Enterprise 许可证后,可直接获得 NVIDIA 的技术支持,省心省力。
此外,vSphere 已被认证为唯一一款能够配合 NVIDIA 多实例 GPU(MIG)技术进行实时迁移的虚拟化软件。该技术可将每块 A100 GPU 在硬件层面划分为最多 7 个独立实例,让不同规模的工作负载都能高效运行,避免算力浪费。同时,部分 NVIDIA ConnectX 网卡也已通过 VMware vSAN over RDMA 认证,能够卸载 CPU 通信任务,进一步提升应用性能并优化基础设施的投资回报率。
最后来看定价:NVIDIA AI Enterprise 采用永久许可证模式,每个 CPU 插槽定价 3,595 美元。企业级标准支持服务每年每许可证 899 美元。若已计划升级到 vSphere 7 Update 2,还可申请早期试用。综合来看,这是一套投入产出比相当划算的 AI 基础设施方案。
