游乐游手机版
首页/AI热点日报/热点详情

解决AI落地最后一公里的关键方法

类型:热点整理2026-07-03
人工智能落地面临数据整合困难、专业人才稀缺等重大挑战。英伟达推出认证系统,通过软硬件堆栈优化极大降低应用门槛、提升部署效率。首批戴尔、浪潮等认证服务器已供货,旨在推动人工智能在产业端广泛落地应用,加速行业数字化转型。

人工智能(AI)技术虽好,但为何在实际企业落地中总是困难重重?这无疑是当前企业数字化转型过程中最令人头疼的挑战之一。业界普遍认为,AI落地面临四大阻力:数据整合困难、业务价值不清晰、数据科学人才稀缺以及算力成本过高。简而言之,AI落地的“最后一公里”,核心痛点可以归结为两个关键点——降低使用门槛与提升应用效率。

如何解决AI落地面临的最后一公里

用比喻来理解会更直观:假设企业使用AI的最终目标是制作一个大蛋糕,难道必须从种植小麦开始吗?显然不是。更明智、更高效的方法是直接获取现成的面粉、黄油、鸡蛋、模具等基础材料。英伟达(NVIDIA)正携手生态伙伴,致力于提供这些“现成材料”。他们最近发起的全球首个NVIDIA认证系统,核心目标非常明确:通过扎实的技术底座与广泛的生态合作,推动AI真正在各行各业“落地运行”。

AI基础设施亟需一场变革

从数据来看,Gartner的统计显示,目前仅有37%的企业机构在生产环境中应用了AI,但预计到2024年,这一比例将翻倍至75%。AI无疑是当今时代最具影响力的技术之一,但它需要新一代经过专门优化和测试的计算机基础设施来支撑。换言之,一场基础设施层面的变革已刻不容缓。

英伟达NGC产品管理总监Adel El-Hallak指出,这场变革主要由三大驱动力引发:爆发式增长的数据量、日益庞大和复杂的AI模型,以及企业对更优质产品和服务的不懈追求。

一方面,企业试图从持续膨胀的数据中挖掘隐藏的战略洞察。例如,沃尔玛每小时需处理超过2.5PB的数据;阿里巴巴则利用AI优化搜索排名与产品推荐。另一方面,短短5年间,用于筛选数据的AI模型规模暴增了近3万倍,模型种类和工作负载多样性也在急剧扩大。数据洪流与模型膨胀导致数据中心和网络边缘的流量呈指数级增长。企业若想获得更好的产品与服务,一个安全、可靠、高速且可扩展的基础设施便成为不可或缺的关键。

解锁海量应用场景的关键

Adel El-Hallak以计算机视觉领域的图像分类、目标检测等应用为例,指出一个有趣现象:AI模型解锁了众多不同的用例,提供了更好的产品和服务,但模型本身也变得愈发复杂和庞大。然而,这实际上是一个良性循环——当我们使用这些产品和服务时,又会不断生成新数据,这些数据可用于对模型进行再训练,从而进一步优化现有产品和服务。

无论是从终端到数据中心,还是通过智能网络接入的海量应用,AI基础设施的四大支柱始终不变:功能、性能、可扩展性、安全性。基本功能是根本;性能特征取决于具体用例,是系统的重要衡量指标;可扩展性决定系统应对不同场景的伸缩能力;而数据安全是核心优势,必须确保从数据、平台到应用层的全方位安全。

为了让AI技术广泛落地,服务器OEM成为英伟达的一个重要突破口。可以说,服务器OEM生态系统的参与让英伟达更加振奋。从早期集中于训练场景,到如今在推理场景的大规模应用,AI最终将演变为一种基础能力。在这个过程中,服务器始终是关键环节。一方面,AI算法需要海量数据和算力来执行任务,这离不开云服务的支撑;另一方面,在提供智能云体验方面,由AI驱动的解决方案能帮助企业在激烈竞争中快速占据制高点。

据Adel El-Hallak介绍,NVIDIA认证系统能够提供企业部署AI所需的性能、可编程性和安全吞吐量。这些系统不仅结合了基于NVIDIA Ampere架构的GPU算力,还有安全、高速的NVIDIA Mellanox网络。更重要的是,背后还有包括英伟达CUDA和NGC Catalog在内的整个软件堆栈提供支持。

NGC被认为是这套认证系统背后的真正宝藏。Adel El-Hallak解释说,当企业购买了NVIDIA认证系统后,NGC目录能够为他们解锁各种各样的应用程序。NGC目录是一个专门为深度学习、机器学习和高性能计算优化的GPU软件中心,里面包含了针对医疗健康的Clara、针对机器人的Isaac等垂直细分领域的软件套件,能帮助企业快速进入特定市场。此外,它还包含帮助企业在推荐系统Merlin和智能视频分析Metropolis等新兴用例中起步的框架。通过NVIDIA认证系统,企业能同时获得强大的算力硬件和适用范围广泛的软件。

如何通过NVIDIA测试认证?

具体来看,NVIDIA认证系统必须通过四方面的严格测试:深度学习训练和推理、机器学习算法、智能视频分析、网络和存储卸载。为通过认证,服务器系统必须经受广泛的工作负载测试,覆盖从需要多个计算节点协同工作的任务,到仅使用单个GPU部分性能的轻量级任务。这些测试均基于现实世界中的实际用例,调用的是NGC目录中常用的AI框架和容器。

这项开创先河的认证计划发布的同一天,全球首批加速服务器也顺利通过了认证测试:戴尔科技、技嘉、慧与、浪潮和超微的认证服务器均于1月27日开始供货。首批使用NVIDIA A100 Tensor Core GPU的系统包括:

戴尔EMC PowerEdge R7525和R740机架服务器
技嘉R281-G30、R282-Z96、G242-Z11、G482-Z54、G492-Z51系统
慧与 Apollo 6500 Gen10系统和慧与 ProLiant DL380 Gen10服务器
浪潮 NF5488A5
超微A+服务器AS-4124GS-TNR和AS-2124GQ-NART

这些产品都会贴上NVIDIA认证系统标识,意味着它们能够处理机器学习、数据分析等领域最棘手的任务。

写在最后

在AI走向深度化、广度化的过程中,“落地难”几乎是每家企业的共同心声。一方面是规模化普及时数据科学人才的短缺,另一方面是多维行业数据融合的困难。更不用说,目前还有大量应用场景的需求尚未被释放,而人才短缺正是根源所在。

英伟达推出认证系统,显然是希望借助生态的力量,推动AI的广泛落地。而背后的深层动力,则是希望在普遍落地的产业端,延续其在云端市场的辉煌。对于迫切需要平台支持、让AI应用更便捷的企业来说,这无疑是一个巨大的助推力。

来源:https://m.elecfans.com/article/1311544.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。