AI算力瓶颈凸显：如何突破存力不足的隐形制约

时间：2026-05-16 18:09

人工智能发展重心转向推理，存储能力成为新瓶颈。大模型应用对数据存取速度要求苛刻，存储效率不足易导致算力空转。业界正通过技术优化提升存储性能，并推动制定标准以促进存算协同。存储从被动承载转向主动驱动，其突破将深刻影响AI产业发展。

5月15日消息，人工智能大模型的竞争格局正发生深刻变化。随着技术重心从模型训练转向实际推理，从云端部署下沉至千行百业，单纯依赖算力堆叠已难以构建持久的竞争优势。

在中国电子工业标准化技术协会数据存储专业委员会近期举办的“凝共识、探未来，走进先进存力”研讨活动中，一个核心观点成为共识：存储性能，正成为制约AI向更深层次、更广范围应用拓展的关键瓶颈，其战略价值亟待被充分认识和挖掘。

算力突飞猛进，存力成为短板

赛迪顾问电子信息产业研究中心副总经理袁钰分析指出，AI应用正从早期的个人娱乐场景，快速渗透到金融、制造、医疗等生产与生活的核心领域，任务复杂度和实时性要求呈指数级增长。大模型推理、AI智能体等应用的普及，使得数据存取的速度与系统响应延迟直接决定了用户体验。“当用户输入一段指令，如果模型回应迟缓或答案不精准，其背后往往可以追溯到数据存储与调取的效率问题。”

中电标协副理事长兼秘书长丁然的观点更为直接：“当前，AI发展的主要矛盾已从算力瓶颈转向存力瓶颈。”她进一步解释，面对万亿级参数模型、百万级token的超长上下文处理需求，存储系统的带宽和延迟面临着前所未有的挑战。而GPU及HBM（高带宽内存）的容量与带宽终究有限，这常常导致昂贵的GPU算力资源处于“等待数据供给”的闲置状态。整个AI系统的性能瓶颈，已从“计算是否足够快”演变为“数据能否被足够快地搬运到计算单元”。

中电标协数据存储专委会秘书长孙钢深入阐释了这一转变。他认为，在AI时代，存储与计算的关系正在发生根本性重塑。“传统架构中，存储更像一个被CPU调用的‘数据仓库’；而在AI计算场景中，GPU需要直接、高速地向存储索取海量数据。如果数据访问路径仍需经过CPU中转，大部分宝贵的时间就将消耗在漫长的等待上。”

他做了一个生动的比喻：“算力好比冲锋在前的先锋部队，但现在制约其战斗力的关键却在于后勤补给——也就是存储。一旦存储性能跟不上，再强大的算力也难免陷入空转。”尤其在模型推理场景下，KV Cache（键值缓存）、长文本支持、热温冷数据分层存储等新需求，都在倒逼存储的角色从“辅助运算”转向“存算协同”甚至“存算一体”。他预测，未来的智能存储系统或许还需要具备对数据内容的初步“理解”与预处理能力，而不再只是被动地存放比特。

作为行业实践者，中科曙光北京公司总裁助理、分布式存储产品部总经理石静分享了来自一线的观察。她指出，存储正从被动的“业务承载者”转变为主动的“系统效率决定者”。“我们在众多客户案例中发现，存储常常成为整个AI系统的性能短板——算力配置很高、网络速度很快，但存储却拖了后腿。为此，业界进行了大量技术创新，例如利用本地NVMe SSD构建全局共享缓存池、采用GDS（GPU Direct Storage）技术让GPU直接绕过CPU访问存储。在实际应用中，这些优化使得某自动驾驶万卡集群的GPU有效利用率提升了30%以上，而在AI for Science（科学计算AI）场景中，模型训练时间则缩短了20%到30%。”

不过，石静也坦言，目前的许多改进仍带有“被动应对”的色彩——正是因为存储成为了瓶颈，所以不得不进行优化。她更期待下一阶段的“主动引领”式变革：“我们能否真正围绕数据本身的价值流，去重构整个技术栈和生态？例如，以KV Cache的高效管理为中心来设计下一代推理框架，甚至以数据资产为中心，重新审视其在全生命周期内的确权、流动与安全。当前行业仍习惯围绕计算来规划工作，希望未来存储能真正跳出被动适配的角色，成为驱动业务模式创新的核心牵引力。”

应对瓶颈：标准统一与产业协同刻不容缓

面对存力成为AI发展新瓶颈的现实，建立统一的行业技术标准与协同机制显得尤为迫切。丁然透露，中电标协正从三个维度着力推动：一是标准先行，牵头制定AI场景下存算一体接口、能效评估、系统兼容性等方面的关键标准；二是架构创新，积极推动CXL（Compute Express Link）、GPU直连存储等新技术的标准化与产业化落地；三是生态构建，汇聚产业链上下游力量，形成存力与算力协同发展的健康产业格局。

孙钢补充强调，当前各厂商的解决方案路径尚不统一，相关知识也呈碎片化分布。他呼吁产业界应尽快建立面向AI的存储价值综合评估体系，不能仅关注容量、可靠性等传统指标，还需重点评估其在推理加速、向量数据库构建、训练效率提升等方面的实际业务效能。据他透露，旨在定义新一代AI存储能力要求的相关框架标准，预计将在今年年中正式发布。

石静则从企业实践角度指出，AI为存储行业按下了发展的加速键，但这个战略窗口期非常短暂。“AI算力的演进速度日新月异，存储厂商必须快速从最终用户侧捕获真实、迫切的需求，放弃过去追求‘大而全’通用产品的传统思路，转而深入聚焦于自动驾驶、大模型训练、科学计算等细分场景，实现产品的快速迭代与精准优化。”她表示，中科曙光已在下一代分布式存储架构、存算协同优化、绿色低碳存储等多个技术方向加速布局，以全面应对这场由AI浪潮催生的深度存储变革。

当算力的竞争步入深水区，“存力”这个曾经默默支撑的后台基石，正稳步走向舞台中央。能否成功突破存储性能瓶颈，不仅关乎未来AI基础设施的竞争格局，更在根本上决定了我国人工智能产业的应用深度与发展速度。

来源：https://www.techweb.com.cn/it/2026-05-16/2975530.shtml

人工智能

上一篇微软确认部分Win11设备安装5月更新失败卡在35%至36%进度 下一篇苹果收购一人公司Patchflyer 今年一月完成交易

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。