AI算力瓶颈凸显:如何突破存力不足的隐形制约
5月15日消息,人工智能大模型的竞争格局正发生深刻变化。随着技术重心从模型训练转向实际推理,从云端部署下沉至千行百业,单纯依赖算力堆叠已难以构建持久的竞争优势。
在中国电子工业标准化技术协会数据存储专业委员会近期举办的“凝共识、探未来,走进先进存力”研讨活动中,一个核心观点成为共识:存储性能,正成为制约AI向更深层次、更广范围应用拓展的关键瓶颈,其战略价值亟待被充分认识和挖掘。
算力突飞猛进,存力成为短板
赛迪顾问电子信息产业研究中心副总经理袁钰分析指出,AI应用正从早期的个人娱乐场景,快速渗透到金融、制造、医疗等生产与生活的核心领域,任务复杂度和实时性要求呈指数级增长。大模型推理、AI智能体等应用的普及,使得数据存取的速度与系统响应延迟直接决定了用户体验。“当用户输入一段指令,如果模型回应迟缓或答案不精准,其背后往往可以追溯到数据存储与调取的效率问题。”

中电标协副理事长兼秘书长丁然的观点更为直接:“当前,AI发展的主要矛盾已从算力瓶颈转向存力瓶颈。”她进一步解释,面对万亿级参数模型、百万级token的超长上下文处理需求,存储系统的带宽和延迟面临着前所未有的挑战。而GPU及HBM(高带宽内存)的容量与带宽终究有限,这常常导致昂贵的GPU算力资源处于“等待数据供给”的闲置状态。整个AI系统的性能瓶颈,已从“计算是否足够快”演变为“数据能否被足够快地搬运到计算单元”。
中电标协数据存储专委会秘书长孙钢深入阐释了这一转变。他认为,在AI时代,存储与计算的关系正在发生根本性重塑。“传统架构中,存储更像一个被CPU调用的‘数据仓库’;而在AI计算场景中,GPU需要直接、高速地向存储索取海量数据。如果数据访问路径仍需经过CPU中转,大部分宝贵的时间就将消耗在漫长的等待上。”
他做了一个生动的比喻:“算力好比冲锋在前的先锋部队,但现在制约其战斗力的关键却在于后勤补给——也就是存储。一旦存储性能跟不上,再强大的算力也难免陷入空转。”尤其在模型推理场景下,KV Cache(键值缓存)、长文本支持、热温冷数据分层存储等新需求,都在倒逼存储的角色从“辅助运算”转向“存算协同”甚至“存算一体”。他预测,未来的智能存储系统或许还需要具备对数据内容的初步“理解”与预处理能力,而不再只是被动地存放比特。
作为行业实践者,中科曙光北京公司总裁助理、分布式存储产品部总经理石静分享了来自一线的观察。她指出,存储正从被动的“业务承载者”转变为主动的“系统效率决定者”。“我们在众多客户案例中发现,存储常常成为整个AI系统的性能短板——算力配置很高、网络速度很快,但存储却拖了后腿。为此,业界进行了大量技术创新,例如利用本地NVMe SSD构建全局共享缓存池、采用GDS(GPU Direct Storage)技术让GPU直接绕过CPU访问存储。在实际应用中,这些优化使得某自动驾驶万卡集群的GPU有效利用率提升了30%以上,而在AI for Science(科学计算AI)场景中,模型训练时间则缩短了20%到30%。”
不过,石静也坦言,目前的许多改进仍带有“被动应对”的色彩——正是因为存储成为了瓶颈,所以不得不进行优化。她更期待下一阶段的“主动引领”式变革:“我们能否真正围绕数据本身的价值流,去重构整个技术栈和生态?例如,以KV Cache的高效管理为中心来设计下一代推理框架,甚至以数据资产为中心,重新审视其在全生命周期内的确权、流动与安全。当前行业仍习惯围绕计算来规划工作,希望未来存储能真正跳出被动适配的角色,成为驱动业务模式创新的核心牵引力。”
应对瓶颈:标准统一与产业协同刻不容缓
面对存力成为AI发展新瓶颈的现实,建立统一的行业技术标准与协同机制显得尤为迫切。丁然透露,中电标协正从三个维度着力推动:一是标准先行,牵头制定AI场景下存算一体接口、能效评估、系统兼容性等方面的关键标准;二是架构创新,积极推动CXL(Compute Express Link)、GPU直连存储等新技术的标准化与产业化落地;三是生态构建,汇聚产业链上下游力量,形成存力与算力协同发展的健康产业格局。
孙钢补充强调,当前各厂商的解决方案路径尚不统一,相关知识也呈碎片化分布。他呼吁产业界应尽快建立面向AI的存储价值综合评估体系,不能仅关注容量、可靠性等传统指标,还需重点评估其在推理加速、向量数据库构建、训练效率提升等方面的实际业务效能。据他透露,旨在定义新一代AI存储能力要求的相关框架标准,预计将在今年年中正式发布。
石静则从企业实践角度指出,AI为存储行业按下了发展的加速键,但这个战略窗口期非常短暂。“AI算力的演进速度日新月异,存储厂商必须快速从最终用户侧捕获真实、迫切的需求,放弃过去追求‘大而全’通用产品的传统思路,转而深入聚焦于自动驾驶、大模型训练、科学计算等细分场景,实现产品的快速迭代与精准优化。”她表示,中科曙光已在下一代分布式存储架构、存算协同优化、绿色低碳存储等多个技术方向加速布局,以全面应对这场由AI浪潮催生的深度存储变革。
当算力的竞争步入深水区,“存力”这个曾经默默支撑的后台基石,正稳步走向舞台中央。能否成功突破存储性能瓶颈,不仅关乎未来AI基础设施的竞争格局,更在根本上决定了我国人工智能产业的应用深度与发展速度。
相关攻略
人工智能技术正为中国市场开启新的发展窗口。业界观点指出,AI在产业应用层面带来了切实机遇,其与制造业、医疗、金融等领域的融合不断深化。技术迭代与算力发展正推动传统行业数字化转型,而构建健康的技术生态与人才培养体系,将是把握这一机遇、实现可持续发展的关键。未来,人工智能有望在更广泛的场景中创造价值。
数字孪生技术作为驱动数字经济高质量发展的核心引擎,其应用版图正从智慧城市、智慧水利加速拓展至能源电力、交通运维、智慧仓储等关键领域。产业落地进程持续提速,市场规模年复合增长率超过30%——在这蓬勃发展的浪潮之下,一个严峻的现实挑战也浮出水面:行业专业人才缺口已超过百万大关。 特别是那些既精通三维可视
在刚刚结束的一季报业绩说明会上,中芯国际联合CEO赵海军向市场传递了明确的乐观信号。基于当前清晰的客户需求与在手订单状况,公司对今年整体运营情况的展望,较上一季度显得更为积极。 这份乐观并非空xue来风,其背后是多重动能的强劲支撑。首要驱动力,无疑是人工智能浪潮对配套芯片的强劲需求,直接导致了公司电
机器人连续运行超过30小时无需停机——这并非科幻情节,而是正在直播中真实呈现的工业自动化突破。 据《科创板日报》15日报道,Figure公司创始人布雷特·阿德科克正式宣布,其最新一代F 03机器人已在公开直播环境下,实现了超过30小时的不间断作业。尤为关键的是,在整个运行周期内,系统未发生任何计划外
据《科创板日报》独家披露,百度近期对其人工智能业务的组织架构进行了一次重要升级,核心举措是成立了全新的“百度模型委员会”(Baidu Model Committee,简称BMC)。 据悉,该委员会成员以对AI大模型技术有深刻理解和前瞻视野的年轻研究员为主。在组织架构上,百度的基础模型研发部(BMU)
热门专题
热门推荐
英伟达Omniverse定位为物理AI操作系统。松应科技推出ORCALab1 0,旨在构建基于国产GPU的物理AI训练体系。针对机器人行业数据成本高、仿真迁移难的问题,平台提出“1:8:1黄金数据合成策略”,并通过高精度仿真提升数据可用性。平台将仿真与训练集成于个人设备,降低开发门槛,核心战略是在英伟达生态垄断下推动国产替。
Concordium是一个注重合规与隐私的区块链平台,其原生代币为CCD。该平台通过内置身份验证机制平衡隐私与监管要求,旨在服务企业级应用。CCD用于支付交易手续费、网络治理及生态内服务结算。其经济模型包含释放与销毁机制,以维持代币价值稳定。项目在合规金融、供应链、数字身份等领域有应用潜力。
上海人工智能实验室联合多家机构发起国产软硬件适配验证计划,致力于打造覆盖AI全流程的验证平台与自主生态社区。该平台旨在解决国产算力与应用协同难题,构建从芯片到应用的全链路验证体系,支持多种软硬件适配,推动国产AI技术向“好用、易用”发展。商汤科技依托AI大装置深度参与,已。
具身智能行业资本火热,但曾估值超200亿元的达闼科技迅速崩塌。其失败主因在于创始人黄晓庆以通信行业思维经营机器人业务,过度依赖政商关系与资本运作,技术产品突破有限;同时股权结构复杂分散,倚重政府基金,最终因融资断档与商业化不足导致团队离散。这折射出第一代创业者跨。
TurboQuant论文被质疑弱化与RaBitQ的关联,并存在理论比较与实验公平性问题。谷歌借助平台影响力将其定义为突破性成果,凸显了大厂在学术生态中的结构性优势。类似争议在伦理AI、芯片等领域亦有体现,反映了产业界将利益嵌入研究流程的机制。当前AI研究日益由大厂主导,其通过资本、渠道与话语权塑造。





