首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
存储涨价之后,如何让AI走向数据?丨ToB产业观察

存储涨价之后,如何让AI走向数据?丨ToB产业观察

热心网友
45
转载
2026-05-06

存储的“基因重组”:当AI走向数据,一场效率革命正在发生


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

先看一组震撼的数据:国家数据局显示,从2024年到2026年,中国日均Token调用量从1000亿飙升至140万亿(截至2026年3月)。两年增长超过千倍,这背后传递的信号再清晰不过——AI已彻底告别实验室的模型训练阶段,正全面涌入生产和生活的每一个角落。

这场浪潮冲击之下,一个根本性的角色转换正在发生。过去,存储设备的使命是“数据保存”,像个忠实的仓库管理员;如今,它的职责被刷新为“数据赋能”。换句话说,它不再是被动承载数据的“容器”,而是必须主动参与数据处理、支撑AI高效运转的“核心枢纽”。

对于存储行业而言,这个拐点带来的绝非温和的增量增长,而是一场彻头彻尾的全面重构。而重构的核心逻辑,也发生了根本逆转:不再是让数据走向AI,而是要让AI走向数据。

存储架构迎来“基因重组”

“原来的企业存储核心是做数据保护,现在AI存储的第一目标变成了效率提升——核心就一句话,如何充分满足GPU对数据的饥渴需求,别让它空转。”浪潮信息存储产品部副总经理郭海峰的这句话,精准概括了存储使命的根本性变化。

这远不止是产品定位的调整,而是整个技术架构的“基因重组”。传统企业级存储是典型的“通算架构”,以CPU为核心。数据需要经过CPU的路径解析,从内核态复制转发,才能抵达GPU进行计算。这套流程服务关系型数据库和传统应用游刃有余,但面对智算时代动辄百卡、千卡的GPU集群时,效率瓶颈就暴露无遗:一旦存储拖了后腿,价格昂贵的GPU就只能空转等待。

数据最能说明问题的严重性。IBM大中华区存储事业部总经理吴磊指出,如今GPU部署规模庞大,投资动辄以亿甚至十亿计,“1%的闲置就意味着上亿元的浪费”。这与郭海峰的观点不谋而合:存储和网络在智算系统中成本占比或许只有5%-10%,但如果它们导致GPU空转,这区区百分之几的成本,就足以毁掉其余90%以上的投资回报。

为了满足企业对算力利用率的极致追求,存储的“基因重组”势在必行。目前,从软件和硬件两个层面切入,都能有效优化整体架构。浪潮信息和IBM恰好是这两个方向的典型代表。

浪潮信息在其新发布的A9000系列产品中,采用了“全链路免锁零拷贝的用户态AI原生并行架构”。简单来说,就是把数据传输路径从传统的内核态切换到了用户态协议栈,实现了端到端的免拷贝。这一改动效果显著,将延迟从毫秒级降至微秒级,单节点带宽更是达到了160GB/s,远超行业主流的60-80GB/s水平。

软件架构变革的背后,其实暗藏一条更深层的技术主线:KV Cache。在AI推理场景中,为了加速响应、避免重复计算,系统需要将键值对缓存保留在高速存储中。但随着模型上下文窗口的急剧扩大,KV Cache的规模早已超出了GPU显存和本地DRAM的承载极限。郭海峰详细解释了其中的技术逻辑:通过PD分离(Prefill与Decode分离),并利用GlobalCast技术和“双路径”设计,可以整合利用空闲带宽,显著缩短首Token的产生时间。根据浪潮信息公布的数据,通过其Agent Memory外置存储架构,A9000能将首Token延迟降低97%,Token吞吐量提升超过20倍。

另一边,IBM则从另一个维度切入。其推出的Storage Scale并行文件系统,能够在万卡集群中支撑高频的checkpoint数据落盘,确保数据在极短时间内写入存储,从而充分释放GPU的计算效率。

除了软件优化,硬件层面的革新同样关键。IBM在其自研的第五代闪存核心模块(FlashCore Module 5)的每块NVMe闪盘上,都嵌入了一颗专用芯片和高性能处理器,实现了硬件级的压缩、去重和加密。吴磊透露,这一设计能将压缩比做到1:5,而且由于压缩在盘上完成,完全不会对存储控制器的性能造成负担。

种种技术演进都指向同一个结论:AI时代的存储,正从一个被动的数据容器,进化成具备感知和计算能力的主动节点。

涨价是暂时的,效率优化才是关键

当存储节点进化为承载KV Cache、主动参与计算卸载的智能枢纽,市场对高带宽、低延迟存储介质的依赖便呈指数级攀升。这种由架构变革催生的庞大需求缺口,直接在上游供应链引发了产量倾斜与价格博弈。

多方数据显示,2026年第一季度,DRAM内存合约价涨幅达90%-95%,NAND Flash闪存合约价涨幅达55%-60%。这轮涨价潮的直接推手就是AI——大模型训练和推理需求井喷,导致原厂将大量产能从消费级转向利润更高的企业级AI产品。TrendForce预测,2026年第二季度NAND闪存合约价将继续大幅跳升70%至75%。

然而,在吴磊和郭海峰看来,存储涨价只是一时的市场现象,真正值得长期关注的,是如何通过技术手段优化整体效率。郭海峰提到一个案例:有企业将存储迁移到高带宽方案后,GPU利用率提升了15%——“用不到整个项目10%的钱采购存储,就把卡的利用率提升了15%”。吴磊则算了一笔更直观的账:通过FCM模块的1:5压缩技术,用户在涨价后开启压缩功能,实际可用容量的单位成本甚至比涨价前还要低。

但成本优化远不止于压缩比。存储行业正在经历的,是对“数据应该放在哪里”这一根本问题的重新思考。传统企业级存储中,“热、温、冷”数据分层管理已是成熟理念,但AI时代的分层逻辑远比过去复杂得多。

于是,五层存储体系应运而生,这可以说是AI给存储行业带来的最直观的结构性变化。按照业界通行的分类:第一层是HBM(高带宽内存),第二层是本地DRAM,第三层是本地SSD,第四层是传统企业级外置存储。而在第三层和第四层之间,现在出现了一个关键的“3.5层”——这是一个专门服务于AI推理场景的外置缓存层。

为什么需要这个3.5层?郭海峰的解释很直接:“3.5层是为了效率,可以放弃一定的可靠性。数据比是1:1,大不了数据丢了重新算,但不能牺牲效率。”这与第四层传统存储“数据保护优先”的理念形成了鲜明对比。吴磊也从经济学角度给出了类似判断:“全用HBM当然最好,但HBM太贵了。”在成本约束下,分层存储是必然选择。

在五层存储体系的影响下,“磁带存储”这个看似古老的技术,又一次凭借其极高的性价比成为企业的重要选项。据吴磊介绍,过去几年,多家大厂已部署了EB级甚至10EB级的磁带库,包括百度智能云也将其用于底层的冷数据存储。由IBM、HPE和Quantum联合推动的LTO联盟,其LTO-10已实现40TB原始容量,在2.5:1压缩比下可达100TB,未来的LTO-11、LTO-12容量还将更大。吴磊提供了一个实用视角:磁带机械臂从最远端抓取数据大约需要一分五十多秒,但如果一个数据三个月甚至六个月才访问一次,这两分钟的等待时间完全在可接受范围内。

让AI走向数据

这一轮存储行业的变革,其深刻程度远非五层存储体系所能完全体现。它映射出了一个更为底层的变化:传统的“让数据走向AI”模式已难以为继,“让AI走向数据”正在成为新的主流。

在传统数据使用模式中,AI应用是纯粹的“索取方”:应用发起请求,存储被动响应。这种模式在小规模、低频次场景下尚可运行,但面对EB级数据、百万级并发请求时,就完全不可持续了。更致命的问题在于数据一致性的崩塌。吴磊用了一个生动的比喻来描述这一困境:“我们每个人可能有好几个TB的照片、视频,企业则是几百个TB、几百个PB,甚至EB级。当数据有多个副本时,哪一个副本说的是真话,哪一个说的又是假话?”

面对这一挑战,IBM给出的解决方案是内容感知存储(Content-Aware Storage, CAS),其核心理念是结合单一数据副本和即时感知数据变化的机制。也就是说,数据一旦发生变化,模型能够即时感知,而无需通过繁琐的副本生产和传输来同步。吴磊强调:“过去部分厂商出于销售目的,可能会建议客户不断扩容升级。存储管理员则疲于应对各种报告和数据迁移。现在有了AI智能体,它可以分析完所有数据后,一次性做出最优决策,甚至能完成跨洲的数据迁移。”

这意味着,存储的角色正从被动的数据仓库,转变为主动的数据编排平台。而这个解题思路,似乎正在成为行业共识。IBM提出的内容感知存储,与浪潮信息倡导的“AI Data Platform”概念有许多相通之处。郭海峰这样阐述“AI Data Platform”:数据不应是静态的“湖”,而应是“一条不断流淌的河流,不断有数据进来,不断去处理、清洗、打标和再优化,重新训练模型”。这种动态的数据管理逻辑,与传统的“先存下来以后再说”的思路有着本质区别。

从产业视角看,“让AI走向数据”正在催生新的协同模式。浪潮信息利用其全栈能力(从底层算力到上层平台)为合作伙伴提供基础设施,郭海峰将其形容为“搭台唱戏”——浪潮信息搭台,伙伴们来唱AI这场戏。IBM则宣布与英伟达进一步扩大合作,在GTC 2026上展示了深度集成方案:Storage Scale System 6000可提供10PB高性能存储,用于支撑GPU原生分析引擎,IBM同时计划于2026年第二季度初在IBM Cloud上提供英伟达Blackwell Ultra GPU。

但所有这些技术与合作的最终落点,仍然是人。吴磊在沟通中反复强调一个观点:“AI是一个工具,不能代替人,它没有情感,也无法做决定,最终做决定的仍是人类。”无论是浪潮信息致力于让GPU“不空转”,还是IBM用AI智能体帮助存储管理员轻松管理数十个同构或异构节点,其终极目标都是一致的:将人从繁琐、重复的运维工作中解放出来,让他们能将更多的注意力和创造力投向真正的业务创新。

IBM商业价值研究院的调研揭示了一个有趣的现象:76%的CEO对自己企业的IT架构“非常自信”,但43%的CIO却感到焦虑。这种认知落差恰恰说明,AI时代的数据基础设施挑战,远比表面看到的更为复杂。“让存储融入平时的业务中,而不是让业务等存储”——这句总结,或许正是这个时代对存储行业最朴素也最关键的要求。

回望过去两年,存储行业经历了从波澜不惊到惊涛骇浪的转变。当全球AI总支出逼近万亿美元量级,当Token成本的每一次下降都直接影响着大模型的经济可行性,存储不再只是技术链条的终点,它正在成为AI价值创造中不可或缺、且日益主动的一环。

(文|Leo张ToB杂谈,作者|张申宇,编辑丨杨林)

来源:https://www.163.com/dy/article/KS85I5H705118O92.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Anthropic:成立AI服务公司,面向中型企业落地Claude
科技数码
Anthropic:成立AI服务公司,面向中型企业落地Claude

Anthropic联手顶级资本,成立AI服务公司专攻中型企业市场 一则重磅消息在科技圈传开。当地时间5月4日,AI领域的明星公司Anthropic正式宣布,将与黑石集团、赫尔曼与弗里德曼以及高盛共同成立一家全新的人工智能服务公司。 那么,这家新公司究竟要做什么?根据官方新闻稿,其核心目标非常明确:与

热心网友
05.05
 “收费就卸载!”豆包付费测试冲上热搜,AI大模型告别“纯免费”时代?
科技数码
“收费就卸载!”豆包付费测试冲上热搜,AI大模型告别“纯免费”时代?

近日,“字节系”AI助手豆包因被曝在App Store测试付费订阅服务,瞬间引爆舆论,相关话题火速登顶微博热搜。 消息一出,大量网友瞬间“炸锅”。根据网络反馈,不少用户对价格表示质疑,吐槽道“算不明白还收费”“比ChatGPT还贵”,甚至有情绪激动的网友直接喊话:“敢收钱就卸载!”与此同时,许多用户

热心网友
05.05
Flask 2.x怎么兼容原生异步IO库_Python基于async/await改造高并发视图函数
编程语言
Flask 2.x怎么兼容原生异步IO库_Python基于async/await改造高并发视图函数

Flask 2 x 的 async 视图仅在 ASGI 服务器(如 Uvicorn)下有效,WSGI 模式不支持异步;需用 uvicorn 启动、使用异步库、避免阻塞调用,并确保中间件与扩展兼容 async。 Flask 2 x 原生支持 async 视图,但不等于自动支持 asyncio 库的任意

热心网友
05.05
如何在 Airflow 中固定执行日期并统一设为当日零点时间戳
编程语言
如何在 Airflow 中固定执行日期并统一设为当日零点时间戳

Airflow 中如何将 execution_date 转换为当日零点时间戳:时区安全的最佳实践 本文详细讲解在 Apache Airflow 中,如何将默认 UTC 时区的 execution_date 准确转换为指定业务时区(例如 Europe Amsterdam)当日零点时间戳的标准化方案。通

热心网友
05.05
Laravel怎样为AI推理任务预留专用高优队列_Laravel为AI推理任务预留专用高优队列方法【智能】
编程语言
Laravel怎样为AI推理任务预留专用高优队列_Laravel为AI推理任务预留专用高优队列方法【智能】

Lara vel怎样为AI推理任务预留专用高优队列 在Lara vel项目中运行AI推理任务时,你是否遇到过这样的困扰:任务被常规业务队列阻塞,响应延迟飙升,或者多个任务争抢GPU资源导致失败?这背后一个常见的原因,就是没有为AI推理任务设置专用的高优先级队列。别担心,下面这套组合拳,能帮你彻底解决

热心网友
05.05

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

商业帝国大亨好玩吗 商业帝国大亨玩法简介
游戏攻略
商业帝国大亨好玩吗 商业帝国大亨玩法简介

商业帝国大亨:一款点击就能征服宇宙的财富游戏? 近期,手游圈的目光似乎被一款名为《商业帝国大亨》的新作吸引了。不少玩家都在询问:这款游戏到底好不好玩?值不值得投入时间?今天,我们就来深入剖析一下它的玩法核心与特色,看看它能否满足你对“商业帝国”的想象。 1 核心玩法评析:从点击屏幕到宇宙财团 如果

热心网友
05.06
异环一咖舍店铺装修方案推荐 店铺经营怎么装修
游戏攻略
异环一咖舍店铺装修方案推荐 店铺经营怎么装修

异环一咖舍店铺装修方案分享:店铺经营怎么装修 在《异环》的世界里,经营自己的店铺无疑是件充满乐趣的事。看着人气攀升、收入增长,那份成就感不言而喻。不过,很多新手玩家容易踏入一个误区:一上来就冲着最华丽的摆件去,结果投入巨大,收益提升却未必理想。今天,我们就来聊聊如何用最精明的策略,搞定你的“一咖舍”

热心网友
05.06
鸣潮3.3版本声骸管理方案推荐 3.3版本声骸管理有没有方案码
游戏攻略
鸣潮3.3版本声骸管理方案推荐 3.3版本声骸管理有没有方案码

鸣潮3 3版本声骸管理方案推荐 随着鸣潮3 3版本的到来,一次全面的声骸系统更新在所难免。特别是针对那些拥有特殊机制的角色,如何高效管理你的声骸库存,成了不少指挥官当前的头等大事。好消息是,新版本支持通过方案码一键导入配置,这无疑大大提升了效率。那么,当前版本有哪些值得关注的方案,又该如何灵活运用呢

热心网友
05.06
梦幻西游175神木怎么配装备
游戏攻略
梦幻西游175神木怎么配装备

梦幻西游神木林175级装备搭配推荐 先来看头盔的选择。这是一件130级的罗汉金钟男头,套装点化成了蜃气妖,并且打上了13锻月亮石。对于神木林这样的法系门派来说,蜃气妖套能直接提升灵力,是核心选择之一。而罗汉金钟这个特技,在高端任务和PK中的重要性不言而喻,关键时刻一个罗汉,往往能扭转战局。用高锻数的

热心网友
05.06
梦幻西游175级魔王怎么搭配装备
游戏攻略
梦幻西游175级魔王怎么搭配装备

梦幻西游魔王寨175装备搭配推荐 先来看头盔的选择。一件160级附带光辉之甲特技、且激活了长眉灵猴套装效果的头盔,无疑是法系门派的上乘之选。更难得的是,它还额外附加了4 58%的法术暴击伤害属性。为了最大化生存能力,这颗头盔被打上了16锻月亮石,将防御堆砌到了一个相当可观的程度。对于追求极致输出的魔

热心网友
05.06