华为与中科宏云联合发布AI推理加速方案，适配主流算力芯片_AI热点日报

华为与中科宏云联合发布AI推理加速方案，适配主流算力芯片

类型：热点整理2025-12-23

12 月 23 日消息，华为数据存储与中科弘云今日发布了 AI 推理加速联合解决方案。该方案以华为 OceanStor A 系列存储为数据底座，结合中科弘云智算互联网云服务平台 HyperCN 平

12月23日，华为数据存储与中科弘云联合发布了一项全新的AI推理加速解决方案。

这一方案以华为OceanStor A系列存储设备为数据底座，结合中科弘云智算互联网云服务平台HyperCN，显著提升了长序列推理任务的运行体验。

华为数据存储、中科弘云发布 AI 推理加速联合解决方案，适配英伟达、昇腾、寒武纪等算力

该方案深度融合了华为OceanStor A系列存储、华为UCM推理记忆数据管理技术以及中科弘云HyperCN平台的强大能力。通过KV Cache多级缓存管理、秒级算力调度、分钟级推理大模型部署及全流程AI工具链，能够将智能算力高效输送至业务一线。该联合方案的核心优势具体体现在以下几个层面：

异构管理：支持平台、计算与存储的协同联动，完美适配英伟达、华为昇腾、寒武纪等多元AI算力，兼容MindSpore / vLLM/SGLang等主流框架，并通过Kubernetes与华为OceanStor A系列存储实现无缝对接。

算力调度：对算力资源进行细粒度切分与池化处理，能够按需灵活调度，最大化提升资源利用率；具备集群作业调度、运维监控、故障恢复等功能，支持分钟级任务恢复与系统健康监测。

推理加速：依托华为UCM技术，将KV Cache持久化至华为OceanStor A系列存储，实现推理记忆的全量保存，有效减少重复计算；此外，融合Prefix Cache、GSA稀疏加速等算法，显著降低首Token时延（TTFT），使长序列推理的吞吐与体验获得倍数级提升。

端到端AI工具链：覆盖数据管理标注、算法开发、大小模型训练推理、智能体开发等全流程，支持传统机器学习与深度学习开发，实现AI资产的统一建设与集中管理。

经实际测试，在智能问答的典型推理场景中，该方案实现了首Token时延（TTFT）降低57.5%，且序列长度越长，优化效果越显著；在长文档推理场景中，结合GSA稀疏加速算法，当序列长度为39K时，并发能力提升86%，推理吞吐提升36%，在提升推理效率与体验方面成效明显。

从合作公告获悉，该联合方案目前已在能源电力、智能制造、国家实验室等关键行业启动试点应用。

来源：https://www.ithome.com/0/907/340.htm

华为数据存储中科弘云 AI 推理

补充最近整理过的热点入口。