游乐游手机版
首页/业界动态/文章详情

华为存储联合中科弘云发布AI推理方案,破解长序列难题

时间:2025-12-23 21:54
2025 年 12 月 23 日,华为数据存储与中科弘云在上海练秋湖联合举办发布仪式,正式推出 AI 推理加速联合解决方案。该方案以华为 OceanStor A 系列存储为数据底座,深度结合中科弘云

2025年12月23日,华为数据存储与中科弘云在上海练秋湖畔联合举办了发布仪式,正式推出AI推理加速联合解决方案。该方案以华为OceanStor A系列存储为数据底座,深度结合中科弘云HyperCN智算互联云服务平台,通过软硬件协同创新,有效提升算力资源利用率、优化长序列推理体验,为AI推理应用的规模化落地提供坚实支撑。

华为存储携手中科弘云发布 AI 推理加速方案破解长序列推理难题

当前,AI产业发展重心已从模型训练转向推理应用。随着大模型应用场景不断拓展,Token调用量呈爆发式增长,长序列推理面临“推不动、推得慢、推得贵”三大核心问题。同时,算力平台需适配多元存储、异构算力以及不同AI框架,叠加算力孤岛化、成本黑盒化、开发碎片化与迁移协同等复杂痛点,进一步制约了AI应用的发展。

华为存储携手中科弘云发布 AI 推理加速方案破解长序列推理难题

为破解上述困境,华为数据存储与中科弘云发挥双方技术优势,强强联合推出AI推理加速联合解决方案。该方案深度融合华为OceanStor A系列存储产品、华为UCM推理记忆数据管理技术以及中科弘云HyperCN平台能力,通过KV Cache多级缓存管理、秒级算力调度、分钟级大模型推理部署及全流程AI工具链,将智能算力精准输送至业务一线,为企业业务赋能。该联合方案的核心优势如下:

• 异构管理:支持平台、计算与存储的协同联动,适配英伟达、华为昇腾、寒武纪等多远AI算力,兼容MindSpore / vLLM/SGLang等主流框架,并通过Kubernetes与华为OceanStor A系列存储实现无缝对接。

• 算力调度:对算力资源进行细粒度切分与池化处理,按需灵活调度,实现资源利用率最大化;具备集群作业调度、运维监控、故障恢复等功能,支持分钟级任务恢复与系统健康监测。

• 推理加速:依托UCM将KV Cache持久化至华为OceanStor A系列存储,实现推理记忆全量保存,减少重复计算;融合Prefix Cache、GSA稀疏加速等算法,有效降低首Token时延(TTFT),让长序列推理吞吐与体验得到倍数级提升。

• 端到端AI工具链:覆盖数据管理标注、算法开发、大小模型训练推理、智能体开发全流程,支持传统机器学习与深度学习开发,实现AI资产的统一建设与集中管理。

经过实测,在智能问答场景中,该方案实现TTFT降低57.5%,且序列长度越长,TTFT降低效果越显著;在长文档推理场景中,结合GSA稀疏加速算法,当序列长度为39K时,并发能力提升86%,推理吞吐提升36%,大幅提升推理效率与体验。

华为存储携手中科弘云发布 AI 推理加速方案破解长序列推理难题

目前,该联合方案已在能源电力、智能制造、国家实验室等关键行业启动试点应用。未来,华为将与中科弘云持续深化战略合作,聚焦技术创新与产业需求融合,助力更多企业加速数智化转型步伐。

中科弘云是由中国科学院计算技术西部研究学院孵化的国家高新技术企业,业界领先的企业级智算云平台软件和服务提供商,北京市AIGC产业链算力层“专精特新”企业。中科弘云拥有涵盖异构算力调度、全流程算法开发工具链和企业级智能体平台的全栈智算云平台解决方案,已服务制造、能源、电力、交通等关键行业的数百家头部客户。

来源:https://www.ithome.com/0/907/406.htm
上一篇AI CRM如何革新销售?探索腾讯生态的赋能新路径 下一篇百度智能云领跑汽车大模型市场,行业位居榜首
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
诺基亚TA-1619入网:1400mAh电池双卡双待新机
业界动态 · 2026-07-01

诺基亚TA-1619入网:1400mAh电池双卡双待新机

诺基亚又有新动作了。7月1日消息,一款型号为TA-1619的诺基亚新机已经拿到了电信设备进网许可,不过证件照目前还没公布。 从入网信息来看,这是一款TD-LTE数字移动电话机,支持TD-LTE网络,属于LTE单天线终端设备。双卡双待、VoLTE语音模式都支持,终端款式为直板。核心配置方面,电池额定容

芯佰微CBMRF900系列国产射频芯片突破海外壁垒
业界动态 · 2026-07-01

芯佰微CBMRF900系列国产射频芯片突破海外壁垒

芯佰微电子发布CBMRF9002和CBMRF9009两款射频收发芯片,采用直接变频架构,覆盖10MHz至7250MHz频段,支持最大450MHz带宽及JESD204B高速接口,性能对标国际,满足5G基站与卫星通信等高端需求,突破海外技术壁垒。

月起私人充电桩可卖电 每度净赚5毛
业界动态 · 2026-07-01

月起私人充电桩可卖电 每度净赚5毛

近期有一则重大利好消息,值得新能源车主们特别留意——车网互动价格机制改革已正式落地。自7月1日起,湖北武汉的新能源车主,可在家中的私人充电桩上通过“卖电”轻松赚钱。具体而言,就是借助峰谷电价差,实现低买高卖,每度电净收益约5毛钱。过去,车网互动(V2G)基本只局限于特定的公共充电站,受试点规模限制,

谷歌发布Nano Banana 2 Lite 4秒出图1元4张
业界动态 · 2026-07-01

谷歌发布Nano Banana 2 Lite 4秒出图1元4张

先说几个关键信息:谷歌DeepMind又给图像生成赛道添了新选项。7月1日发布的消息,Nano Banana 2 Lite正式亮相。这个名字听起来像是水果命名系列大爆发,实际上它的技术代号是Gemini 3 1 Flash Lite Image,属于Gemini 3 1家族。最大的卖点就两个:快,便

技嘉专业电竞装备助力2025 CFS世界总决赛
业界动态 · 2026-07-01

技嘉专业电竞装备助力2025 CFS世界总决赛

2025CFS世界总决赛将于12月3日至14日在重庆举行,来自四大赛区的16支战队参赛。技嘉AORUS作为赛事设备合作伙伴,以主板、显示器等专业硬件保障比赛稳定流畅,并通过赛事反哺研发的闭环模式支持电竞发展。