华为与中科宏云联合发布AI推理加速方案,适配主流算力芯片
12月23日,华为数据存储与中科弘云联合发布了一项全新的AI推理加速解决方案。
这一方案以华为OceanStor A系列存储设备为数据底座,结合中科弘云智算互联网云服务平台HyperCN,显著提升了长序列推理任务的运行体验。

该方案深度融合了华为OceanStor A系列存储、华为UCM推理记忆数据管理技术以及中科弘云HyperCN平台的强大能力。通过KV Cache多级缓存管理、秒级算力调度、分钟级推理大模型部署及全流程AI工具链,能够将智能算力高效输送至业务一线。该联合方案的核心优势具体体现在以下几个层面:
异构管理:支持平台、计算与存储的协同联动,完美适配英伟达、华为昇腾、寒武纪等多元AI算力,兼容MindSpore / vLLM/SGLang等主流框架,并通过Kubernetes与华为OceanStor A系列存储实现无缝对接。
算力调度:对算力资源进行细粒度切分与池化处理,能够按需灵活调度,最大化提升资源利用率;具备集群作业调度、运维监控、故障恢复等功能,支持分钟级任务恢复与系统健康监测。
推理加速:依托华为UCM技术,将KV Cache持久化至华为OceanStor A系列存储,实现推理记忆的全量保存,有效减少重复计算;此外,融合Prefix Cache、GSA稀疏加速等算法,显著降低首Token时延(TTFT),使长序列推理的吞吐与体验获得倍数级提升。
端到端AI工具链:覆盖数据管理标注、算法开发、大小模型训练推理、智能体开发等全流程,支持传统机器学习与深度学习开发,实现AI资产的统一建设与集中管理。
经实际测试,在智能问答的典型推理场景中,该方案实现了首Token时延(TTFT)降低57.5%,且序列长度越长,优化效果越显著;在长文档推理场景中,结合GSA稀疏加速算法,当序列长度为39K时,并发能力提升86%,推理吞吐提升36%,在提升推理效率与体验方面成效明显。
从合作公告获悉,该联合方案目前已在能源电力、智能制造、国家实验室等关键行业启动试点应用。
热门专题
热门推荐
陆瑾是《异人之下》手游中操作门槛较高的角色,主打中近距离压制。其核心在于普攻攒炁,并衔接常技【太冲震恚】与【曲泉交忿】进行输出。关键技能【五雷符】可攻可守,成功防御反击可重置冷却。连招依赖“反手”逻辑与精准预判,形成攻防循环。投技【双龙探爪】与【戾走急脉】则需把握时机,分别用于破防与针。
投资策略需要明确目标与风险偏好,合理分配资金。通过研究项目基本面、关注市场周期与情绪,建立多元化组合。执行中需设定清晰的买卖规则,利用工具辅助决策,并保持长期视角与纪律性,避免情绪化操作。定期复盘与调整是策略持续有效的关键。
巴伦是《异人之下》手游中的近战压制型角色,核心玩法在于追击与倒地连招。其技能“破势突击”衔接流畅,“极速连斩”可追击倒地目标,“飞身十字固”抓取伤害高,“逆势突围”用于防守反击。角色操作上限高,需练习掌握连招循环,但对战远程角色时较为吃力。
谷歌宣布Gemini3 5Pro模型下月发布,已在内部广泛使用且进步显著。具体技术细节、性能参数及开放计划尚未公布,更多信息将于下月揭晓。
谷歌在2026年I O大会上推出月费100美元的新AI订阅计划,旨在填补其现有20美元与250美元两档服务之间的市场空白。该计划面向需要更多资源的高级用户和小型团队,提供比基础版更强的性能,同时避免企业级的高昂成本,以竞争中高端市场。





