商汤大装置与华为昇腾 384 超节点全面适配,多项创新提升训练效率
9 月 6 日消息,据商汤科技最新消息,近日,商汤大装置 SenseCore 与昇腾 384 超节点率先完成全面适配,在功能、性能验证上达到预期目标。
据最新介绍,超节点(SuperPod)是一种通过高速互联技术,将多个 GPU / NPU 整合为统一计算单元的新型架构,解决 AI 大模型训练中的算力协同与通信效率问题。
昇腾 384 超节点(Atlas 900 A3 SuperPoD)是华为推出的业界最大规模超节点方案,凭借创新的“全对等架构”,实现高速互联总线的关键突破 —— 把总线从服务器内部扩展到整机柜、甚至跨机柜,最终将 CPU、NPU、DPU、存储和内存等资源全部互联和池化,形成一台“超级计算机”,实现更大的算力密度和互联带宽。
基于商汤大装置 SenseCore 与昇腾 384 超节点的特点,双方团队联合攻关,在调度优化、系统稳定性以及故障恢复等方面提出多项行业创新:
调度优化:在调度能力上,除了支持 POD 内单机和多机调度、跨 POD 多机调度、亲和性调度等基础能力,SenseCore 平台配合模型并行策略实现了逻辑超节点自动划分,使 EP / TP 等大通信策略可以充分利用灵衢网络,提升模型训练效率。
跨 POD 训练稳定性:另外 SenseCore 团队提交了多个 MR 修复多 POD 场景下 master / work 任务 rank 乱序问题,从根本上解决了跨 POD 训练任务概率性失败的问题。
多维度故障检测与恢复:在故障检测能力上覆盖了从服务器硬件、高速互联总线、RoCE 网络到任务、进程软硬件多维度检测,结合检测能力实现 Job / Pod / 进程多级恢复机制,全面提升昇腾 384 超节点在训练场景下的可靠性与容错性。
从最新新闻稿获悉,未来,双方还将探索更多应用场景,包括大模型推理加速、智能体应用部署、面向垂直行业的大模型训练与推理优化等,进一步加速基于 SenseCore 的昇腾 384 超节点在各行各业的应用落地。
相关攻略
观点网讯:9月8日,商汤科技宣布将协助Claude API用户迁移至其自家大模型SenseNova,以享受更高质量的模型能力和服务。此举是在Anthropic宣布将禁止中资控股超过50%的公司使用C

9 月 6 日消息,据商汤科技最新消息,近日,商汤大装置 SenseCore 与昇腾 384 超节点率先完成全面适配,在功能、性能验证上达到预期目标。据最新介绍,超节点(SuperPod)是一种通

9 月 6 日消息,商汤科技今天下午宣布,即日起,商汤日日新大模型 SenseNova 将为 Claude 用户提供“搬家”服务,帮助客户继续享受高质量的模型能力和服务。具体来看,商汤将为从 Cl

8 月 13 日消息,商汤科技联合创始人、执行董事、首席科学家林达华在 8 月 12 日发布了深度文章《迈向多模态通用智能:商汤的思考》,阐释了发展多模态智能的底层逻辑、技术路径、实践探索与未来方

8 月 28 日消息,商汤在港交所公告称,上半年集团收入同比增长 35 6%,达人民币 23 58 亿元;经调整亏损净额收窄至 11 62 亿元,同比下降 50 0%。另外,商汤生成式 AI 收入
热门专题


最新APP
热门推荐

芝麻开门 (Gate io) vs 币安 (Binance):全面对比分析 在加密货币交易领域,选择一个安全、可靠且功能丰富的交易所至关重要。 币安

截至10月1日晚8时18分,2025年国庆节单日票房突破4亿元。根据实时票房数据统计,志愿军:浴血和平刺杀小说家2731位列当日票房排行榜前三名。数据显示,志愿军:浴血和平以10162 08万元的综

9月30日,山东威海一名小米汽车用户发布视频称,其停放在家门口的车辆在无人触碰的情况下突然自行启动并向前行驶。监控画面显示,当时车主与一名女性在屋内,车辆突然启动后,女子当场惊呼,车主随即冲出屋外追

10月2日,特斯拉对外披露了第三季度超级充电网络的多项运营数据,同时分享了其位于洛杉矶的超级充电餐厅在试运营期间的餐饮销售情况。根据最新发布的统计信息,特斯拉在第三季度持续推进充电网络建设,全球范围
根据中国信息通信研究院最新披露的数据,我国人工智能产业在2024年实现了跨越式发展。统计显示,该年度人工智能产业规模突破9000亿元大关,较上年同期增长24%,展现出强劲的发展动能。在产业生态构建方