游乐游手机版
首页/科技数码/文章详情

摩尔线程发布大模型训练仿真工具SimuMax v1.0:显存误差仅1%

时间:2025-09-14 21:21
9月11日消息,摩尔线程正式发布并开源大模型分布式训练仿真工具SimuMax v1 0,在显存和性能仿真精度上实现了突破性提升,同时引入多项关键功能,进一步增强了模型兼容性、灵活性。SimuMax是

9月11日消息,摩尔线程正式发布并开源大模型分布式训练仿真工具SimuMax v1.0,在显存和性能仿真精度上实现了突破性提升,同时引入多项关键功能,进一步增强了模型兼容性、灵活性。

SimuMax是一款专为大语言模型(LLM)分布式训练负载设计的仿真模拟工具,可为从单卡到万卡集群提供仿真支持。

它无需实际执行完整训练过程,即可高精度模拟训练中的显存使用和性能表现,帮助用户提前了解训练效率,优化计算效能。

基于静态分析模型,摩尔线程自研的SimuMax通过结合成本模型、内存模型和屋顶模型,实现对训练过程的精准仿真。

摩尔线程发布大模型训练仿真工具SimuMax v1.0:精度显著提升 显存误差仅1%

该工具支持多种主流分布式并行策略与优化技术,适用于以下多种应用场景:

1、并行策略:

数据并行(DP)、张量并行(TP)、序列并行(SP)、流水线并行(PP)、专家并行(EP)

2、优化技术:

ZeRO-1、完整重计算、选择性重计算、融合内核等。

3、适用对象:

希望寻找最优训练策略以提升效率的用户;

从事框架或大模型算法开发的工程师,用于优化与调试;

芯片制造商,用于性能预测与硬件设计辅助。

SimuMax 1.0最显著的更新在于其仿真精度的大幅提升,为用户提供更可靠的分析结果。

针对Dense和MoE(混合专家)模型,显存估计误差稳定控制在1%以内。

经测试,在多个主流GPU上,目前最优性能估计误差持续低于4%。

摩尔线程发布大模型训练仿真工具SimuMax v1.0:精度显著提升 显存误差仅1%

此外,SimuMax 1.0还引入了多项新特性,支持更广泛的模型结构和高效率训练需求:

MLA支持:

新增对MLA模型架构的支持;

流水线并行(PP)增强:

支持对首阶段和末阶段层的细粒度控制,优化模型分片策略;

MoE灵活性提升:

在混合专家(MoE)模型中支持自定义Dense层,为模型设计提供了更大的灵活性。

Megatron兼容:

提供简化的模型迁移流程,可轻松转换和分析基于Megatron框架的模型,提升与现有生态的互操作性。

重计算策略优化:

实现更细粒度的选择性重计算,支持更精准的内存和计算资源权衡。

全面的效率分析:

新增对不同张量形状与内存布局下计算效率与利用率的评估功能。

来源:https://news.mydrivers.com/1/1074/1074024.htm
上一篇有人说 叉开腿坐才是最健康的坐姿:骨科专家提醒 下一篇玩家期待已久!Steam新增游戏库排序功能:解决顺序强迫症
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5