游乐游手机版
首页/科技数码/文章详情

PyTorch MUSA 2.7.0发布:功能与性能双升级,加速AI计算效率

时间:2025-11-28 17:09
摩尔线程近日宣布,其专为PyTorch深度学习框架打造的MUSA扩展库——Torch-MUSA迎来v2 7 0版本升级。此次更新距离上一次v2 5 0版本发布仅间隔一个月,标志着该库在迭代速度与功能

摩尔线程近日宣布,专为PyTorch深度学习框架打造的MUSA扩展库——Torch-MUSA正式迎来v2.7.0版本升级。此次更新距离上一个v2.5.0版本发布仅间隔一个月,充分彰显了该库在迭代速度与功能演进上的持续加速。新版本不仅在计算能力、内存管理等核心领域实现重要突破,更通过算子扩展与系统层面的联合优化,进一步巩固了其性能优势。

版本同步策略的调整为此次升级奠定了重要基础。自v2.5.0版本起,Torch-MUSA开始采用与PyTorch主版本号对齐的命名规则,此举显著简化了开发者的版本管理流程。在硬件兼容性方面,新版全面支持MUSA SDK 4.2.0至4.3.0及后续版本,确保与最新开发工具链无缝衔接。目前该库已累计支持超过1050个专属算子,全方位覆盖深度学习训练与推理的核心需求场景。

计算加速能力的拓展是本次升级的核心亮点。新版本深度整合了muFFT快速傅里叶变换库与muSolver线性求解器库,使复杂数学运算的执行效率获得质的提升。为满足边缘计算场景需求,开发团队在基于Arm架构的SoC设备上实现了统一内存管理(UMM)支持。通过UMA(统一内存寻址)技术,GPU与CPU可共享同一物理内存空间,彻底消除GPU端的重复内存分配,减少主机与设备间的数据拷贝次数,同时允许GPU直接访问CPU分配的内存区域,使内存开销降低达30%以上。

算子支持体系迎来全面扩容。新增算子覆盖位运算(ilshift/irshift)、序列填充(replication_pad1d_bwd)、概率计算(angle/logit)、语音识别(ctcLossTensor系列)等十余个专业领域,同时扩展了稀疏矩阵(CSR格式)操作与量化算子的支持范围。针对开发者反馈的问题,修复了torch.norm形状计算错误、空输入条件下argmax/argmin异常等已知缺陷,并新增tensor.is_musa方法用于设备类型检测。在性能优化方面,var/std统计计算、3D卷积、层归一化等关键操作的执行效率提升15%-20%,reduce_sum操作新增对uint8输入与int64输出的完整支持。

系统级功能增强包含三大方向:开放torch.musa.mccl.version接口用于版本查询,新增getCurrentMUSABlasHandle系列API强化底层控制能力,优化FSDP2流水线并行策略使训练内存占用减少25%。这些改进使大规模模型训练的稳定性与资源利用率得到显著提升。

开发团队透露,Torch-MUSA将保持与PyTorch生态的紧密同步,下一版本计划实现对PyTorch 2.9.0的完整支持,并持续在算子覆盖、硬件加速、内存管理等领域进行深度优化。该项目已通过GitHub平台完全开源,开发者可访问指定地址获取完整代码与文档支持。

来源:https://www.itbear.com.cn/html/2025-11/1031501.html
上一篇新华时评:50元起充门槛或将冲击用户信任根基 下一篇骁龙8 Gen5芯片制程升级:缓存优化如何提升游戏性能
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
LiblibAI云端WebUI降低AI绘画部署门槛
科技数码 · 2026-07-02

LiblibAI云端WebUI降低AI绘画部署门槛

LiblibAI在线WebUI的核心优势在于——只需通过浏览器即可流畅运行Stable Diffusion,无需自行搭建本地环境。云端直接处理运算,模型即选即试,大幅降低了AI绘画的创作门槛。对于轻量创作和模型快速测试来说,体验相当顺畅,但用户仍需重视数据隐私保护和版权合规等问题。 过去使用Stab

微软因用户不安叫停Edge浏览器AI历史搜索功能
科技数码 · 2026-07-02

微软因用户不安叫停Edge浏览器AI历史搜索功能

微软紧急暂停Edge浏览器AI历史搜索功能,该功能因被用户吐槽“令人不安”而暂缓部署。尽管微软强调所有AI处理在设备端完成且数据不上传云端,但用户仍不信任。此举与WindowsK2计划减少功能堆砌的理念一致。

红魔游戏平板5 Pro发布 4999元起售将登陆全球市场
科技数码 · 2026-07-02

红魔游戏平板5 Pro发布 4999元起售将登陆全球市场

【CNMO科技消息】近日,红魔游戏平板5 Pro正式发布。这款平板从定位上就明确瞄准“极致游戏”体验,外观方面带来了一个重磅亮点——首次引入RGB水冷散热系统,背部那条可视化的水路通道,配合纯平透明背板设计,核心配置信息一览无余,科技感十足。 图源网络 屏幕方面同样表现突出。一块9 06英寸OLED

杭州全国首所机器人学校首批30台机器人入学
科技数码 · 2026-07-02

杭州全国首所机器人学校首批30台机器人入学

30台机器人整齐列队,有的刚从生产线卸下,机械零件还带着崭新的“工业气息”;有的已搭载运动控制模块,能稳健地小跑、跳跃几下。它们来自不同制造工厂,外形与功能各有千秋,但此刻都拥有了同一个身份——杭州机器人学校的第一批入学新生。 6月30日,杭州经信正式发布:由浙江大学机器人研究院、浙江省质量科学研究

美国计划发射航天器托举天文卫星
科技数码 · 2026-07-02

美国计划发射航天器托举天文卫星

就在最近,NASA公布了一项非常果断的干预计划——他们定于6月30日实施一次“卫星维修任务”,派遣一台名为“连接”号的机器人服务卫星,为一颗超期服役的天文卫星延长运行寿命。这颗卫星是“尼尔·格雷尔斯·斯威夫特天文台”,其轨道高度正在不断衰减,如果不进行干预,今年年底前很可能会坠入地球大气层并烧毁。