摩尔线程MTT S5000适配阿里Qwen3.5,三款新模型首发评测
继大规模开源的Qwen3.5-397B-A17B模型之后,阿里在2月26日宣布,再次开源千问Qwen3.5系列最新三款中等规模模型:Qwen3.5-35B-A3B、Qwen3.5-122B-A10B以及Qwen3.5-27B。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
摩尔线程第一时间做出了响应,在其旗舰级AI训推一体全功能GPU MTT S5000上,完成了对这三款新模型的全面适配工作。
此次高效适配,充分展现了摩尔线程MUSA生态系统的成熟度与完备性。
在本次Qwen3.5系列模型的适配过程中,MUSA生态赋能开发者的两大核心能力得到了有力验证:
▽ 原生MUSA C支持:
开发者可以直接使用MUSA C进行内核开发,大幅降低了从CUDA生态迁移的技术门槛;
▽ 深度兼容Triton-MUSA:
开发者能够使用熟悉的Triton语法编写高性能算子,并通过Triton-MUSA后端,在摩尔线程全功能GPU上无缝运行。
在底层技术层面,针对Qwen3.5多模态模型所采用的混合注意力机制,摩尔线程实现了原生优化。
基于muDNN计算库和MATE开源算子库,摩尔线程为混合注意力机制中的长序列处理提供了高效支撑,成功在MTT S5000上实现了该模型的高性能推理。
从GLM-5、MiniMax M2.5、Kimi K2.5到Qwen3.5系列,摩尔线程对前沿大模型的快速适配已成为常态。

MTT S5000是摩尔线程专为大模型训练、推理及高性能计算设计的全功能GPU智算卡,基于第四代MUSA架构“平湖”,原生适配PyTorch、Megatron-LM、vLLM、SGLang等主流框架。
MTT S5000单卡配备高达80GB显存,显存带宽高达1.6TB/s,对比上一代MTT S4000分别提升了67%和113%,多卡间的互联带宽也达到784GB/s。
它完整支持从FP8到FP64的全精度计算,而且是国内最早原生支持FP8精度的训练GPU之一,配置了硬件级FP8 Tensor Core加速单元。
单卡FP8 AI算力最高可达1000 TFLOPS,首次达到PFLOPS级别,即每秒可进行1千万亿次计算。实测性能可以对标NVIDIA H100,尤其是在多模态大模型微调任务中,部分性能表现甚至超越H100,并开始接近最新的Blackwell架构。
相关攻略
北京商报讯(记者 王蔓蕾)近日,北京智源人工智能研究院(以下简称 "智源研究院 ")正式发布重磅验证成果:六款AI芯片、三大模型、同构+异构千卡——众智FlagOS以统一技术栈完成AI训练 "全要素 "验证
北京商报讯(记者 陶凤 王天逸)3月25日,摩尔线程发文称,近期,工业和信息化部电子工业标准化研究院组建软件供应链安全评估组,依据国家标准《网络安全技术 软件供应链安全要求》(GB T 43698-
3月21日消息,今天,摩尔线程正式发布版本号为v330 140的图形显卡驱动程序。本次更新重磅引入MTVSR实时视频超分技术,并针对多款热门游戏及专业软件进行了深度优化,进一步增强了摩尔线程图形显卡
3月16日消息,传统服务器一般就是单机配2-8块加速卡,但是智算集群的规模正在急剧膨胀,百卡、千卡、万卡甚至十万卡一路不停,所以具备强互联能力的超节点架构正成为焦点。近日,依托OISA协同创新平台,
3月13日消息,麒麟软件携手紫光计算机、中望软件重磅发布国内首款基于全国产平台的CAx二三维一体机——紫光计算机UltiStation 800H。这款产品实现了从芯片、操作系统到应用软件的全链路自主
热门专题
热门推荐
Numbers表格中多行文本显示异常的五种解决方法:一、启用自动换行;二、用Option+Return插入手动换行符;三、公式中用CHAR(10)嵌入换行;四、双击后粘贴保留换行的
在制作ppt演示文稿时,为了增添视觉效果和吸引力,常常会添加背景视频。而设置背景视频打开时自动播放,能让演示一开始就抓住观众的注意力。下面就来详细介绍如何在视频工具栏中进行这一设置
在三角洲行动中,了解哈夫克增援点的刷新位置对于玩家在战斗中获取优势至关重要。地图分布规律哈夫克增援点在地图上的分布有一定规律。通常会出现在资源丰富、战略意义重要的区域。比如连接不同
一、联机前提条件确保你的手机系统符合游戏要求,且网络连接稳定流畅,推荐使用wi-fi网络以避免联机过程中的卡顿和延迟。同时,游戏需更新到最新版本,以保证联机功能的正常运行。二、创建
追完《沧元图》前传《东宁府的夏天》第三集,情绪还没缓过来——前半段哭到鼻子发酸,后半段又姨母笑到嘴角僵硬,这一集的情绪起伏,真的太戳人了。上一集里,孟川拼尽全力陨灭了真龙太子的真身,本以为危机彻底解





