摩尔线程S5000通过FlagOS训练验证,精度超主流1.65个百分点
北京商报讯(记者 王蔓蕾)近日,北京智源人工智能研究院(以下简称"智源研究院")正式发布重磅验证成果:六款AI芯片、三大模型、同构+异构千卡——众智FlagOS以统一技术栈完成AI训练"全要素"验证。作为本次验证的核心参与厂商之一,摩尔线程基于旗舰级AI训推一体全功能GPU智算卡MTT S5000,完整适配了FlagOS训练全要素软件栈——包括FlagScale系统调度决策框架、Megatron-LM分布式训练框架、Transformer Engine加速库、FlagGems与Triton算子库,以及FlagCX通信库。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据悉,在此次验证中,MTT S5000面向Qwen3-0.6B语言模型完成了1T Tokens从头训练验证,实现连续6天以上、超过14000步的无中断稳定训练。训练所得模型 Loss 曲线与基线高度一致,平均相对误差控制在0.82%以内;在标准下游任务评测中,较行业标杆基线(英伟达)提升1.65个百分点,充分验证了全功能GPU算力在大模型端到端训练中的稳定性与有效性。
智源研究院副院长兼总工程师林咏华表示:"长期以来,‘对齐CUDA’只是行业在缺乏替代方案下‘不得已为之’的对齐标准。但如果能获得比 CUDA 更优的实际训练效果,才是产业界共同的期待,才能让系统架构百花齐放、勇于创新。摩尔线程在训练实测中超过了国际主流产品的表现,证明了这种期待已经有实现的可能性了。"
相关攻略
北京商报讯(记者 王蔓蕾)近日,北京智源人工智能研究院(以下简称 "智源研究院 ")正式发布重磅验证成果:六款AI芯片、三大模型、同构+异构千卡——众智FlagOS以统一技术栈完成AI训练 "全要素 "验证
在人工智能快速发展的今天,大型语言模型处理长文本的能力变得越来越重要。从理解数小时的视频内容到分析整个代码库,这些应用都需要AI能够高效处理超长的文本序列。然而,传统的注意力机制在处理长文本时面临着
在人工智能快速发展的今天,让机器准确识别图像中的物体已经成为自动驾驶、环境监测和机器人等领域的核心技术。不过,要让AI达到令人满意的识别准确度,往往需要大量标注数据和复杂的模型架构,这给实际应用带来
热门专题
热门推荐
猎豹浏览器免安装网页版入口是https: web lemur-browser com,具备界面简洁响应迅速、多端同步无缝衔接、安全防护层级丰富、文档处理能力突出、资源兼容性广泛覆
据昆仑万维集团消息,3月27日下午,昆仑万维(300418 SZ)旗下天工AI顺利举办“世界模型前沿技术与天工AIGC全家桶大模型生态”专场发布会,携Matrix-Game 3 0、SkyReels
本报(chinatimes net cn)记者石飞月 北京报道大模型未来会走向哪里?OpenClaw的爆火似乎为全行业指明了一个方向,但接踵而至的舆论质疑,又让这个答案变得扑朔迷离。3月27日,在2
Anthropic一款尚未发布的新AI模型因数据泄露意外曝光,引发市场对AI颠覆网络安全行业的担忧再度升温,网络安全板块股价周五盘前全线下挫。据《财富》杂志报道,Anthropic正在开发并已开始向
3月初,腾讯在深圳总部楼下设立“龙虾站”,引发千人排队尝鲜。OpenClaw掀起的“全民养虾”热潮,在短短一个月内让更多人看到了AI Agent深入业务场景的价值,随即推动Token调用量大规模增长





