摩尔线程发布GPU:花港架构与华山大核双芯片解析
12月20日,在摩尔线程MUSA开发者大会上,全新“花港”架构正式亮相。会议同时发布了MUSA 5.0全栈软件系统升级,并揭晓了基于该架构的两款芯片——“华山”与“庐山”,它们分别面向人工智能训练与推理融合场景,以及高性能图形渲染应用。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
作为花港架构的首款芯片,“华山”聚焦于AI训推一体与智能融合,在浮点运算能力、内存访问带宽、存储容量以及高速互联带宽等方面实现了全面提升。芯片集成了新一代异步编程模型,支持高效的线程同步与线程束特化处理,从而优化并行计算效率。其配备的新型张量计算引擎支持TF32、FP16、INT8等多精度矩阵运算,并显著增强了FP6与FP4精度下的张量处理性能。新增的TCE-PAIR模式强化了内部数据复用机制,结合MTFP8/6/4混合低精度计算技术,能够兼容主流低精度浮点格式,有效提升能效比。
在系统级设计上,“华山”可扩展至十万卡规模的AI计算集群。它搭载了新一代Scale-up互联架构,支持MTLink 4.0及多种以太网协议,能够适配多样化的Scale-up交换设备。该方案还支持SHARP通信加速技术,芯片间互联带宽高达1314+ GB/s,足以满足大规模分布式训练的需求。
“庐山”作为花港架构的第二款芯片,专为高性能图形渲染打造。依托全新的指令集设计,其算力密度较前代提升50%,能效比提高达10倍之多。芯片集成第一代AI生成式渲染架构与第二代光线追踪硬件加速引擎,全面支持DirectX 12 Ultimate图形接口标准。其内置的AI计算加速单元,可与几何着色器、网格着色器、像素着色器及光追材质着色器深度协同,通过UNITE渲染架构实现任务调度优化、负载均衡与多阶段同步,从而提升整体渲染效率。
花港架构本身在光线追踪技术上也取得了突破,配备了全新的硬件加速引擎,支持对光线遍历全过程进行硬件加速,实现了全场景求交计算的高效处理。与早期的春晓架构相比,其光追性能提升高达50倍。
搭载“华山”与“庐山”芯片的新一代硬件产品将于明年正式推出,相关进展将持续更新。
热门专题
热门推荐
加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这
微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿
稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D
基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一
PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票





