首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
摩尔线程显卡上市半月体验:挑战英伟达的底气何在

摩尔线程显卡上市半月体验:挑战英伟达的底气何在

热心网友
63
转载
2025-12-21


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

出品 | 虎嗅科技组

作者 | 丸都山

编辑 | 苗正卿

头图 | 摩尔线程

在资本市场的热度趋于平静之时,摩尔线程又在产业端将人们的视线拉回。

12月20日,摩尔线程举行了首届“MUSA开发者大会”,发布全新一代全功能GPU架构“花港”,以及基于“花港”架构打造的AI训推一体芯片“华山”,以及专用于高性能图形渲染的芯片“庐山”。


此外,摩尔线程创始人张建中在现场还公布了“夸娥万卡智算集群”,以及未来即将发布的MTT C256超节点结构规划。

如果说上述内容还属于“可预测的”技术迭代内,那么诸如中间语言MTX,以及光刻计算库、量子计算融合框架等技术,就真的完全在人意料之外了。

当然,也可以说这些技术并非摩尔线程首次提出的,毕竟后面这几项或多或少都在GTC大会上出现过,但从国产GPU公司体量来看,敢于全方位地去搭建生态,这本身就是件值得肯定的事。

对于正处于“情感估值”与“理性审视”交织中的摩尔线程来说,这场开发者大会也是在向外界传达一个明确的信号,即无论行业作何评价,摩尔线程都会坚持以MUSA为核心,去打造类似英伟达CUDA的生态护城河。


与英伟达中门对狙?

先来说说本次开发者大会上,让笔者最为震惊的一项技术:中间语言MTX。

它属于MUSA 5.0软件栈的一部分,对于MUSA统一架构,关注过摩尔线程的人或多或少都了解过,这是摩尔线程自主研发的覆盖从芯片架构、指令集编程模型到软件运行库及驱动程序框架的全栈技术体系。

在此前几次版本迭代中,MUSA主要集中在编程生态的扩充,比容兼容更多编程语言,或是丰富算子库上,而今天提到的“中间语言MTX”属首次出现。


简单解释下中间语言MTX是什么。它的核心作用是兼容不同代际GPU的指令架构,让开发者无需为每一代新GPU重新适配代码,大幅降低开发者适配成本,同时为上层软件生态提供稳定的底层支撑。

用个更直观的例子来说明下:在英伟达CUDA生态下,其核心底层组件之一,就是这个中间语言技术,英伟达将其命名为“PTX”,依托PTX中间语言,开发者在2018年为Turing架构芯片编译的代码,至今仍可通过驱动即时编译在2025年的Blackwell芯片上运行。

那么做这个“中间语言”难吗?应该说非常难,而且耗时耗力,同样以英伟达的PTX为例,在2007年随CUDA 1.0发布后,大部分版本都需要新增对应硬件的专属指令(如Tensor Core相关指令),同时保持对旧版本的兼容,最终形成“高级语言→PTX→硬件二进制指令”的成熟编译链路。

对于开发者来说,因为中间语言PTX的存在,更加没理由拒绝CUDA,因为在英伟达之前,就没有芯片厂商考虑过“向前兼容”的问题。

不过,对于国内GPU厂商而言,开发一个中间语言的难度肯定要远大于英伟达,因此在今天之前,笔者从不认为真会有国内厂商去做这件事。

而按照张建中在今天开发者大会上的表态,在明年上半年,摩尔线程自研的MTX就将向开发者开放。

相较于英伟达的18年磨一剑,可以预见的是,摩尔线程的MTX在适用性上一定不如前者,不过敢于迈出这一步,还是足够令人刮目相看。

毕竟,在GPU行业中,有着英伟达这座大山,“不做生态”已经成为了某种程度上的政治正确。


新架构,提升显著

从2024年基于MUSA统一架构的“苏堤”问世算起,摩尔线程先后推出了四代GPU架构,而本次发布的“花港”架构基本上可以看作是升级幅度最大的一代。

首先是计算性能的显著提升。基于新一代指令集,“花港”架构较前代“平湖”的算力密度提升50%,同时能效大幅优化,且支持从FP4到FP64的全精度端到端的全精度端到端计算。

其次是异步编程与超大规模互联的支持。新一代异步编程模型,能够更好地优化任务调度与并行极致,而通过自研的MTLink高速互联技术,将支持十万卡以上规模的智算集群扩展。


值得一提的是,在开发者大会现场,张建中还明确表示,新一代“花港”架构将内置AI生成式渲染结构,并且完整支持DirectX 12 Ultimate。

据此基本可以判断出,摩尔线程的消费级显卡接下来一定会得到迭代,而且极大概率是一款基于“花港”架构打造的产品。在“消费级显卡”这个小众且最艰难的赛道上,摩尔线程依然没有放弃。

基于“花港”架构,摩尔线程在今天发布了两款芯片:“庐山”与“华山”。

先说说定位于“AI训推一体”芯片的“庐山”。除了上文提到的新一代异步编程与全精度张量计算单元外,这枚芯片还有个特殊之处是能够适配多种“类以太协议”,同时又适配多种Scale-Up switch。

这意味着“庐山”芯片不仅能在MTlink下使用,也可以兼容国内其他厂商的协议,而据张建中在现场的介绍,“庐山”最高支持在1024片超节点的扩展。

应该说,尽管摩尔线程执着于打造自研生态,但并没有把路走窄。

另外一枚用于高性能图形渲染的芯片“庐山”,其图像性能对比MMT S80,在集成了AI生成式渲染后,AI计算性能提升64倍,UtiTE统一渲染架构让几何处理性能提升16倍,全新的硬件光追引擎,让光线追踪性能提升50倍。


除了芯片外,本次MUSA开发者大会还正式发布了“夸娥万卡智算集群”。该集群具备全精度、全功能通用计算能力,在万卡规模下实现高效稳定的AI训练与推理。



继续拓展生态边界

今年,国内GPU行业的叙事逐渐从“能用”转移到“好用”,尤其在H200解禁对华出口后,国内从业者更加感受到了紧迫。

在芯片“好用”这个问题上,摩尔线程答案仍聚焦于“生态”二字,不仅要实现生态自立,也在主动探索生态边界。

比如在今天的开发者大会上,摩尔线程推出的“长江”SoC。这款芯片主要面向端侧,通过CPU+GPU+NPU的组合,最高可提供50 TOPS的异构AI算力。


据张建中介绍,摩尔线程将推出基于“长江”SoC、AI芯片模组MTT E300和夸娥智算集群打造的MT Robot具身智能解决方案。

通过这个组合能够看出,该款方案最大的特点是能够协调“端—边—云”算力。据悉,MT Robot已经用在了农业场景中。

另外值得一提的是,摩尔线程还基于这款SoC打造了一款名为“MTT AIBOOK”的AI算力本,未来还将推出一款迷你型计算设备MTT AI Cube。


而在具身智能方面,除了MT Robot外,摩尔线程还发布了MT Lambda具身智能仿真训练平台。

该平台在定位上有些类似于英伟达的Issac Sim,但又不完全一样。MT Lambda核心聚焦于“全栈融合”,旨在将物理引擎、渲染引擎与AI引擎深度整合,打破了传统具身智能研发中“开发、仿真、训练”各环节割裂的痛点,以提升研发效率。

此外,MT Lambda也可以直接部署到MT Robot上,以形成软硬件的高效协同。

从摩尔线程在具身智能赛道上的生态拓展可以看出,在目前任何一个与“计算”有关的行业中,摩尔线程都试图通过“全栈软硬件架构+全场景产品”的布局占据身位,每一步都在拓展生态的边界,同时每一步都面临着实打实的挑战。

某种意义上,这也是在走一遍英伟达来时的路,面对后者近20年沉淀出的生态霸权,摩尔线程能否搭建起另一条国产生态护城河,答案终究需要时间来检验。

来源:https://www.163.com/dy/article/KH9IU2NR051188EA.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

显卡安全警报!经典攻击拿捏N卡:RTX 3060/A6000等已沦陷
科技数码
显卡安全警报!经典攻击拿捏N卡:RTX 3060/A6000等已沦陷

研究人员成功将经典Rowhammer攻击移植至现代GPU,引发显卡安全新挑战 显卡安全面临全新威胁:最新研究披露的GDDRHammer与GeForge攻击技术,成功利用GDDR6显存的物理缺陷发起Rowhammer攻击。这种攻击不仅能破坏GPU内部的内存隔离机制,更可进一步穿透至主机系统内存,危及整

热心网友
04.04
机魂大悦!玩家发社媒悼念使用9年的高龄显卡
科技数码
机魂大悦!玩家发社媒悼念使用9年的高龄显卡

国外PC硬件爱好者社区r pcmasterrace玩家分享硬件更新实录:告别GTX 1080 Ti 近日,在全球知名的PC硬件爱好者社区Reddit的r pcmasterrace版块,一则玩家分享的硬件更替帖文引发了广泛共鸣。这位玩家以饱含情感的笔触,向与自己并肩作战长达九年之久的“老战友”——NV

热心网友
04.02
显卡还能这么修!RTX 4090弯曲:竟靠禁用显存通道硬核续命
娱乐
显卡还能这么修!RTX 4090弯曲:竟靠禁用显存通道硬核续命

快科技4月1日消息,据VideoCardz报道,巴西的GPU维修专家Jefferson Silva(Sidnelson)和Paulo Gomes,近日成功修复了两张存在不同故障的RTX 4090显卡

热心网友
04.01
显卡还能这么修!RTX 4090弯曲:竟靠禁用显存通道硬核续命
礼仪与书信
显卡还能这么修!RTX 4090弯曲:竟靠禁用显存通道硬核续命

快科技4月1日消息,据VideoCardz报道,巴西的GPU维修专家Jefferson Silva(Sidnelson)和Paulo Gomes,近日成功修复了两张存在不同故障的RTX 4090显卡

热心网友
04.01
NVIDIA DLSS 4.5技术解析:帧率跃升6倍,游戏性能重磅更新
礼仪与书信
NVIDIA DLSS 4.5技术解析:帧率跃升6倍,游戏性能重磅更新

快科技4月1日消息,NVIDIA推送了DLSS 4 5的下半部分更新,包括DLSS动态多帧生成、更激进的5倍和6倍帧生成倍率,以及全新的增强帧生成模型(目前处于Beta阶段)。新功能面向RTX 50

热心网友
04.01

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

和平精英战斗军犬怎么玩
游戏攻略
和平精英战斗军犬怎么玩

《和平精英》战斗军犬全方位使用指南:从特性解析到实战精通 在《和平精英》中选用战斗军犬作为战术伙伴,首先需要深入理解其核心特性与定位。军犬堪称战场的“生物侦察系统”,其卓越的追踪与索敌能力,能为你精准捕捉敌人的足迹与动向。自跳伞开始,你的战术规划就应将军犬纳入其中——预先评估落点周边的地形与建筑布局

热心网友
04.04
《无限轮回》红妆阁主线攻略一览
游戏攻略
《无限轮回》红妆阁主线攻略一览

《无限轮回》主线第三章红妆阁全攻略:地图、怪物与关键线索全解析 各位探索者,你是否正因《无限轮回》主线第三章“红妆阁”的复杂谜题与强敌而止步不前?无需焦虑,这份详尽的全流程通关攻略将为你层层剖析。从精细地图解析到怪物机制拆解,再到核心藏品与剧情线索的位置说明,所有关键信息一网打尽。阅读本文后,你将获

热心网友
04.04
死亡搁浅2发明家岛屿怎么去
游戏攻略
死亡搁浅2发明家岛屿怎么去

死亡搁浅2发明家岛屿前往方法路线全攻略 在《死亡搁浅2》的宏大世界中,发明家岛屿是一个充满机遇与秘密的重要地点。它如同地图上的一颗明珠,吸引着玩家前往探索。然而抵达之路并非一帆风顺,需要策略与准备。这份指南将为你详细解析前往发明家岛屿的完整流程与要点。 推进主线剧情,解锁关键任务节点 前往发明家岛屿

热心网友
04.04
远光84梅歇尔玩法有什么技巧-远光84梅歇尔玩法技巧攻略
游戏攻略
远光84梅歇尔玩法有什么技巧-远光84梅歇尔玩法技巧攻略

远光84梅歇尔高手进阶:全面玩法技巧与实战教学 许多《远光84》的玩家都想知道,游戏中的强力角色梅歇尔究竟该如何驾驭?本篇攻略将为你深度解析她的核心玩法与实战技巧,助你从入门到精通,充分发挥这位角色的战场统治力。 远光84梅歇尔深度技巧攻略: 技能释放的精髓 梅歇尔的技能组合兼具灵活性与高额伤害,掌

热心网友
04.04
明日方舟终末地洛茜武器选择推荐指南
游戏攻略
明日方舟终末地洛茜武器选择推荐指南

如何在《明日方舟:终末地》中为洛茜搭配武器:提升输出循环与技能收益的关键攻略 各位博士,大家好。在《明日方舟:终末地》中,六星近卫干员洛茜凭借独特的物火混伤与破防叠加机制,成为了战场上的关键角色。她的武器选择,不仅直接影响输出手感的流畅度,更决定了技能加成的最终上限。本文将为您提供一套详尽的洛茜武器

热心网友
04.04