首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
Meta第二代自研AI芯片性能提升三倍以上

Meta第二代自研AI芯片性能提升三倍以上

热心网友
82
转载
2026-05-28

不久前,Meta宣布将斥资150亿美元采购60多万块GPU,这还不算系统成本。就在大家以为Meta准备把所有筹码押在GPU上时,它悄然放出了下一代自研AI芯片——MTIA v2。

基于5nm打造,性能三倍以上

相比上一代MTIA v1,MTIA v2的工艺从台积电7nm升级到了5nm,主频也从800MHz提升至1.35GHz。得益于工艺改进,尽管晶体管数量大幅增加,芯片面积仅增加了12%。

MTIA v2芯片 / Meta

性能提升的核心在于算力。根据Meta给出的数据,其GEMM算力达到354TFLOPS/s(INT8),SIMD算力达到11.06TFLOPS/s(INT8),相较上一代均提升了3倍以上。接口也从8x PCIe 4.0升级到8x PCIe 5.0,带宽直接翻倍。算力的飞跃除了工艺升级,很可能也与内核迭代有关。结合晶心科技与Meta合作开发数据中心AI处理器的消息来看,MTIA v1很可能采用了晶心科技的首个商用RISC-V矢量处理器内核NX27V,而MTIA v2则大概率用上了最新的AX45MPV内核——三倍以上的性能提升幅度与MTIA的算力提升吻合,当然,这目前还只是推测。

值得注意的是,与同期发布的英特尔Gaudi 3不同,MTIA v2在内存配置上依然没有选择HBM。片上内存只有256MB,片外内存选用了LPDDR5。虽然片上内存带宽高达2.7TB/s,但这注定了MTIA v2很难高效承载大模型应用。在硬件堆料之下,MTIA v2的功耗也来到了90W,相比MTIA v1的25W有较大幅度增加。不过与H100的能耗比相比,MTIA v2仍有明显优势。这也意味着上一代的服务器方案可能不再适用,Meta为此为新翻跟斗打造了全新的机柜系统。单个机架由三个底盘构成,每个底盘塞进12块板卡,每块板卡集成2个翻跟斗——也就是说,单个机架共有72个MTIA v2翻跟斗,单机柜至少需要6000W的电源供应。若要实现多机架扩展,还可以加入RDMA NIC。

Meta表示,这样的性能成绩离不开硬件本身的提升,也归功于在优化内核、编译器和运行时上的持续投入。随着后续开发生态进一步成熟,针对特定模型进行优化的时间会进一步缩短,而且未来还有不少空间可以继续挖掘芯片的效率潜力。

软件栈引入新的编译器

伴随新硬件的发布,Meta也在软件栈上加大了投入。作为PyTorch的开发者,MTIA的软件栈从设计之初就实现了与PyTorch 2.0的完全集成,并支持TorchDynamo和TorchInductor等新特性。与此同时,为了简化应用开发者的工作,为MTIA v1开发的代码也能向下兼容新的MTIA v2硬件。Meta透露,由于已将全部软件栈集成在新芯片内,发布之际,他们已经在自己的服务器上用MTIA v2跑了一段时间了。正是因为有这种兼容的软件栈方案,Meta可以在九个月内让商用模型运行在16个地区的服务器上。

为了为全新的MTIA硬件生成更高性能的代码,Meta还打造了一套新的Triton-MTIA编译器。Triton是由OpenAI开发的开源语言和编译器,用于编写高效的ML计算内核。它极大地提高了开发者编写GPU代码的速度,而Meta发现Triton同样适用于MTIA这类非GPU的硬件架构。

写在最后

从MTIA v2的性能来看,这款翻跟斗不会替代Meta购置的大量GPU用于大语言模型,而是追求算力、内存带宽和内存容量之间的平衡,主攻排名和推荐类的大模型。这样一来,大容量的SRAM依然留给GPU,而Meta最大的收入来源——广告业务,则可以通过MTIA这类翻跟斗来降低成本。除了投资定制AI芯片和下一代GPU这样的计算芯片,Meta也强调会继续投资内存带宽、网络和容量相关的下一代硬件系统。不仅如此,Meta还在探索扩大MTIA的应用范围,未来可能会支持GenAI负载。

来源:https://m.elecfans.com/article/2698859.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Meta第二代自研AI芯片性能提升三倍以上
AI资讯
Meta第二代自研AI芯片性能提升三倍以上

不久前,Meta宣布将斥资150亿美元采购60多万块GPU,这还不算系统成本。就在大家以为Meta准备把所有筹码押在GPU上时,它悄然放出了下一代自研AI芯片——MTIA v2。 基于5nm打造,性能三倍以上 相比上一代MTIA v1,MTIA v2的工艺从台积电7nm升级到了5nm,主频也从800

热心网友
05.28
荣旗科技与Meta合作稳定 今年订单持续落地执行顺利
科技数码
荣旗科技与Meta合作稳定 今年订单持续落地执行顺利

荣旗科技与Meta合作良好,今年已陆续获得订单并有序执行,该进展引发市场对产业链企业的广泛关注。

热心网友
05.28
Meta裁员后扎克伯格重申AI战略并承诺今年不再大规模裁员
科技数码
Meta裁员后扎克伯格重申AI战略并承诺今年不再大规模裁员

Meta五月底的八千人裁员持续影响公司士气,员工普遍感到灰心与无力。扎克伯格在内部备忘录中重申全力投入AI的决心,并承诺今年不再有类似规模的全局性裁员。但员工透露,尽管公司层面做出保证,各部门仍可能进行针对特定团队或业务的调整与裁员。

热心网友
05.27
007无暇赴死媒体评分解禁 Metacritic均分87分
游戏资讯
007无暇赴死媒体评分解禁 Metacritic均分87分

《007:初露锋芒》媒体评分正式解禁,口碑表现强劲。根据知名评分汇总网站Metacritic的数据,截至发稿,本作PS5版获得87分的媒体均分,基于56家媒体评测;PC版同样收获87分,收录了28家媒体的评价。 这款由《杀手》系列开发商IO Interactive精心打造的动作谍战游戏,为传奇特工詹

热心网友
05.27
Meta裁员幸存者自述 士气低落如何走出职场低谷
AI资讯
Meta裁员幸存者自述 士气低落如何走出职场低谷

真正的大事件,其影响从来不是一锤子买卖。序幕的铺垫和落幕后的余波,往往比事件本身持续得更久。五月底Meta那场涉及八千人的大裁员,就是如此。刀锋落下之后,留在场内的幸存者们所承受的士气打击,至今仍在蔓延,如同一场停不下来的余震,连带公司的公众形象也一路下滑。 最近,Meta一位工程经理山姆·沃伊特在

热心网友
05.26

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Paralives首发销量充足 支撑后续开发无需DLC
游戏攻略
Paralives首发销量充足 支撑后续开发无需DLC

《Paralives》开发商承诺所有后续更新永久免费,拒绝付费DLC模式。15人小团队依靠首发销售额即可支撑多年运营,无需依赖额外内容包维持开发,展现了与《模拟人生》系列不同的差异化竞争思路。

热心网友
05.28
比亚迪宋Ultra DM-i上市12.99万 承诺城市领航安全兜底
业界动态
比亚迪宋Ultra DM-i上市12.99万 承诺城市领航安全兜底

2025年5月28日,比亚迪王朝网全新力作——宋Ultra DM-i正式推向市场,共推出5款配置车型,官方售价区间为12 99万至15 99万元。此次定价策略极具突破性:一款拥有310公里纯电续航能力的中型插电混动SUV,直接下探至13万元级别市场。作为王朝网络的新旗舰,该车明确瞄准高频出行需求场景

热心网友
05.28
折叠屏iPhone Ultra外观已定,第三方保护壳亮相
科技数码
折叠屏iPhone Ultra外观已定,第三方保护壳亮相

先来关注一个有趣的细节:苹果首款折叠屏手机,传闻将于今年秋季正式亮相。产品命名可能为iPhone Ultra,也有媒体称之为iPhone Fold——无论最终叫什么,这都将标志着苹果在折叠形态领域首次“出手”。 近日,配件厂商iFunSmart已率先上架iPhone Ultra的首批保护壳——这绝非

热心网友
05.28
山寨币ETF批量上市后市场表现分析 哪些项目值得关注
web3.0
山寨币ETF批量上市后市场表现分析 哪些项目值得关注

山寨币ETF迎来批量上市潮,首批项目市场表现如何?一文分析 Binance币安 欧易OKX ️ Huobi火币️ 最近,市场出现了一个不容忽视的新动向:XRP、DOGE、LTC、HBAR等现货ETF已经悄然登陆美国市场。与此同时,A VAX、LINK等资产的同类产品也正在审批流程中。进入11月以来,

热心网友
05.28
即使在大幅涨价后 Steam Deck 玩家热情依旧再次售罄
游戏攻略
即使在大幅涨价后 Steam Deck 玩家热情依旧再次售罄

近日,公司对SteamDeck1TBOLED版涨价300美元至949美元,上架短短不到24小时便再度售罄。据外界分析,该公司从中国大量补货并分批投放库存,高溢价未影响众多玩家的抢购热情与速度,其人气极其旺盛无比足以支撑快速清空。

热心网友
05.28