Meta第二代自研AI芯片性能提升三倍以上
不久前,Meta宣布将斥资150亿美元采购60多万块GPU,这还不算系统成本。就在大家以为Meta准备把所有筹码押在GPU上时,它悄然放出了下一代自研AI芯片——MTIA v2。
基于5nm打造,性能三倍以上
相比上一代MTIA v1,MTIA v2的工艺从台积电7nm升级到了5nm,主频也从800MHz提升至1.35GHz。得益于工艺改进,尽管晶体管数量大幅增加,芯片面积仅增加了12%。

MTIA v2芯片 / Meta
性能提升的核心在于算力。根据Meta给出的数据,其GEMM算力达到354TFLOPS/s(INT8),SIMD算力达到11.06TFLOPS/s(INT8),相较上一代均提升了3倍以上。接口也从8x PCIe 4.0升级到8x PCIe 5.0,带宽直接翻倍。算力的飞跃除了工艺升级,很可能也与内核迭代有关。结合晶心科技与Meta合作开发数据中心AI处理器的消息来看,MTIA v1很可能采用了晶心科技的首个商用RISC-V矢量处理器内核NX27V,而MTIA v2则大概率用上了最新的AX45MPV内核——三倍以上的性能提升幅度与MTIA的算力提升吻合,当然,这目前还只是推测。
值得注意的是,与同期发布的英特尔Gaudi 3不同,MTIA v2在内存配置上依然没有选择HBM。片上内存只有256MB,片外内存选用了LPDDR5。虽然片上内存带宽高达2.7TB/s,但这注定了MTIA v2很难高效承载大模型应用。在硬件堆料之下,MTIA v2的功耗也来到了90W,相比MTIA v1的25W有较大幅度增加。不过与H100的能耗比相比,MTIA v2仍有明显优势。这也意味着上一代的服务器方案可能不再适用,Meta为此为新翻跟斗打造了全新的机柜系统。单个机架由三个底盘构成,每个底盘塞进12块板卡,每块板卡集成2个翻跟斗——也就是说,单个机架共有72个MTIA v2翻跟斗,单机柜至少需要6000W的电源供应。若要实现多机架扩展,还可以加入RDMA NIC。
Meta表示,这样的性能成绩离不开硬件本身的提升,也归功于在优化内核、编译器和运行时上的持续投入。随着后续开发生态进一步成熟,针对特定模型进行优化的时间会进一步缩短,而且未来还有不少空间可以继续挖掘芯片的效率潜力。
软件栈引入新的编译器
伴随新硬件的发布,Meta也在软件栈上加大了投入。作为PyTorch的开发者,MTIA的软件栈从设计之初就实现了与PyTorch 2.0的完全集成,并支持TorchDynamo和TorchInductor等新特性。与此同时,为了简化应用开发者的工作,为MTIA v1开发的代码也能向下兼容新的MTIA v2硬件。Meta透露,由于已将全部软件栈集成在新芯片内,发布之际,他们已经在自己的服务器上用MTIA v2跑了一段时间了。正是因为有这种兼容的软件栈方案,Meta可以在九个月内让商用模型运行在16个地区的服务器上。
为了为全新的MTIA硬件生成更高性能的代码,Meta还打造了一套新的Triton-MTIA编译器。Triton是由OpenAI开发的开源语言和编译器,用于编写高效的ML计算内核。它极大地提高了开发者编写GPU代码的速度,而Meta发现Triton同样适用于MTIA这类非GPU的硬件架构。
写在最后
从MTIA v2的性能来看,这款翻跟斗不会替代Meta购置的大量GPU用于大语言模型,而是追求算力、内存带宽和内存容量之间的平衡,主攻排名和推荐类的大模型。这样一来,大容量的SRAM依然留给GPU,而Meta最大的收入来源——广告业务,则可以通过MTIA这类翻跟斗来降低成本。除了投资定制AI芯片和下一代GPU这样的计算芯片,Meta也强调会继续投资内存带宽、网络和容量相关的下一代硬件系统。不仅如此,Meta还在探索扩大MTIA的应用范围,未来可能会支持GenAI负载。
相关攻略
不久前,Meta宣布将斥资150亿美元采购60多万块GPU,这还不算系统成本。就在大家以为Meta准备把所有筹码押在GPU上时,它悄然放出了下一代自研AI芯片——MTIA v2。 基于5nm打造,性能三倍以上 相比上一代MTIA v1,MTIA v2的工艺从台积电7nm升级到了5nm,主频也从800
Meta五月底的八千人裁员持续影响公司士气,员工普遍感到灰心与无力。扎克伯格在内部备忘录中重申全力投入AI的决心,并承诺今年不再有类似规模的全局性裁员。但员工透露,尽管公司层面做出保证,各部门仍可能进行针对特定团队或业务的调整与裁员。
《007:初露锋芒》媒体评分正式解禁,口碑表现强劲。根据知名评分汇总网站Metacritic的数据,截至发稿,本作PS5版获得87分的媒体均分,基于56家媒体评测;PC版同样收获87分,收录了28家媒体的评价。 这款由《杀手》系列开发商IO Interactive精心打造的动作谍战游戏,为传奇特工詹
真正的大事件,其影响从来不是一锤子买卖。序幕的铺垫和落幕后的余波,往往比事件本身持续得更久。五月底Meta那场涉及八千人的大裁员,就是如此。刀锋落下之后,留在场内的幸存者们所承受的士气打击,至今仍在蔓延,如同一场停不下来的余震,连带公司的公众形象也一路下滑。 最近,Meta一位工程经理山姆·沃伊特在
热门专题
热门推荐
《Paralives》开发商承诺所有后续更新永久免费,拒绝付费DLC模式。15人小团队依靠首发销售额即可支撑多年运营,无需依赖额外内容包维持开发,展现了与《模拟人生》系列不同的差异化竞争思路。
2025年5月28日,比亚迪王朝网全新力作——宋Ultra DM-i正式推向市场,共推出5款配置车型,官方售价区间为12 99万至15 99万元。此次定价策略极具突破性:一款拥有310公里纯电续航能力的中型插电混动SUV,直接下探至13万元级别市场。作为王朝网络的新旗舰,该车明确瞄准高频出行需求场景
先来关注一个有趣的细节:苹果首款折叠屏手机,传闻将于今年秋季正式亮相。产品命名可能为iPhone Ultra,也有媒体称之为iPhone Fold——无论最终叫什么,这都将标志着苹果在折叠形态领域首次“出手”。 近日,配件厂商iFunSmart已率先上架iPhone Ultra的首批保护壳——这绝非
山寨币ETF迎来批量上市潮,首批项目市场表现如何?一文分析 Binance币安 欧易OKX ️ Huobi火币️ 最近,市场出现了一个不容忽视的新动向:XRP、DOGE、LTC、HBAR等现货ETF已经悄然登陆美国市场。与此同时,A VAX、LINK等资产的同类产品也正在审批流程中。进入11月以来,
近日,公司对SteamDeck1TBOLED版涨价300美元至949美元,上架短短不到24小时便再度售罄。据外界分析,该公司从中国大量补货并分批投放库存,高溢价未影响众多玩家的抢购热情与速度,其人气极其旺盛无比足以支撑快速清空。





