英伟达Feynman GPU前瞻:效仿AMD X3D堆叠,盖楼式集成LPU单元
12月30日,据科技媒体Wccftech昨日报道,英伟达计划在2028年推出的“费曼”(Feynman)GPU中,集成Groq的LPU(语言处理单元)技术,旨在借此主导AI推理市场。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

理查德·费曼(Richard Feynman,1918-1988)是美国著名理论物理学家、诺贝尔奖得主,他以在量子电动力学(QED)领域的贡献而闻名,特别是提出了以他名字命名的费曼图。因这项工作,他与施温格、朝永振一郎共同获得了1965年诺贝尔奖。
GPU领域专家AGF于12月28日在X平台分析预测称,费曼GPU将借鉴AMD在X3D处理器上的成功经验,极有可能采用台积电先进的SoIC(系统整合芯片)混合键合技术,实施3D堆叠设计。

根据这一构想,主计算裸片(compute die,包含Tensor单元与控制逻辑)将采用台积电最先进的A16(1.6nm)工艺制造,而包含大规模SRAM(静态随机存取存储器)存储库的LPU单元则会制成独立的Die,直接堆叠在计算核心之上。
这种设计利用了A16工艺的“背面供电”特性,释放了芯片正面空间用于垂直连接,从而实现超低延迟的数据传输。

该专家分析认为,英伟达之所以考虑这种复杂的堆叠方案,主要源于物理层面的限制。随着制程工艺不断微缩,SRAM的缩放速度已明显滞后于逻辑电路。
若在昂贵的先进制程节点上制造单片式的大容量SRAM,不仅会造成高端硅片的浪费,还将导致晶圆成本急剧飙升。因此,将LPU/SRAM剥离为独立Die并进行堆叠,成为平衡性能与成本的最优解,这也符合当前半导体行业追求“芯粒”(Chiplet)化的技术趋势。
援引博文介绍,尽管堆叠方案理论上能带来巨大的推理性能飞跃,但实际落地仍面临重重困难。首先是散热问题,在原本就高密度的计算核心上再堆叠发热单元,极易触碰热功耗墙。
其次是更为棘手的软件适配问题:Groq的LPU架构强调“确定性”执行顺序,而英伟达赖以生存的CUDA生态则基于硬件抽象与灵活性设计。

如何在保证CUDA兼容性的前提下,完美融合LPU的固定执行逻辑,将是英伟达工程师必须攻克的“工程奇迹”。
相关攻略
财联社3月20日讯(编辑 卞纯)随着AI算力需求呈指数级增长,而地面数据中心面临耗能巨大等挑战,硅谷科技巨头已纷纷将目光瞄准太空,在太空建立数据中心成为他们AI竞赛的下一个战场。当地时间周四,英伟达
AIPress com cn报道3月30日消息,随着全球科技巨头竞相入局 AI 赛道,晶圆代工巨头台积电的订单迎来了史无前例的大爆发。据供应链消息透露,其最尖端工艺的产能已经排期到了 2028 年。
来源:环球网【环球网科技综合报道】3月30日消息,英伟达创始人、首席执行官黄仁勋在3月24日播出的《Lex Fridman》视频播客中,谈及与台积电的长期合作,高度肯定台积电的产业竞争力与合作价值。
你有没有想过,为啥现在AI芯片越做越大,但单次推理延迟就是降不下来?你去问做AI部署的哥们,十个有九个会跟你吐槽:GPU这块,大模型推理就是看batch吃满了能跑多少吞吐量,但你要真给用户做实时交互
允中 发自 凹非寺量子位 | 公众号 QbitAI还得是咱国产世界模型牛!极佳视界最新力作GigaWorld-1,直接击穿谷歌英伟达,WorldArena登顶全球第一。而且还是唯一一个综合得分突破6
热门专题
热门推荐
快科技3月30日消息,知名苹果爆料人Mark Gurman近日表示,即将问世的iPhone Fold将成为苹果历史上意义最为重大的改款机型,其重要性超越了当年的iPhone 4以及开启全面屏时代的i
3月30日消息,微软Store和文件资源管理器合作伙伴架构师Rudy Huyn在社交平台确认,正在组建一支新团队负责Windows 11应用开发,并明确表示新应用将100%采用原生技术构建,不再依赖
今日港交所IPO现场四锣同响,一家半导体超级独角兽也在其中。 3月30日,全球最大碳化硅外延供货商瀚天天成电子科技(厦门)股份有限公司(以下简称“瀚天天成”),正式在港交所挂牌上市。此次IPO
3月以来,苹果首款折叠屏iPhone的相关爆料持续升温。知名科技记者马克·古尔曼在最新一期的《Power On》通讯中,对这款折叠屏iPhone寄予了极高的评价;他表示这款手机将是自2017年iPh
微信直播预约流量激励领取攻略及 2026 小游戏预约获 200 万曝光方法在当今数字化的时代,微信直播和各类小游戏成为了吸引流量、拓展业务的重要途径。而其中的预约流量激励和曝光机会





