美国国家实验室转向初创企业寻求AI芯片替代方案
近年来,人工智能技术的迅猛发展深刻改变了全球芯片产业的竞争态势。以英伟达、AMD为代表的行业巨头,几乎将全部研发资源和产能都集中在了高利润的AI低精度计算市场。然而,这场席卷全球的“AI算力竞赛”,却让另一个关乎国家科研与工程命脉的领域——高精度科学计算,面临着被边缘化的风险。
一个清晰的迹象是,包括美国桑迪亚国家实验室在内的顶尖科研机构,正因难以从主流供应商处采购到合适的高性能计算芯片,而不得不将合作目光转向以往规模较小的芯片初创企业。

巨头战略倾斜,高精度计算芯片供应紧张
桑迪亚国家实验室并非普通科研单位,它是美国核心的核武器设计、测试与维护机构之一。其部署的液冷超级计算机,常年承担着全球最复杂的科学模拟任务:例如精确模拟高超音速核载具在大气层中的飞行轨迹,或是推演极端条件下核爆的连锁物理效应。过去数十年,为这些“国之重器”提供核心算力的芯片,几乎被英伟达和AMD所垄断。
如今,这一格局正在松动。桑迪亚实验室高性能计算部门负责人Steve Monk透露,随着主流芯片厂商的战略重心全面转向人工智能,加之全球供应链持续紧张,实验室在获取适用于高精度科学计算的专用芯片时,面临的挑战日益严峻。这种从供应链到技术路线的双重压力,甚至引发了团队对未来能否保障关键国家科研项目顺利运行的深切担忧。
矛盾的核心,聚焦于一项名为“双精度浮点运算”(FP64)的关键技术指标。在核物理模拟、流体力学、气候预测等尖端科研领域,计算芯片必须能够在极高数值范围内保持精确无误的运算能力,不能有丝毫精度损失。尽管英伟达与AMD长期争夺该领域的领导地位,并赢得了大量政府及学术机构的超算订单,但当前火爆的AI模型训练与推理,主要依赖FP8、FP16等低精度格式,对FP64的需求极低。因此,芯片巨头的产品研发路线图不可避免地发生了偏移。
双精度浮点计算(FP64)被视作科学计算的“精度基石”,它是确保新型航空器设计、航天发射、药物研发乃至核威慑体系可靠性的数学基础,能够表达超过1.8×10^19个唯一数值。相比之下,当前多数AI应用使用的FP8格式仅能表达256个值,两者在精度维度上存在天壤之别。
一个颇具代表性的案例是英伟达最新发布的Rubin GPU。其在AI推理算力上实现了代际飞跃,峰值性能达50 PetaFLOPS,是前代Blackwell架构的2.5倍。然而,其FP64的硬件峰值性能却仅为约33 TeraFLOPS,甚至略低于四年前推出的H100芯片。当然,英伟达也推出了基于Ozaki算法的FP64软件仿真方案,宣称可在CUDA库中实现高达200 TeraFLOPS的矩阵运算性能。但这一方案也引发了业界专家的疑虑。AMD研究员Nicholas Malaya指出,此类仿真技术在标准基准测试中或许表现尚可,但在涉及真实物理过程(如材料相变、燃烧动力学)的模拟中,其数值可靠性存疑,且存在IEEE标准合规性不足、内存占用倍增等潜在问题。
芯片行业咨询机构More Than Moore的首席分析师Ian Cutress对此评价道:英伟达即将推出的Rubin芯片,其双精度性能在某些关键指标上不增反降,这无疑给全球高性能计算领域的众多科学家敲响了警钟。
市场缝隙显现,初创企业迎来机遇
行业巨头的战略转向,无意中为市场留下了一片蓝海。而像NextSilicon这样的创新公司,正试图抓住这一历史性机遇。这家成立于2017年的以色列芯片初创企业,经过八年潜心研发,累计获得了约3.03亿美元融资,估值一度触及15亿美元。
NextSilicon选择了与英伟达、AMD截然不同的技术路径。其旗舰产品“Maverick-2”芯片采用了创新的智能数据流架构。简而言之,该架构能够通过软件定义的数据流硬件,在运行时动态地重构与优化自身,实现芯片对特定计算任务的高效自适应。在能效方面,数据流架构极大减少了数据在存储与计算单元之间的无效搬运,从而在功耗控制上展现出显著优势。
对于这种新颖的架构,桑迪亚国家实验室负责新型计算架构评估的高级科学家James Laros给予了积极反馈:“NextSilicon的测试性能结果令人瞩目,它展示出一种巨大的潜力——无需对现有科学计算代码进行大规模重写,即可显著提升整体运算效率。”
近期,桑迪亚国家实验室、NextSilicon以及系统集成商Penguin Solutions共同宣布,搭载NextSilicon芯片的超级计算机原型系统,已成功通过了一系列通用高性能计算基准测试的关键技术验证。这标志着该系统获得了“准入资格”,将于今年秋季接受更贴近核安全实际应用场景的极端复杂计算任务考验。
Laros揭示了实验室携手初创公司的深层战略考量:构建一个多元化的、具备韧性的芯片供应链体系。其目的是确保即使未来主流芯片供应商完全转向其他市场,国家实验室依然能够持续、稳定地获得满足重大科研项目需求的尖端算力。
“我们必须确保自己拥有完成使命的可选方案,”Laros强调,“因为这项使命,不容有失。”
相关攻略
近日,斯坦福大学《前沿系统》CS 153课程的一场线上公开讲座,在科技与半导体行业引发了广泛关注。作为特邀客座讲师,英伟达(NVIDIA)首席执行官黄仁勋在深入解析AI硬件架构与趋势的同时,再次就人工智能芯片的出口管制政策发表了明确而直接的观点。这位全球图形与AI计算领军企业的掌舵人,其见解向来以犀
瑞银报告指出,英特尔EMIB-T先进封装技术有望凭借其成本与设计灵活性优势,进入英伟达下一代RubinUltraAI芯片供应链。该技术通过在基板嵌入硅桥连接芯片,无需昂贵中介层,适合大规模集成。分析认为,4芯片版本的RubinUltra可能采用此方案,但最终落地仍取决于英伟达的决策以及基板产能
五月初,一则来自光刻机巨头阿斯麦(ASML)高层的访谈,在业内激起了不小的波澜。首席执行官克里斯托夫·富凯的一席话,不仅坦诚得有些出人意料,更清晰地勾勒出当前全球半导体产业面临的几道关键坎儿。 富凯开门见山地承认,人工智能的爆发速度,完全超出了他的预料。的确,当ChatGPT以一种前所未有的直观方式
台积电在近期技术论坛上首次提出AI芯片“三层蛋糕”架构理论,强调光子与光学互连是未来关键。其核心COUPE光互连技术通过3D堆叠整合电子与光子芯片,能大幅提升带宽与能效。首款200Gbps产品已投产,预计年内量产,2026年实现规模量产。该技术获英伟达等厂商采用,预计到2030年能将带宽密度提升8倍
芯片代工环节出现涨价趋势,中芯国际确认已与客户协商上调部分紧缺品类代工价格。公司当前产能利用率达93 1%,多条产品线满载,在手订单充足。驱动因素包括AI芯片需求强劲挤压其他品类产能,以及客户为保供应提前备货。大量消费电子及物联网订单因此回流中国大陆代工厂。公司对二季度及全年业绩持乐观预期,预计涨价
热门专题
热门推荐
上海启动全球首颗光计算卫星研制,其天基光计算具备抗辐照、低功耗特性,适应太空环境,可支撑在轨大算力任务。目前芯片太空验证已完成,全链条研制能力基本形成。产业面临成本与规模化挑战,需重构航天制造体系。长三角已成立创新联合体聚焦七大技术攻坚,上海将天基计算列为未来。
苹果与OpenAI合作因商业回报未达预期出现裂痕。腾讯地图推出AI骑手模式优化配送。百度成立模型委员会强化AI布局。荣耀将发布搭载云台系统的RobotPhone。Anthropic拟以9000亿美元估值融资。阿里发布智能体开发工作台Qoder1 0。千问APP接入药监局数据。发那科与英伟达深化合作,利用AI加速机器人开发。
面对海量书籍资源,数字化管理工具至关重要。小满图书管理侧重会员与库存管理,适合书店。库存管理通轻量化,支持多货品进销存。藏书馆兼具藏书管理与数字阅读功能。移动图书馆对接高校资源,提供学术服务。个人图书馆专注个人知识收集与创作。各类软件功能各异,需根据核心需求选择。
英文朗读软件能有效辅助学习。推荐几款特色应用:全能型《朗读器》操作简便;《朗读者》结合翻译与朗读;《英文翻译》支持长文朗读;《朗读大师》擅长图像识别与发音反馈;《中英文翻译》提供系统化学习路径。根据需求选择工具并坚持练习,可提升理解与发音能力。
飞机是远距离出行的高效选择,提前购票可锁定行程并享受优惠。主流购票平台包括飞猪旅行、携程旅行、航班管家、美团、飞行卡和去哪儿旅行。这些应用不仅提供机票预订,还整合酒店、景点门票、本地生活等服务,满足用户对价格、一站式规划或特定优惠的不同需求。





