据知情人士透露,芯片巨头英伟达正着手推出一款专为人工智能研究公司OpenAI及其合作伙伴量身定制的新型处理器,旨在助力他们打造更高效、更智能的AI工具。
内部消息显示,英伟达正在研发一套全新的推理计算架构。这一平台预计将于下月在圣何塞举行的GTC开发者大会上正式亮相,并将整合初创公司Groq设计的芯片技术。
推理计算作为让AI模型能够实时回应用户请求的关键技术,已成为行业竞争的核心领域。谷歌与亚马逊等科技巨头已相继推出与英伟达旗舰产品相抗衡的专用芯片。
随着自动化编程技术在科技领域的迅猛发展,市场对新型芯片的需求日益增长,这些芯片需要更出色地处理复杂的AI计算任务。
据悉,OpenAI已确认将成为这款新型处理器的首批重要客户,这对英伟达而言标志着重要的商业突破。
作为英伟达的核心客户之一,OpenAI在过去数月持续寻求比现有芯片更高效的替代方案,并于上月与芯片初创企业Cerebras达成战略合作,以拓展其技术选项。
英伟达GPU面临的挑战
英伟达长期主导着图形处理器市场。行业分析师估计,该公司控制着超过90%的GPU市场份额。
GPU是一种能够同步处理数十亿简单计算任务的专用处理器。
英伟达的Hopper、Blackwell和Rubin系列GPU被业界视为训练超大规模AI模型的标杆产品,其市场定价也始终保持高位。
然而自AI浪潮兴起以来,英伟达首次面临旗舰产品的局限性。随着市场需求从模型训练转向实际推理应用,部分客户开始向英伟达施压,要求推出能更高效驱动AI应用的芯片解决方案。
过去一年间,随着企业广泛部署AI代理及其他智能工具,先进算力的需求重点已从训练转向推理。AI代理是指能够相对自主地代表用户执行任务的智能系统。
许多开发运营AI代理的企业发现,GPU存在成本过高、能耗过大等问题,且在模型实际运行方面并非最优选择。随着"代理型AI"的快速崛起,英伟达正面临开发低成本、高效率推理芯片的行业压力。
上月,OpenAI与Cerebras签署了价值数十亿美元的计算合作协议。Cerebras专注于推理芯片研发,其官方数据显示该芯片性能超越英伟达GPU。
对英伟达而言,谷歌自主研发的张量处理单元同样是重要竞争者。事实上,谷歌正在积极推进以TPU替代GPU的技术规划。
为巩固技术护城河,英伟达于去年底同意支付200亿美元,以获得Groq的关键技术授权,并聘请其核心团队,包括创始人乔纳森·罗斯。这笔交易成为硅谷史上规模最大的人才并购案例之一。
Groq设计的芯片采用与英伟达不同的架构,被称为"语言处理单元",在推理功能方面表现出卓越效能。不过,英伟达尚未公开说明将如何具体应用Groq的技术成果。

