6月25日,一条消息在科技圈炸开了锅——OpenAI正式端出了他们的首款自研AI芯片,名字还挺接地气:Jalapeño(墨西哥辣椒)。
这可不是又一款从通用GPU“魔改”出来的微调方案。它是实打实面向大语言模型推理场景的智能处理器,由OpenAI和博通联手打造。更值得注意的是,从架构设计到流片量产,仅仅用了9个月。在定制ASIC半导体这个领域,这几乎可以说创下了最快的开发周期纪录。

我们从官方披露的信息中可以确定一点:Jalapeño不是基于现有GPU改个名贴上牌就算完事。OpenAI是实打实地结合自身ChatGPT、Codex、API以及未来Agent产品的真实运行负载,从零开始定制架构。它是一颗推理专用芯片,目标非常纯粹。
为什么能这么快?据OpenAI硬件负责人的说法,核心驱动因素有两个。一是OpenAI的工程师和博通团队深度捆绑,做的不是传统的硬件外包,而是软硬件协同开发,从底层就开始对上口径。二是,他们直接把自己研发的模型调过来参与芯片设计和优化环节——用AI来加速AI硬件的诞生,这个闭环本身就很有意思。
谈性能之前,先看一句表态:早期测试显示,Jalapeño的每瓦性能“大幅优于当前业界最先进水平”。这其实是更值得细说的部分。现在的AI芯片竞争,某种程度上早已不是拼绝对算力,而是拼效率。OpenAI在这个芯片的架构上,把重心放在了减少数据传输开销上,算力、内存与网络资源之间的调配更均衡。翻译成白话就是:让每一分电都尽可能用在刀刃上,让实际跑起来的效率无限逼近理论峰值。
目前,工程样片已经在实验室里以量产目标的频率和功耗跑着真实机器学习负载。据称跑的是GPT-5.3-Codex-Spark模型——对,你没看错,OpenAI的模型迭代线越来越长了。不过,具体的性能参数依然没有公开,估计还得等一段时间才能见真章。
再来看商业化节奏。根据规划,这颗芯片将于2026年底正式投入商用,届时会联合微软等合作伙伴搭建吉瓦级规模的数据中心。博通CEO陈福阳(Hock Tan)也出来透了底:双方已经敲定了跨多代产品的路线图,下一代芯片预计2028年推出,此后每年迭代一次。看得出来,这不是一次试水,而是一场长线布局。
最后聊聊战略意图。OpenAI总裁格雷格·布罗克曼对这个自研芯片的定位说得挺清楚:它是公司算力增长飞轮的核心支点。逻辑链条其实并不复杂——自研底层硬件带来更高算力效率,这支撑着更强模型的迭代;模型能力提升又直接优化了C端产品体验,吸引更多开发者和企业客户上船;营收再反哺下一代芯片研发——这就形成了一个可持续的正向循环。长期来看,他们的目标是通过完整全栈布局,把AI的使用门槛压下来,让更多普通学生、中小企业、科研人员都能低成本、稳定地调用先进大模型的能力。方向是对的,接下来就看落地了。
