据芯东西12月16日消息,今日凌晨,美国金融数据分析机构Unusual Whales通过社交平台X发文透露,苹果公司正在研发其首款代号为“Baltra”的AI服务器芯片。据悉,该项目正与网络巨头博通(Broadcom)展开合作,共同开发关键的网络互连技术,以摆脱对英伟达(NVIDIA)芯片的依赖。

该账号在发文中特别强调,苹果“宁愿重新设计自己的芯片架构,也不愿为英伟达的高额利润单买单”。外媒WccfTech分析认为,苹果研发Baltra芯片正是为了满足其日益增长的AI推理需求,该芯片预计将于2027年正式亮相。
根据WccfTech的报道,苹果向来偏好垂直整合,倾向于将核心技术节点掌握在自己手中,其庞大的定制芯片设计项目或许是这一理念的最佳例证。
今年年初,已有多家媒体披露苹果正与博通合作开发Baltra芯片。这款新芯片将采用台积电的3nm制程工艺,并计划于2026年进入量产阶段。WccfTech的最新消息则指出,这类定制化AI芯片的实际部署时间预计在2027年。而苹果早在今年10月就已经开始出货其在美国本土制造的服务器芯片样品。
问题的核心在于:苹果将如何应用其定制化的AI芯片?这将决定Baltra芯片的整体设计与架构走向。
据报道,苹果预计不会自行训练大规模AI基础模型,而是选择与谷歌达成协议,使用其定制的Gemini模型来驱动苹果的各项智能服务。上月初,知名科技记者马克·古尔曼(Mark Gurman)也曾报道,苹果已经放弃打造内部大模型的计划,改为每年支付约10亿美元,以使用谷歌定制的1.2万亿参数Gemini大模型。
基于这一合作背景,WccfTech推测,苹果主要会利用Baltra芯片来满足其庞大的AI推理运算需求。
推理芯片的架构与用于训练模型的芯片架构有所不同。推理芯片更注重优化时延与吞吐量,并普遍采用基于低精度运算的架构设计,例如INT8精度。因此,这也可能是苹果和博通在推进Baltra整体设计流程时,会重点关注的优化方向。
科技博主Max Weinbach在X平台发文分析称,他认为苹果大概率不会打造大规模的计算集群,反而可能会推出类似(英伟达)GB200架构的产品,采用多颗芯片互连的方案,并搭配更大容量的高带宽LPDDR内存。这种方案的成本相对于市面上多数同类芯片应有优势,同时又能精准匹配其实际业务需求。

值得注意的是,苹果于去年3月提交了一项名为“基于光学的分布式统一内存系统”的专利,这可能暗示了苹果未来的技术发展方向。
该专利公开了若干与硅光子计算系统相关的技术方案。在一些实施例中,该计算系统包含多个计算芯片封装单元,其内置处理器可执行程序指令,对存储于分布式内存中的数据进行运算。该分布式内存可通过统一内存架构实现访问。该系统还配备了多个内存芯片封装单元,以搭建统一内存架构。具体而言,任一内存芯片封装单元均集成了一组光接口与内存控制器。前者负责接收处理器发出的内存访问请求,后者则根据接收到的请求,完成对分布式内存对应分区的读写操作。


苹果专利相关图片
专利地址: https://patents.google.com/patent/US20250094093A1
结语:苹果或借Baltra重塑AI竞争力
通过自主研发AI服务器芯片,苹果可以基于此深度优化其AI算法,以提升运算性能和能效。
此前,苹果在大模型领域数次受挫,被曝放弃了大规模模型训练的相关布局,这使其在AI赛道的竞争中处于劣势。此次被传计划于2027年落地部署的Baltra芯片,或将对苹果提升其产品AI性能,增强其在AI领域的核心竞争力具有重要意义。
