埃隆·马斯克在一次访谈中向投资人罗恩·巴伦透露,他正在研发一款全新的特斯拉自研芯片。这款芯片的算力目标是英伟达同类产品的2到3倍,而成本仅需后者的十分之一。马斯克的原话相当直白:“这套芯片的物理设计方案我早已烂熟于心,整个架构在我脑海里清晰可见。”
当台积电告知他新建一座芯片工厂需要五年时间时,马斯克的回应十分干脆:五年太长了。他的规划周期通常以一到两年为单位,超过三年就等同于遥遥无期。因此,他决定自建芯片产线,以加速特斯拉AI芯片的量产进程。
马斯克还提到了特斯拉自动驾驶系统的数据:目前累计行驶里程已突破100亿英里,安全性表现是人类驾驶员的四倍;而搭载新款芯片后,安全水平将再提升至人类的十倍。
这番话听起来似乎难以置信?有分析师在社交媒体上进行了详细拆解,发现其逻辑并不复杂。

要理解一款性能达到英伟达芯片2到3倍、成本仅为其十分之一的产品是否靠谱,首先需要搞清楚英伟达实际销售的是什么。
英伟达的GPU芯片需要兼容所有客户、各类模型架构以及不同的开发框架,同时还要维持长达15年的CUDA生态兼容。这种通用设计必然导致硬件资源上的大量冗余:为了兼容老旧功能需要预留晶圆面积,为极少用到的数据传输搭建互联通道,还得按无法预判的算力需求配置内存带宽。
反观特斯拉的AI5芯片,目标极为纯粹——仅为自家神经网络运行服务。工程师对芯片各模块之间的数据流转路径了如指掌,因此直接砍掉了所有闲置的传输通路。凡是与特斯拉自有模型无关的功能,如老旧GPU兼容模块、图像信号处理器等,全部剔除。最终只用了一半的晶圆面积,就完成了同等核心任务。
再算一笔利润账。英伟达的毛利率大约73%,消费者实际支付的钱中,真正落在芯片硬件上的只有四分之一。而特斯拉自产芯片,自身就是唯一使用方,完全按硬件成本定价。单凭垂直整合,就足以抹平九成左右的成本差距——这还没算上技术优化带来的额外优势。
其实这套思路并不新鲜。谷歌早在2015年就用TPU芯片实践过了,随后亚马逊推出Inferentia,微软打造Maia芯片,都沿用了相同的逻辑。比特币矿机领域更是最早的验证者:一旦算力任务定型,专用集成电路(ASIC)仅用了不到两年时间,就彻底取代了通用GPU挖矿。
行业里存在一条通用规律:当算力应用仍在快速迭代时,通用芯片占据主导;一旦应用场景趋于稳定,专用芯片便能在各项核心指标上实现全面反超。
这款芯片的局限性,反过来也印证了马斯克说法的可信度。AI5并不支持前沿大模型训练,其他企业若想使用它,还需要投入数年时间进行软件开发。它的定位非常纯粹:为海量汽车与机器人场景,以最低的单位功耗成本,运行特斯拉的AI推理任务。
英伟达凭借通用适配能力收取溢价,而特斯拉早已不再需要这类附加功能。这才是关键所在。
