在拉斯维加斯举行的AWS re:Invent 2025年度技术盛会上,亚马逊云科技(AWS)正式推出了新一代AI训练芯片Trainium3,并首次披露了下一代产品Trainium4的研发进展。这一系列动作彰显了AWS在自研芯片领域的持续深耕,也展现了其在全球AI算力竞争中的战略雄心。
基于3纳米制程工艺打造的Trainium3芯片,是AWS第三代AI训练专用芯片。其配套系统Trainium3 UltraServer在性能上实现了显著突破:在训练和高负载推理场景下的处理速度较前代提升超过4倍,内存容量扩展至4倍。值得注意的是,通过超高-speed互联技术,数千台UltraServer可构建起搭载最多100万颗Trainium3芯片的超大规模集群,集群规模达到上一代系统的10倍。每台UltraServer最多可集成144颗芯片,为大规模AI模型训练提供了前所未有的算力支撑。
在能效表现方面,新一代系统较前代提升了40%的能效比。这一改进在全球数据中心耗电量持续攀升的背景下显得尤为重要。AWS表示,通过优化芯片架构和系统设计,Trainium3在提供强大算力的同时,显著降低了单位算力的能耗,有助于构建更可持续的AI基础设施。
在商业应用层面,Trainium3已获得多家行业领先企业的青睐。包括Anthropic(AWS战略投资企业)、日本大语言模型公司Karakuri、音乐创作平台SplashMusic以及AI研发企业Decart在内的客户,已率先采用该系统并实现了推理成本的显著优化。这些实践案例验证了Trainium3在实际应用场景中的性能优势和经济效益。
关于下一代产品Trainium4,AWS透露其研发工作正在积极推进中,预计将带来新一轮性能飞跃。值得关注的是,Trainium4将兼容英伟达的NVLink Fusion高速芯片互联技术。这一技术突破使得Trainium4芯片可与英伟达GPU协同工作,在扩展整体性能的同时,继续发挥亚马逊自研低成本服务器机架的技术优势。通过兼容NVLink Fusion,Trainium4有望降低现有AI应用的迁移门槛,吸引更多基于英伟达GPU优化的大型AI应用转向亚马逊云平台。
当前,英伟达的CUDA平台已成为AI开发的主流标准。AWS通过支持NVLink Fusion技术,不仅增强了Trainium4的兼容性,也为其在AI市场争取更大份额提供了技术支撑。虽然AWS尚未公布Trainium4的具体发布时间表,但业界普遍预期将在2026年的re:Invent大会上获得更多详细信息。
从Trainium3到Trainium4,AWS的自研芯片战略正逐步显现成效。通过持续的技术创新和生态构建,AWS不仅强化了自身在AI算力领域的竞争力,也为全球开发者提供了更多元化的选择。随着Trainium4研发的持续推进,AWS与英伟达在AI硬件领域的竞争与合作格局或将迎来新的演变。
