在2025年AWS re:Invent全球大会上,亚马逊云科技正式推出了新一代人工智能训练芯片Trainium3。这款芯片在多个维度实现显著性能突破,为AI模型训练开辟了全新可能性。
根据AWS披露的技术细节,Trainium3采用先进的3纳米制程工艺,其计算性能相比第二代产品提升高达4倍,内存容量同样实现4倍增长,能效比则优化了40%。这一系列升级使Trainium3能够更好地支撑高负载推理与AI训练需求。
同步发布的Trainium3 UltraServer系统支持超大规模集群构建,最多可连接100万颗Trainium3芯片,达到上一代系统扩展能力的10倍。每台UltraServer最多可容纳144颗芯片,极大提升了数据处理能力。亚马逊表示,该系统将帮助客户在使用AI云服务时显著降低推理成本,进一步推动AI技术应用普及。
AWS还透露了Trainium4的开发计划,新一代芯片将支持与英伟达GPU的协同工作。通过兼容英伟达NVLink Fusion高速互连技术,Trainium4不仅能扩展整体性能,还可结合亚马逊自研的低成本服务器架构。这一举措有望降低现有英伟达GPU优化的AI应用向亚马逊云平台迁移的技术门槛。
重点突破:
