游乐游手机版
首页/科技数码/文章详情

AWS re:Invent 2025前瞻:Trainium3与UltraServers揭幕,AI算力成本再突破

时间:2025-12-03 19:37
在拉斯维加斯举办的年度技术盛会上,亚马逊云计算部门(AWS)正式推出了新一代自研AI芯片Trainium3,并同步展示了为下一代AI工作负载设计的Trainium3 UltraServers。与此同

在拉斯维加斯举办的年度技术盛会上,亚马逊云计算部门(AWS)正式推出了新一代自研AI芯片Trainium3,并同步展示了为下一代AI工作负载设计的Trainium3 UltraServers。与此同时,AWS还公布了Trainium4的开发路线图,引发行业高度关注。

为满足自身需求并降低运营成本,亚马逊、谷歌等云服务巨头早在数年前便开始布局自研云端AI芯片。据AWS披露,其定制芯片业务规模已达数十亿美元,Trainium系列芯片全球部署量突破100万张,成为支撑超大规模AI计算的核心基础设施之一,仅次于谷歌TPU的市场表现。这一数据印证了自研芯片在云服务领域的战略价值。

Trainium3基于台积电3nm制程工艺打造,单芯片可提供2.52 PFLOPs(FP8)算力,支持FP32、BF16、MXFP8及新增MXFP4等多种精度格式。内存配置方面,该芯片将HBM3e容量提升至144GB,带宽达4.9TB/s,并通过强化结构化稀疏性及微缩放硬件支持,显著优化了大语言模型的训练与推理效率。AWS宣称,Trainium3可将AI模型全生命周期成本降低50%,为客户提供更具性价比的算力服务。

基于全新Neuron Fabric互联技术,AWS同步推出的Trainium3 UltraServers实现了算力跃升。该系统最多可整合144颗Trainium3芯片,总算力达362 FP8 PFLOPs。实测数据显示,与上一代Trainium2 UltraServers相比,新系统的原始性能提升4.4倍,性能功耗比提升4倍,能源效率提高40%。在部署GPT-OSS等主流开源模型时,单芯片吞吐量提升3倍,响应延迟缩短4倍,大幅缩短模型训练周期——原本需数月的任务可压缩至数周,同时支持更多推理请求,降低项目上线时间与运营成本。

通过EC2 UltraClusters 3.0架构,Trainium3 UltraServers可扩展至最高100万张芯片的超级集群,规模较上一代提升10倍。目前,该架构已为Anthropic的"Project Rainier"项目提供核心算力支撑,当前部署50万张Trainium 2芯片,并计划年底前扩至100万张。这一扩展能力进一步巩固了AWS在超大规模AI计算领域的领先地位。

实际应用中,Trainium3及Trainium3 UltraServers已展现显著成效。Anthropic、Karakuri、metagenomi、NetoAI、Ricoh、Splash Music等企业反馈,采用该方案后训练成本较其他方案最多降低50%。这一成果验证了AWS自研芯片在商业化场景中的竞争力。

关于下一代产品,AWS透露Trainium4正在研发中,虽未公布具体发布时间,但承诺其性能将实现突破性提升:FP4处理性能至少提升6倍,FP8性能提升3倍,内存频宽提升4倍。更值得关注的是,Trainium4将支持NVIDIA NVLink Fusion高速互联技术,可与Graviton处理器及EFA(Elastic Fabric Adapter)在通用MGX机架中无缝协作,实现与NVIDIA GPU的互操作与性能扩展。这一技术整合或为AI计算生态带来新的变量。

来源:https://www.itbear.com.cn/html/2025-12/1038364.html
上一篇DeepSeek新模型技术突破:以创新方法缩小与顶尖模型差距 下一篇安卓16新版亮点揭晓:谷歌推出年度双更全新功能集
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元
科技数码 · 2026-07-03

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售,支持4K165Hz与FHD520Hz双模切换,定价1888元。采用FastIPS面板,97%DCI-P3色域,配备升降支架及双HDMI2 1和双DP1 4接口。

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%
科技数码 · 2026-07-03

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年,DRAM与NAND闪存的供应持续紧张及价格不断攀升,正逐步传导至终端消费市场。可以预见,下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价,最终连苹果也不得不跟进,宣布提升iPad、Mac及家居设备的价格,以应对存储成本的快速上涨。 TrendForce分析指出,苹果全面

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波
科技数码 · 2026-07-03

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果自研C2芯片仅支持Sub-6GHz,不支持5G毫米波。因此,美版iPhone18Pro继续采用高通基带方案以支持毫米波,而其他地区版本则搭载苹果自研C2芯片。这一差异将导致在毫米波覆盖的市场中,用户峰值速率可能显著低于美版用户。

纳睿雷达推出睿宸超精细化短时临近AI气象大模型
科技数码 · 2026-07-03

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达近日释放了一项重磅成果。2026年7月1日,公司正式对外发布了两款自主研发的全新产品:一款是“WDSPT0152型”S波段全极化多功能有源相控阵雷达,另一款则是名为“睿宸”的超精细化短时临近AI气象大模型。从产品战略来看,此次发布直指气象监测与灾害预警领域的技术制高点。 先来看这款S波段雷达

南航国际创新港一期交付 四大专业园区打造空天产业强磁场
科技数码 · 2026-07-03

南航国际创新港一期交付 四大专业园区打造空天产业强磁场

近日,南京航空航天大学与六合区深度合作的标杆项目——南航国际创新港一期正式交付投用。两个地块陆续启用,成功串联起高校科研能量、地方产业载体与市场创新主体,为南京打造全国领先的航空航天产业创新中心、助力江苏布局商业航天全产业链,提供了坚实的物理支撑。 该创新港一期位于六合区雄州街道,分为3号和4号两个