首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
AWS re:Invent 2025前瞻:Trainium3与UltraServers揭幕,AI算力成本再突破

AWS re:Invent 2025前瞻:Trainium3与UltraServers揭幕,AI算力成本再突破

热心网友
44
转载
2025-12-03

在拉斯维加斯举办的年度技术盛会上,亚马逊云计算部门(AWS)正式推出了新一代自研AI芯片Trainium3,并同步展示了为下一代AI工作负载设计的Trainium3 UltraServers。与此同时,AWS还公布了Trainium4的开发路线图,引发行业高度关注。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

为满足自身需求并降低运营成本,亚马逊、谷歌等云服务巨头早在数年前便开始布局自研云端AI芯片。据AWS披露,其定制芯片业务规模已达数十亿美元,Trainium系列芯片全球部署量突破100万张,成为支撑超大规模AI计算的核心基础设施之一,仅次于谷歌TPU的市场表现。这一数据印证了自研芯片在云服务领域的战略价值。

Trainium3基于台积电3nm制程工艺打造,单芯片可提供2.52 PFLOPs(FP8)算力,支持FP32、BF16、MXFP8及新增MXFP4等多种精度格式。内存配置方面,该芯片将HBM3e容量提升至144GB,带宽达4.9TB/s,并通过强化结构化稀疏性及微缩放硬件支持,显著优化了大语言模型的训练与推理效率。AWS宣称,Trainium3可将AI模型全生命周期成本降低50%,为客户提供更具性价比的算力服务。

基于全新Neuron Fabric互联技术,AWS同步推出的Trainium3 UltraServers实现了算力跃升。该系统最多可整合144颗Trainium3芯片,总算力达362 FP8 PFLOPs。实测数据显示,与上一代Trainium2 UltraServers相比,新系统的原始性能提升4.4倍,性能功耗比提升4倍,能源效率提高40%。在部署GPT-OSS等主流开源模型时,单芯片吞吐量提升3倍,响应延迟缩短4倍,大幅缩短模型训练周期——原本需数月的任务可压缩至数周,同时支持更多推理请求,降低项目上线时间与运营成本。

通过EC2 UltraClusters 3.0架构,Trainium3 UltraServers可扩展至最高100万张芯片的超级集群,规模较上一代提升10倍。目前,该架构已为Anthropic的"Project Rainier"项目提供核心算力支撑,当前部署50万张Trainium 2芯片,并计划年底前扩至100万张。这一扩展能力进一步巩固了AWS在超大规模AI计算领域的领先地位。

实际应用中,Trainium3及Trainium3 UltraServers已展现显著成效。Anthropic、Karakuri、metagenomi、NetoAI、Ricoh、Splash Music等企业反馈,采用该方案后训练成本较其他方案最多降低50%。这一成果验证了AWS自研芯片在商业化场景中的竞争力。

关于下一代产品,AWS透露Trainium4正在研发中,虽未公布具体发布时间,但承诺其性能将实现突破性提升:FP4处理性能至少提升6倍,FP8性能提升3倍,内存频宽提升4倍。更值得关注的是,Trainium4将支持NVIDIA NVLink Fusion高速互联技术,可与Graviton处理器及EFA(Elastic Fabric Adapter)在通用MGX机架中无缝协作,实现与NVIDIA GPU的互操作与性能扩展。这一技术整合或为AI计算生态带来新的变量。

来源:https://www.itbear.com.cn/html/2025-12/1038364.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

TripMate
AI
TripMate

TripMate是什么 规划一次完美的旅行,最磨人的往往是前期的信息海选和行程拼图。现在,一款名为TripMate的AI旅行助手,正试图把我们从这种繁琐中解放出来。简单来说,它是一个由人工智能驱动的个人旅行规划工具,核心目标就一个:让个性化的行程规划变得又快又省心。用户不必再在各种攻略网站间反复横跳

热心网友
04.23
Artwo
AI
Artwo

Artwo是什么 浏览器标签页多到能开火车,收藏夹杂乱得像毛线球——这大概是每个深度上网冲浪者的日常痛点。Artwo的出现,正是为了终结这种混乱。这款工具的核心,是将AI的智能与网页资源管理深度结合,帮你把散落各处的网页信息,整理成井井有条的知识库。它不仅仅是个高级书签管理器,更像是一个能理解你需求

热心网友
04.23
Best AI Jobs
AI
Best AI Jobs

Best AI Jobs是什么 当你琢磨着在人工智能领域找份新工作时,面对海量却不精准的招聘信息,是不是常常感到头疼?这时候,一个专业的垂直平台就显得尤为重要了。Best AI Jobs,正是为此而生。它是一个专注于人工智能领域的职业搜索引擎,核心使命就是帮用户在全球范围内精准定位AI相关的职位。无

热心网友
04.23
FreeAiKit
AI
FreeAiKit

FreeAIKit是什么 当你听到“AI工具套件”时,脑子里会浮现什么?复杂的代码、难懂的术语,还是昂贵的订阅费?FreeAIKit的出现,可以说彻底打破了这些刻板印象。这个由Easy With AI打造的综合平台,目标非常明确:让AI变得触手可及。它集成了图像生成、市场营销、生产力提升等一系列工具

热心网友
04.23
WPS Office
AI
WPS Office

WPS Office是什么 提到办公软件,很多人的第一反应可能是微软的Office套件。但今天,我们得好好聊聊另一个重量级选手——WPS Office。它出自中国的金山软件,是一款功能完整的免费办公解决方案。简单来说,它集成了文档编辑、表格处理、幻灯片制作以及PDF工具于一体,旨在为用户提供一个流畅

热心网友
04.23