游乐游手机版
首页/科技数码/文章详情

AWS发布Trainium3 AI芯片:性能飙升,成本大降,加速下一代模型训练

时间:2025-12-03 19:49
在近日举办的全球云计算领域年度盛会中,亚马逊云计算服务(AWS)正式推出新一代自研AI训练芯片Trainium3,并同步发布基于该芯片的Trainium3 UltraServer服务器。这款硬件组合

在近期举办的全球云计算年度峰会上,亚马逊云科技(AWS)正式推出新一代自研AI训练芯片Trainium3,并同步发布了基于该芯片的Trainium3 UltraServer服务器。这款创新硬件组合通过架构革新与制程升级,为生成式AI模型的训练与推理提供了全新解决方案,标志着AWS在垂直整合计算资源领域迈出关键一步。

根据技术规格披露,Trainium3芯片采用台积电3纳米制程工艺,单芯片集成144GB HBM3E内存,内存带宽高达4.9TB/s,在FP8精度下可提供2.52 PFLOPS的算力性能。其计算效率较前代产品实现四倍提升,能效比与内存带宽同步获得近四倍优化。通过新一代Neuron网络架构,芯片间通信延迟被压缩至10微秒以内,配合NeuronSwitch-v1技术实现的双倍内部带宽,有效解决了分布式训练中的通信瓶颈问题。

UltraServer服务器将硬件集成度推向新高度。单台设备最多可容纳144颗Trainium3芯片,形成20.7TB HBM3E内存池与706TB/s总带宽的超强计算单元,FP8算力峰值达362 PFLOPS。实测数据显示,该系统运行GPT-OSS开源模型时,单芯片吞吐量提升300%,推理响应速度加快4倍,显著降低企业应对流量峰值的硬件投入成本。目前Amazon Bedrock服务已率先在生产环境部署该硬件平台。

在应用场景方面,这套硬件组合展现出显著优势。对于千亿参数级模型训练,其可将训练周期从数月压缩至数周;面对智能对话、视频生成等高并发推理需求,能以微秒级延迟服务百万级用户。多家合作伙伴已验证其成本效益:Decart公司借助Trainium架构将实时视频生成速度提升4倍,同时将单位推理成本削减50%;生物科技企业Metagenomi则通过硬件优化将基因序列分析效率提升3.5倍。

为满足超大规模计算需求,AWS同步推出EC2 UltraCluster 3.0架构。该集群通过高速互联技术可连接数千台UltraServer,形成百万级芯片计算矩阵,较上一代规模扩大十倍。这种扩展能力使得在万亿token数据集上训练多模态模型成为可能,同时可为千万级用户提供实时推理服务,为自动驾驶、气候模拟等前沿领域提供基础设施支撑。

市场布局方面,AWS正面临双重挑战。一方面需应对谷歌TPU在AI芯片市场的持续渗透,特别是Anthropic等战略客户近期宣布将采购百万级谷歌芯片;另一方面要巩固与现有合作伙伴的关系——这家生成式AI公司仍计划年底前部署超百万颗Trainium2芯片,其中近半数将运行于Project Rainier超级计算机。为保持竞争力,AWS同步披露下一代Trainium4研发进展,新芯片在FP4精度下性能将提升六倍,FP8性能提升三倍,并首次引入NVIDIA NVLink Fusion技术实现异构计算协同。

这项技术整合计划引发行业关注。通过将Trainium4与Graviton处理器、EFA网络适配器部署在统一MGX机架,AWS旨在构建兼具成本优势与性能弹性的AI基础设施。这种模块化设计既支持纯CPU计算场景,也可灵活扩展GPU与Trainium混合架构,为不同规模的AI工作负载提供定制化解决方案。随着软硬件协同优化的持续推进,AI训练与推理的成本门槛有望进一步降低。

来源:https://www.itbear.com.cn/html/2025-12/1038348.html
上一篇华为Pocket 2直降千元!4499元入手旗舰小折叠 下一篇无人机遥控器挑选指南:南京帝差科技高性价比推荐
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
雷电共享功能让两台电脑秒变一体
科技数码 · 2026-05-30

雷电共享功能让两台电脑秒变一体

英特尔推出ThunderboltShare技术,使两台搭载雷电4 5接口的Windows11电脑可通过图形界面共享文件、外设及进行数据迁移,操作简便。需设备通过认证,目前支持多款笔记本、主板及扩展卡,仅需一台通过认证即可,支持直连或通过扩展坞等连接。

戴尔XPS 13超薄笔记本仅12.7mm约1kg轻巧便携
科技数码 · 2026-05-30

戴尔XPS 13超薄笔记本仅12.7mm约1kg轻巧便携

戴尔于2026年台北国际电脑展前夕发布全新XPS13笔记本,机身极致轻薄,厚度仅12 7毫米,重量约997 9克。搭载酷睿5320或酷睿Ultra7355处理器,最高可选32GB内存与1TB固态硬盘。配备13 4英寸2560×1600分辨率屏幕,覆盖100%DCI-P3色域,支持Wi-Fi7无线网络,内置52瓦时电池,官方标称续航可达17小时。

长安汽车董事长朱华荣:未来五年智能汽车投资超千亿
科技数码 · 2026-05-30

长安汽车董事长朱华荣:未来五年智能汽车投资超千亿

在2026世界智能产业博览会上,长安汽车董事长朱华荣明确指出了智能汽车的未来发展方向—— "新能源汽车开启了汽车新时代,数字汽车才是真正的未来。 "这一论断直接划定了行业未来十年的发展主线。 朱华荣进一步将未来汽车定义为 "可进化的智能汽车机器人 "。这一概念颇具深意:汽车不再仅仅是代步工具,而是深度融入生

先马COMPUTEX 2026台北展发布机电散热新品
科技数码 · 2026-05-30

先马COMPUTEX 2026台北展发布机电散热新品

先马将在COMPUTEX2026展出机箱V80(双曲面玻璃、60WPD快充)、V70(电源前置),水冷Q80(模块化屏幕)、Q40(电动旋转环),以及六款全模组电源(ATX3 1,最高80PLUSTitanium认证)。此外,V80机箱提供高速充电功能,V70创新布局,Q80屏幕可自定义,Q40旋转环自动调节,电源全系列高能效。

美国政客甩锅AI中心遭抵制称中国捣鬼
科技数码 · 2026-05-30

美国政客甩锅AI中心遭抵制称中国捣鬼

美国推动AI数据中心建设遭遇民众抗议,部分政商人士无证据指责中国资助抗议者。抗议团体和美国媒体均否认外国影响,强调反对源于环境和决策程序问题,与中方无关。