首页 游戏 软件 资讯 排行榜 专题
首页
AI
AMD首训AI大模型ZAYA1,挑战英伟达的全新硬件方案

AMD首训AI大模型ZAYA1,挑战英伟达的全新硬件方案

热心网友
82
转载
2025-11-26

11月25日消息,AMD公司在昨日(11月24日)发布公告,宣布与IBM及AI初创公司Zyphra携手合作,历时一年多的研发实践,成功利用AMD硬件平台训练出首个大型混合专家(MoE)基础模型ZAYA1。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

根据相关博文介绍,该模型是首个完全基于AMD硬件生态系统构建的大型混合专家(MoE)模型,其完整训练流程均在IBM云平台完成,全程采用AMD Instinct MI300X GPU、Pensando网络技术及ROCm软件平台。目前详细技术报告已在arXiv预印本平台发布。

挑战英伟达:首个纯AMD硬件训练的AI大模型ZAYA1登场

为高效训练ZAYA1模型,三方共同构建了大规模、高可靠性的专用训练集群。该集群包含128个计算节点,每个节点配置8块AMD MI300X GPU,总计1024块GPU,通过AMD Infinity Fabric高速互联技术实现节点间高效通信。

挑战英伟达:首个纯AMD硬件训练的AI大模型ZAYA1登场

该集群在实际训练中展现出卓越性能,峰值运算能力突破750 PFLOPs(每秒75亿亿次浮点运算)。为确保训练过程的稳定高效,Zyphra还专门开发了一套针对AMD平台深度优化的训练框架。

ZAYA1基础模型在预训练阶段使用了高达14万亿tokens的高质量数据,并采用了渐进式课程学习策略:从初期的非结构化网络数据,逐步过渡到结构更清晰、信息密度更高的数学、代码与推理数据。

挑战英伟达:首个纯AMD硬件训练的AI大模型ZAYA1登场

基准测试结果显示,ZAYA1的综合性能与业界领先的Qwen3系列模型表现相当,同时优于SmolLM3、Phi4等主流开源模型。特别是在未经特定指令微调的情况下,其推理版本在数学和STEM等复杂推理任务上的表现已接近Qwen3的专业版本。

挑战英伟达:首个纯AMD硬件训练的AI大模型ZAYA1登场

挑战英伟达:首个纯AMD硬件训练的AI大模型ZAYA1登场

ZAYA1的优异性能还得益于其模型架构中的两项关键创新。首先,它采用了新颖的CCA注意力机制(压缩卷积注意力),通过在注意力模块内部引入卷积操作,显著降低了计算复杂度和显存占用。

其次,该模型改进了混合专家模型(MoE)中常用的线性路由机制,设计了全新的路由结构,提升了模型的表达能力和专家模块的专业化程度。这些创新共同解决了Transformer架构中的计算与内存瓶颈问题。

Zyphra表示,ZAYA1的成功发布只是第一步。目前公开的版本仅为基础模型预览,未来团队将发布经过完整后训练(post-trained)的模型版本,并提供更详尽的性能评测与训练经验分享。

挑战英伟达:首个纯AMD硬件训练的AI大模型ZAYA1登场

来源:https://www.ithome.com/0/900/073.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

AMD加码中国布局:深圳生态创新中心成立 推动产业生态协同发展
科技数码
AMD加码中国布局:深圳生态创新中心成立 推动产业生态协同发展

2026年4月16日,AMD渠道与新兴伙伴生态大会在成都召开 本次大会期间,AMD正式宣布了一项关键举措:位于深圳的生态创新中心已成功揭幕并投入运营。这一全新机构并非孤立存在,它将与AMD在大中华区已有的研发中心网络紧密联动,形成强大的“组合拳”效应。其核心目标在于持续深化AMD在本土的技术支持与生

热心网友
04.16
AMD 披露 Zen 6 架构细节,强化硬件级 QoS 管控
科技数码
AMD 披露 Zen 6 架构细节,强化硬件级 QoS 管控

AMD Zen 6 架构前瞻:硬件级资源管控的“精装修”时代 4月3日,AMD发布了一份关键技术文档,首次详细披露了下一代Zen 6架构将引入的PQOS扩展功能。本次更新聚焦于三项核心能力:全局带宽强制(GLBE)、全局慢速带宽强制(GLSBE)以及特权级零关联(PLZA)。 (注:PQOS全称为P

热心网友
04.16
联想 ThinkPad X13 Gen 7 笔记本发布:锐龙 AI Pro 400 / 酷睿 Ultra 300 系列处理器,936g 重
科技数码
联想 ThinkPad X13 Gen 7 笔记本发布:锐龙 AI Pro 400 / 酷睿 Ultra 300 系列处理器,936g 重

联想 ThinkPad X13 Gen 7 笔记本发布:锐龙 AI Pro 400 酷睿 Ultra 300 系列处理器,936g 重 4月8日,联想在日本市场正式推出了ThinkPad X13 Gen 7笔记本。这款新品最大的看点,在于它提供了英特尔全新“Panther Lake”或AMD“G

热心网友
04.16
最轻ThinkPad来了!ThinkPad X13 Gen 7发布
科技数码
最轻ThinkPad来了!ThinkPad X13 Gen 7发布

联想ThinkPad X13 Gen 7日本发布:936克极致轻量化,双平台配置更新 近日,联想在日本市场正式推出了ThinkPad X13系列的最新迭代产品——ThinkPad X13 Gen 7。这款笔记本提供了英特尔全新“Panther Lake”与AMD“Goron Point”两大平台选项

热心网友
04.15
AMD股价暴跌17%创近9年之最,苏姿丰紧急回应:AI增速远超想象
业界动态
AMD股价暴跌17%创近9年之最,苏姿丰紧急回应:AI增速远超想象

AMD苏姿丰为业绩预期辩护:AI需求远超想象,下半年将迎“拐点” 2月5日,AMD首席执行官苏姿丰(Lisa Su)的一番表态,给略显低迷的市场注入了一剂强心针。在接受美国CNBC采访时,她对公司此前被指“表现平平”的业绩预期进行了有力辩护。要知道,就在前一天,由于市场对前景指引的担忧,AMD股价单

热心网友
04.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

析稿 提供高质量AI写作服务,助力学生高效完成各类学术论文,降低查重率
AI
析稿 提供高质量AI写作服务,助力学生高效完成各类学术论文,降低查重率

析稿产品介绍 在学术写作这个领域,效率和质量常常难以兼得。今天要聊的这款工具——析稿,正是试图破解这一难题的智能方案。 析稿网站介绍 简单来说,析稿是一个聚焦于学术写作与作业辅导的AI驱动平台。它的核心目标很明确:帮助用户,尤其是学生和研究者,在保证原创性的前提下,大幅提升写作效率,同时把查重率稳稳

热心网友
04.18
ARCRaiders收割机事件是什么-ARCRaiders收割机事件介绍
游戏攻略
ARCRaiders收割机事件是什么-ARCRaiders收割机事件介绍

在Arc Raiders中,收割机事件是一场不容错过的硬核挑战 首先需要明确的是:收割机事件并非随时都能遭遇的常规战斗,它更像是一场精心设计的“精英遭遇战”,拥有独特的触发机制与前置条件。通常,当游戏进程推进到特定阶段,在部分高危区域你可能会察觉到异常征兆——或许是远处传来的低沉机械轰鸣,或者是地面

热心网友
04.18
GPTOCR
AI
GPTOCR

GPTOCR是什么 说到从PDF或图片里“捞”数据,很多人可能都经历过格式混乱、需要反复调整的麻烦。现在,有一款工具试图用更聪明的方式解决这个问题,它就是GPTOCR。简单来说,这是一个利用生成式AI模型力量的工具,专门负责把PDF和图像文件里的文字内容,不仅提取出来,还能自动整理成格式完好的JSO

热心网友
04.18
消防安全标语大全精选
职业与学业
消防安全标语大全精选

消防安全标语大全:让安全警句,成为生命的护身符 标语,不仅是墙上的装饰,更是无声的警示与关怀。一句精炼有力的消防安全口号,能在关键时刻传递核心价值,潜移默化地塑造安全行为习惯。在消防领域,一条好标语就是一次及时的提醒、一份深切的关怀,甚至是一道守护生命的坚实屏障。本文系统梳理了涵盖校园、家庭、公共场

热心网友
04.18
《王者荣耀世界》寻路攻略
游戏攻略
《王者荣耀世界》寻路攻略

《王者荣耀世界》寻路攻略 在《王者荣耀世界》中执行任务时,无论是主线还是支线,游戏系统都会清晰地标注出目标坐标。玩家只需打开大地图,即可直接查看任务点的具体位置。一个高效的技巧是:先在地图上锁定目标,并快速记住其大致方位。然而,仅凭方向感在实际跑图中往往不够,玩家很容易在复杂地形中偏离预定路线。 此

热心网友
04.18