第五代英特尔至强处理器AI特化通用服务器CPU
先说几个核心判断:AI已经成了数据中心和服务器市场的绝对主角,就连通用服务器CPU,现在也开始拼命往AI计算能力上靠。去年年底,英特尔发布了第五代至强处理器,通用计算性能在提升,更重要的是,加入了针对AI的新指令集——比如AMX、A VX这些。
第五代至强可扩展处理器架构剖析
第五代至强是2023年底发布的,和第四代一样,都基于Intel 7制程,也用了Dual-poly-pitch SuperFin晶体管技术。但英特尔还是在关键指标上做了优化——比如系统漏电流控制和动态电容。这些改进带来的效果是:同等功耗下,频率能提升3%。其中,漏电流控制贡献了2.5%,动态电容下降贡献了0.5%。

芯片封装这块,英特尔也做了一些有意思的调整。第四代至强是把芯片切成四个相对对称的部分,而第五代至强改成了切两份。为什么这么改?过去每两片芯片之间通信,需要额外的互连接口,既占芯片面积,还增加功耗。现在芯片质量控制做得更好了,英特尔能在相对较大的面积下依然保持很好的良率,所以从四片改成两片,芯片面积控制得更好了,功耗也更友好。
处理核心升级到了Raptor Cove,核心数从最多的60核增加到64核。I/O速度上,DDR从4800MT/s提升到5600MT/s,UPI从16GT/s提升到20GT/s。但最大的升级之一,其实是LLC缓存——单个模块的容量从1.875MB直接增加到5MB。这意味着什么?如果处理的数据集规模比较小,完全可以把主要数据塞进LLC缓存里,大量减少内存访问,性能自然就上去了。这些架构上的改进,直接体现在生成式AI和LLM等应用上的性能提升。
通用服务器上跑AI
除了传统的CPU计算核心,英特尔还加了AMX翻跟斗,专门用来处理矩阵运算。测试数据显示,AI推理性能比上一代提升了最多42%。对于那些非大模型类的AI应用——比如推荐系统、语音识别、图像识别,英特尔一直主张在CPU上跑,配合OpenVINO生态做优化。
有意思的是,在推荐系统这类场景下,尤其是当模型大到GPU也处理不了的时候,CPU反而更快。因为GPU不够用时,往往需要跨GPU计算,或者频繁和CPU交互,这时候CPU的效率反而更高。
对于通用的AI工作负载,英特尔用的是AMX和A VX-512两个指令集,基于OpenVINO做优化。推理的时候,指令集可以切分,用翻跟斗定向加速某一部分,这甚至能替代传统的基于GPU的AI模型。
还有一个重要考量是成本。在模型调优、推理、应用这些环节,用通用服务器性价比非常高。尤其是当企业并不需要24小时跑大模型,大模型只是业务的辅助工具时——比如聊天机器人、内容生成、提纲分析——没必要重新部署一套GPU平台。新平台意味着要重新考虑开发、运维,成本可能蹭蹭往上涨,对很多企业来说,这可能是个不小的负担。
从合作伙伴的案例来看,百度云已经有基于第五代至强的服务器,提供在CPU上运行的大模型服务;京东的应用中,第五代至强相比前一代,在Llama2 13B模型上看到了50%的性能提升。所以说,第五代至强在AI应用上的性能提升确实比较明显。
编解码也是一个值得关注的点。目前不少主流客户为了追求更好的图像质量,反而选择用CPU做编解码。GPU有硬件加速,速度快,但视频编解码质量往往略逊于CPU。第五代至强处理器在AMX-INT8的加持下,吞吐从原来的1.5FPS增强到了33FPS,基本能满足实时编码的需求。
下一代至强路线图
从路线图来看,2024年英特尔还会发布新一代至强可扩展处理器,产品组合非常丰富,兼顾性能和能耗。基于现在的第五代至强,英特尔会推出下一代的性能核——高主频、高性能的CPU核架构,主要针对主流和复杂的数据中心应用做性能优化。尤其是很多跑在虚拟机上的程序,或者之前写的大程序,只有在性能核上才能看到明显的性能提升。

同时,针对新兴的云原生设计,英特尔还提供基于能效核打造的至强处理器。每瓦性能可以做到相对极致,而且因为核心设计比较精简,可以在每颗CPU和服务器里塞进更多高密度的核心,从而支撑面向云的高密度、超高能效运算。值得一提的是,在近期产品淘汰换新的要求中,能效比已经成了一个重要考量因素——这也正好符合国家对设备淘汰换新的方向。
相关攻略
极客网 · 人工智能 北京时间6月23日凌晨1点,备受瞩目的WWDC全球开发者大会如期拉开帷幕。这是苹果首次采用线上形式举办WWDC,同时也是有史以来规模最大的一届。大会亮点纷呈,iOS、iPadOS、macOS和watchOS四大操作系统均迎来重要更新。 相较于这些系统更新,本届WWDC最受瞩目的
英特尔联合合作伙伴推出5G毫米波专网工业解决方案,并在成都工厂成功应用。该方案通过专频专网部署,将AMR系统端到端时延从100毫秒降至20毫秒,显著提升运行效率与稳定性,同时保障数据在园区内闭环处理,满足工业场景对安全与性能的严苛要求。
今年三月,英特尔正式发布了基于第二代性能核架构的“Bartlett Lake 12P”处理器。首批推出的酷睿2x3PE系列主要面向嵌入式垂直市场,标志着该架构的首次商业化应用。 近期,这一产品线迎来了重要扩展。根据英特尔官方数据库在2026年第二季度更新的信息,公司已将“Bartlett Lake
英特尔将于2026年5月27日发布首款掌机专用处理器ArcG3系列,次日上市。该系列旨在平衡掌机有限空间下的性能与功耗,满足市场对专用芯片的需求。宏碁掠夺者Atlas8将率先搭载。随着COMPUTEX2026临近,华硕等厂商预计展示新品,而英特尔下一代架构也已曝光。掌机芯片正从通用APU转向高度定制化,重塑行业竞争格局。
戴尔在2026全球峰会上发布了下一代服务器产品线,将搭载AMDEPYC "Venice "和英特尔Xeon "DiamondRapids "处理器。英特尔处理器最高配备256核,支持12800MT s内存。AMD平台包括多款风冷及水冷服务器,预计2026至2027年陆续上市;英特尔平台已披露一款单槽2U服务器,计划2027年推出。
热门专题
热门推荐
《Paralives》开发商承诺所有后续更新永久免费,拒绝付费DLC模式。15人小团队依靠首发销售额即可支撑多年运营,无需依赖额外内容包维持开发,展现了与《模拟人生》系列不同的差异化竞争思路。
2025年5月28日,比亚迪王朝网全新力作——宋Ultra DM-i正式推向市场,共推出5款配置车型,官方售价区间为12 99万至15 99万元。此次定价策略极具突破性:一款拥有310公里纯电续航能力的中型插电混动SUV,直接下探至13万元级别市场。作为王朝网络的新旗舰,该车明确瞄准高频出行需求场景
先来关注一个有趣的细节:苹果首款折叠屏手机,传闻将于今年秋季正式亮相。产品命名可能为iPhone Ultra,也有媒体称之为iPhone Fold——无论最终叫什么,这都将标志着苹果在折叠形态领域首次“出手”。 近日,配件厂商iFunSmart已率先上架iPhone Ultra的首批保护壳——这绝非
山寨币ETF迎来批量上市潮,首批项目市场表现如何?一文分析 Binance币安 欧易OKX ️ Huobi火币️ 最近,市场出现了一个不容忽视的新动向:XRP、DOGE、LTC、HBAR等现货ETF已经悄然登陆美国市场。与此同时,A VAX、LINK等资产的同类产品也正在审批流程中。进入11月以来,
近日,公司对SteamDeck1TBOLED版涨价300美元至949美元,上架短短不到24小时便再度售罄。据外界分析,该公司从中国大量补货并分批投放库存,高溢价未影响众多玩家的抢购热情与速度,其人气极其旺盛无比足以支撑快速清空。





