首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
英特尔优化多显卡AI推理,Battlematrix性能提升达80%

英特尔优化多显卡AI推理,Battlematrix性能提升达80%

热心网友
98
转载
2025-08-14

8 月 12 日,科技媒体 WccfTech 发布消息称,英特尔为其锐炫 Pro 系列 GPU 的 Battlematrix 项目推出了首个重要软件更新——LLM Scaler v1.0,新版本在 AI 推理能力方面做出了显著优化。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

回顾今年 5 月,英特尔在 COMPUTEX 2025 台北国际电脑展上不仅发布了锐炫 Arc Pro B50 与 B60 显卡,还推出了 Project Battlematrix 推理工作站平台。该平台最高可搭载八张锐炫 Pro 显卡,并配备完整软件包,能够支持运行参数规模达 150B 的中等体量、高精度 AI 模型。

Battlematrix 平台结合了定制化硬件与专用软件栈,旨在优化推理性能与企业部署效率。其中的 LLM Scaler,是基于 vLLM 框架开发的大模型推理容器,可扩展至多 GPU、支持长序列高效推理并兼容多模态任务。

\

LLM Scaler v1.0 着重改进了 vLLM 推理框架的性能表现。针对 32B 参数模型,在 40K 序列长度下性能提升约 1.8 倍;70B 参数模型则在同一条件下实现高达 4.2 倍的性能增幅。对于 8B 至 32B 范围的模型,输出吞吐量相比上一版本提升了约 10%。

该版本还引入了分层在线量化技术,有效降低了显存占用,并支持管道并行、数据并行、多模态模型嵌入及重排序等功能,进一步提升了模型的灵活性和扩展性。

为了满足企业级运维需求,LLM Scaler v1.0 集成了 XPU Manager 工具,能够实现对 GPU 电源管理、固件升级、设备诊断及显存带宽检测等功能的全面支持。

新容器运行于 Linux 平台,充分发挥多 GPU 扩展与 PCIe 点对点传输的优势,整体性能最高提升 80%。同时,系统还支持 ECC 纠错、SRIOV 虚拟化、遥测数据收集与远程固件更新,保障了其在企业环境中部署的可靠性与可控性。

\

英特尔指出,其新软件栈兼容行业标准与主流开发流程,并通过集成 OneCCL 基准测试工具,方便开发者进行模型调优与性能评估。这将进一步增强 Battlematrix 平台在 AI 生态中的竞争力。

按照英特尔的产品路线图,本季度还将推出更稳定的容器版本,持续提升 vLLM 的服务能力。预计到四季度,Battlematrix 项目将实现全功能版本的正式落地,为专业领域用户带来更高效、更易用的大模型推理解决方案。

来源:https://www.ithome.com/0/874/747.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

性能、续航、AI全都要!第三代酷睿Ultra还是太全面了
科技数码
性能、续航、AI全都要!第三代酷睿Ultra还是太全面了

英特尔第三代酷睿Ultra处理器深度解析:18A制程与180TOPS AI算力如何重塑全能笔记本体验 AI技术正以前所未有的深度与广度驱动PC产业变革。近期,英特尔于中国市场重磅发布了第三代酷睿Ultra处理器,并携手华硕、戴尔、联想、小米、荣耀、acer、雷神等主流OEM厂商,同步推出数十款AI

热心网友
04.02
同“芯”聚力,华硕携双系列创新成果,亮相英特尔新品分享会
科技数码
同“芯”聚力,华硕携双系列创新成果,亮相英特尔新品分享会

第三代英特尔酷睿Ultra处理器发布会解析:开启AI PC新时代 近日,一场备受瞩目的科技盛会在上海举行。以“AI PC 变革未来”为主题的第三代英特尔酷睿Ultra处理器新品分享会,汇聚了行业目光。华硕电脑PC&智能创新产品事业群副总经理杨鉴文亲临现场,分享深度见解。他详细解读了面向2026年的华

热心网友
04.02
英特尔Arc Pro B70曝光,或与Arrow Lake Refresh同步登场
科技数码
英特尔Arc Pro B70曝光,或与Arrow Lake Refresh同步登场

英特尔Arc Pro B70工作站专业显卡全新曝光,或采用下一代Battlemage架构 3月8日最新资讯显示,英特尔官方网站的产品支持列表中,悄然新增了一项“Arc Pro B70”产品线。这款即将问世的工作站级别显卡,其部分关键规格已提前泄露。据目前可靠信息推断,该显卡预计将搭载代号为BMG-G

热心网友
04.02
面向高性能笔记本 英特尔发布酷睿Ultra 200HX Plus
科技数码
面向高性能笔记本 英特尔发布酷睿Ultra 200HX Plus

英特尔酷睿Ultra 200HX Plus系列震撼发布:重塑移动性能巅峰 面对日益严苛的极致性能需求,英特尔再次亮剑,推出了面向顶级用户的全新移动处理器解决方案——酷睿Ultra 200HX Plus系列。其中,备受瞩目的酷睿Ultra 9 290HX Plus和酷睿Ultra 7 270HX Pl

热心网友
04.02
前英特尔 CEO 基辛格开炮:华尔街不懂长期投资,芯片厂十年才回本
业界动态
前英特尔 CEO 基辛格开炮:华尔街不懂长期投资,芯片厂十年才回本

前英特尔CEO基辛格直言:华尔街短视文化恐令美国在芯片竞赛中落败 3月28日,科技媒体Wccftech的一篇深度报道在半导体行业激起广泛反响。报道披露,英特尔前首席执行官帕特·基辛格(Pat Gelsinger)近期公开批评华尔街盛行的“短视主义”,并尖锐指出,这种追逐短期回报的资本文化,可能正是美

热心网友
04.01

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化
游戏资讯
《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化

《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照

热心网友
04.02
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀
科技数码
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀

雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战

热心网友
04.02
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验
科技数码
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验

借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动

热心网友
04.02
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情
游戏攻略
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情

冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让

热心网友
04.02
iPhone 18 Pro设计挤牙膏了 继续用前代模具
科技数码
iPhone 18 Pro设计挤牙膏了 继续用前代模具

iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消

热心网友
04.02