英特尔优化多显卡AI推理,Battlematrix性能提升达80%
8 月 12 日,科技媒体 WccfTech 发布消息称,英特尔为其锐炫 Pro 系列 GPU 的 Battlematrix 项目推出了首个重要软件更新——LLM Scaler v1.0,新版本在 AI 推理能力方面做出了显著优化。
回顾今年 5 月,英特尔在 COMPUTEX 2025 台北国际电脑展上不仅发布了锐炫 Arc Pro B50 与 B60 显卡,还推出了 Project Battlematrix 推理工作站平台。该平台最高可搭载八张锐炫 Pro 显卡,并配备完整软件包,能够支持运行参数规模达 150B 的中等体量、高精度 AI 模型。
Battlematrix 平台结合了定制化硬件与专用软件栈,旨在优化推理性能与企业部署效率。其中的 LLM Scaler,是基于 vLLM 框架开发的大模型推理容器,可扩展至多 GPU、支持长序列高效推理并兼容多模态任务。

LLM Scaler v1.0 着重改进了 vLLM 推理框架的性能表现。针对 32B 参数模型,在 40K 序列长度下性能提升约 1.8 倍;70B 参数模型则在同一条件下实现高达 4.2 倍的性能增幅。对于 8B 至 32B 范围的模型,输出吞吐量相比上一版本提升了约 10%。
该版本还引入了分层在线量化技术,有效降低了显存占用,并支持管道并行、数据并行、多模态模型嵌入及重排序等功能,进一步提升了模型的灵活性和扩展性。
为了满足企业级运维需求,LLM Scaler v1.0 集成了 XPU Manager 工具,能够实现对 GPU 电源管理、固件升级、设备诊断及显存带宽检测等功能的全面支持。
新容器运行于 Linux 平台,充分发挥多 GPU 扩展与 PCIe 点对点传输的优势,整体性能最高提升 80%。同时,系统还支持 ECC 纠错、SRIOV 虚拟化、遥测数据收集与远程固件更新,保障了其在企业环境中部署的可靠性与可控性。


英特尔指出,其新软件栈兼容行业标准与主流开发流程,并通过集成 OneCCL 基准测试工具,方便开发者进行模型调优与性能评估。这将进一步增强 Battlematrix 平台在 AI 生态中的竞争力。
按照英特尔的产品路线图,本季度还将推出更稳定的容器版本,持续提升 vLLM 的服务能力。预计到四季度,Battlematrix 项目将实现全功能版本的正式落地,为专业领域用户带来更高效、更易用的大模型推理解决方案。
相关攻略
英特尔下一代代号“新月岛”的AI推理卡基于Xe3P架构,主打高能效与低成本。其集成160GBLPDDR5X内存,采用风冷散热,通过选用成本更低的显存类型控制成本。PCB设计留有供电余量,并采用新一代电源接口。该卡预计下半年送样,目前暂无游戏显卡计划。
先说几个核心判断:AI已经成了数据中心和服务器市场的绝对主角,就连通用服务器CPU,现在也开始拼命往AI计算能力上靠。去年年底,英特尔发布了第五代至强处理器,通用计算性能在提升,更重要的是,加入了针对AI的新指令集——比如AMX、A VX这些。 第五代至强可扩展处理器架构剖析 第五代至强是2023年
东软新一代PACS RIS系统采用第五代英特尔至强可扩展处理器,融合三维可视化与AI辅助诊断。借助英特尔AMX和OpenVINO工具套件加速AI推理,三维重建效率提升2 45倍,AI推理性能提升最高8 49倍,助力智慧医院建设。
英特尔与AWS联手:老牌芯片巨头的战略突围之路 在科技产业中,巨头之间的深度合作往往不仅是新闻头条,更是一面折射行业格局变化的风向标。当地时间周一,英特尔正式宣布了一项重磅合作:亚马逊云服务AWS成为其制造业务的客户。这一决策,对于正在美国俄亥俄州全力推进先进工厂建设的英特尔而言,无疑注入了强劲动力
戴尔在2026全球峰会上发布了多款搭载AMD与英特尔下一代处理器的服务器新品。AMD平台包括2026年上市的风冷与水冷机型,以及2027年将推出的多款单槽服务器。英特尔平台则公布了预计2027年上市的单槽2U机型。两款新处理器均未正式发布,相关服务器产品仍需等待。
热门专题
热门推荐
史蒂文·斯皮尔伯格执导的科幻新片《揭秘日》定档6月12日。影片讲述气象主播玛格丽特获超能力后,与黑客丹尼尔联手揭露政府长期掩盖外星人存在的真相,随即遭到影子政府追杀。电影探讨人类是否为宇宙唯一文明,引发对“真相”的哲学拷问。
通过构建包含背景价值观、行为规范及偏好设置的万字提示词框架,使AI在私有代码库中实现理解架构哲学并主动协作,从被动执行转变为具备架构直觉的专业伙伴,恢复许愿式开发体验。
全链网报道,5月28日,美联芝加哥联储银&行行长古尔斯比抛出了一个值得深思的判断:如果市场对未来生产率大幅提升的预期过于乐观,进而带动投资和消费支出猛增,那反而可能推高通胀,最终倒逼美联储加息。这话是在东京出席日本央&行会议时说的,他准备了讲稿,逻辑相当清晰。 古尔斯比的原话是这么讲的——“预期收入
360漏洞挖掘智能体采用“智能体中心”路径,将专家经验与知识库转化为协同工作的垂直智能体,在OpenClaw生态中发现23个安全漏洞,覆盖远程控制、权限绕过等风险。其工程化、实战化的AI安全能力引发海外关注,为AIAgent时代安全建设提供了新思路。
生成特定城市曲风的Citypop音乐常因未将城市意象转化为声学参数而失败。通过MiniMaxM1Chat提取城市声景语义标签,在海螺AI中构建城市-节奏-音色三维绑定,启用Citypop专用微调权重,最后用剪映实现音画耦合,可精准还原城市霓虹质感。





