游乐游手机版
首页/科技数码/文章详情

高通AI200与AI250芯片发布:高效能低功耗,加速生成式AI推理

时间:2025-10-29 09:27
高通公司近日正式发布面向数据中心领域的下一代AI推理加速方案,推出基于Qualcomm AI200与AI250芯片的加速卡及机架系统。该系列解决方案依托高通在神经网络处理单元(NPU)领域的技术积累

高通公司近日正式推出面向数据中心领域的新一代AI推理加速解决方案,该方案基于Qualcomm AI200与AI250芯片,推出了配套的加速卡及机架系统。该系列产品深度融合了高通在神经网络处理单元(NPU)领域的技术积淀,通过机架级架构设计实现性能与能效的双重跃升,为生成式AI在各行各业实现规模化部署奠定核心基础设施支撑。

Qualcomm AI200加速卡专为机架级AI推理场景打造,每卡配备768GB LPDDR内存,在显著提升内存容量的同时有效优化整体拥有成本。该方案针对大语言模型(LLM)及多模态模型(LMM)的推理需求进行了专门优化,借助内存扩展技术实现硬件资源的灵活调配,全面覆盖从边缘计算到云端服务的多样化AI工作负载。

作为技术升级的核心突破,Qualcomm AI250率先引入近存计算架构,通过计算单元与内存单元的深度集成,实现超过10倍的有效内存带宽提升。这一创新设计不仅显著降低功耗,还支持解耦式AI推理模式,使硬件资源可根据任务需求动态分配,在保障高性能表现的同时优化客户成本结构。实验数据显示,该架构可使特定AI推理任务的能效比提升高达40%。

在系统设计层面,两款机架解决方案均采用直接液冷散热技术,结合PCIe纵向扩展与以太网横向扩展能力,构建起高密度计算集群。安全防护方面,机架系统集成机密计算模块,通过硬件级安全加密确保AI模型与数据在推理全流程中的安全防护。整机架设计将功耗控制在160千瓦以内,实现高性能与能源效率的完美平衡。

高通技术规划与数据中心业务负责人马德嘉强调,新方案通过软件栈与开放生态的协同创新,重新定义了机架级AI推理的标准。开发者可依托高通Efficient Transformers库和AI Inference Suite工具链,实现与主流AI框架的无缝对接,同时支持Hugging Face模型库的一键部署。这种全链路优化覆盖从模型训练到推理服务的完整生命周期,显著降低AI应用落地的技术门槛。

配套发布的超大规模AI软件栈提供从应用层到系统层的全栈支持,兼容TensorFlow、PyTorch等主流机器学习框架,并集成生成式AI框架优化模块。开发者通过标准化API接口和自动化工具链,可快速完成模型适配与性能调优。该软件栈还提供预训练模型库、开发工具包及AI运营服务,形成端到端的完整解决方案。

据规划披露,Qualcomm AI200将于2026年率先投入商用,AI250则计划在2027年实现规模化部署。高通承诺将保持年度技术迭代节奏,持续优化AI推理性能、能效比及总体拥有成本三大核心指标,通过芯片架构创新与软件生态建设巩固其在数据中心市场的竞争优势。

来源:https://www.itbear.com.cn/html/2025-10/1001573.html
上一篇真我GT8+Pro迎AI升级:11月新增F1机械拼装定制 下一篇《十八岁的太奶奶》爆火,家庭群像剧开启短剧新风口
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元
科技数码 · 2026-07-03

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售,支持4K165Hz与FHD520Hz双模切换,定价1888元。采用FastIPS面板,97%DCI-P3色域,配备升降支架及双HDMI2 1和双DP1 4接口。

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%
科技数码 · 2026-07-03

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年,DRAM与NAND闪存的供应持续紧张及价格不断攀升,正逐步传导至终端消费市场。可以预见,下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价,最终连苹果也不得不跟进,宣布提升iPad、Mac及家居设备的价格,以应对存储成本的快速上涨。 TrendForce分析指出,苹果全面

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波
科技数码 · 2026-07-03

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果自研C2芯片仅支持Sub-6GHz,不支持5G毫米波。因此,美版iPhone18Pro继续采用高通基带方案以支持毫米波,而其他地区版本则搭载苹果自研C2芯片。这一差异将导致在毫米波覆盖的市场中,用户峰值速率可能显著低于美版用户。

纳睿雷达推出睿宸超精细化短时临近AI气象大模型
科技数码 · 2026-07-03

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达近日释放了一项重磅成果。2026年7月1日,公司正式对外发布了两款自主研发的全新产品:一款是“WDSPT0152型”S波段全极化多功能有源相控阵雷达,另一款则是名为“睿宸”的超精细化短时临近AI气象大模型。从产品战略来看,此次发布直指气象监测与灾害预警领域的技术制高点。 先来看这款S波段雷达

南航国际创新港一期交付 四大专业园区打造空天产业强磁场
科技数码 · 2026-07-03

南航国际创新港一期交付 四大专业园区打造空天产业强磁场

近日,南京航空航天大学与六合区深度合作的标杆项目——南航国际创新港一期正式交付投用。两个地块陆续启用,成功串联起高校科研能量、地方产业载体与市场创新主体,为南京打造全国领先的航空航天产业创新中心、助力江苏布局商业航天全产业链,提供了坚实的物理支撑。 该创新港一期位于六合区雄州街道,分为3号和4号两个