10月28日,高通公司正式发布面向数据中心的新一代AI推理优化解决方案:基于Qualcomm AI200与AI250芯片的加速卡及机架系统。
这两款方案具备业界领先的总体拥有成本(TCO)优势,为高速数据中心运行生成式AI推理任务提供了机架级(rack-scale)性能与超大内存容量支持。

其中,Qualcomm AI200专门针对机架级AI推理场景打造,为大语言模型(LLM)与多模态模型(LMM)的推理及其他AI工作负载提供了更低总体拥有成本和更优性能表现。
每张加速卡支持768GB LPDDR内存配置,在实现更高内存容量的同时有效控制成本,为AI推理应用带来卓越的扩展性与部署灵活性。
而Qualcomm AI250解决方案首次采用基于近存计算(Near-Memory Computing)的创新内存架构,实现了超过10倍的有效内存带宽提升,并显著降低功耗,为AI推理工作负载带来能效与性能的跨越式升级。
该架构支持解耦式AI推理,实现硬件资源的高效利用,同时满足客户对性能与成本的差异化需求。
两款机架解决方案均支持直接液冷散热技术,有效提升散热效率,支持PCIe纵向扩展与以太网横向扩展,并具备机密计算能力,确保AI工作负载的安全性,整机功耗控制在160千瓦。
根据高通产品规划,Qualcomm AI200与AI250预计将分别于2026年和2027年实现商用部署。

