高通公司近期推出了专为数据中心设计的新一代AI推理加速方案,该解决方案基于Qualcomm AI200与AI250芯片架构打造,全面覆盖加速卡及机架级系统产品。通过优化整体拥有成本(TCO),该系列方案能为高算力数据中心提供业界领先的生成式AI推理性能,同时配备大容量内存以支持复杂模型的顺畅运行。

作为机架级AI推理专用产品,Qualcomm AI200加速卡单卡配置768GB LPDDR内存,在维持较低总体拥有成本的前提下,为大型语言模型(LLM)和多模态模型(LMM)提供高度优化的推理性能。其内存架构设计兼具高扩展性与成本效益,支持数据中心灵活应对不同规模的AI工作负载。
更值得关注的是Qualcomm AI250机架系统,这款产品创新性地采用了近存计算(Near-Memory Computing)内存架构。通过深度整合计算单元与存储单元,系统实现了有效内存带宽超过10倍的显著提升,同时功耗大幅降低。这种创新架构支持解耦式AI推理模式,可动态分配硬件资源,在满足性能需求的同时有效控制运营成本。
两款产品均配备先进的散热与扩展设计:支持直接液冷技术以提升能效比,提供PCIe纵向扩展和以太网横向扩展能力,并内置机密计算模块保障数据安全。整机架设计的功耗控制在160千瓦,完美兼顾高性能与节能需求。
根据技术路线图,Qualcomm AI200将于2026年进入商用阶段,AI250则计划在2027年推向市场。这两款产品的推出,预计将推动数据中心AI推理领域实现技术架构与商业模式的双重突破。
