高通带宽突破10倍,市值飙升200亿美元,谁能分食千亿AI推理市场
(公众号:)最新消息显示,当地时间10月27日,高通正式发布了面向数据中心场景的AI推理优化解决方案。该方案由Qualcomm AI200、AI250云AI芯片及相应的加速卡、机架等配套产品构成。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
随着这家芯片巨头进军千亿级云端推理市场,资本市场迅速给予积极回应。其股价在交易时段内一度飙升22%,最终收盘涨幅锁定在11%。截至美东时间10月27日收盘,高通股价报收187.68美元/股,公司市值达到约2025亿美元,单日增值近200亿美元。
“从美国市场来看,英伟达的市值已经相当高,想要再实现数量级增长难度较大。而近期美股能够上涨的股票大多与AI概念相关,高通此时推出AI推理芯片无疑是补涨行情。”芯片行业分析师陈冲表示。
多位业内人士指出,高通在端侧芯片领域拥有深厚的技术积累,进军AI推理芯片将为公司带来新的业务增量,同时市场也不希望看到英伟达一家独大,因此此举完全符合行业预期。关于国内外AI芯片市场的竞争格局,欢迎添加微信YONGGANLL6662交流更多信息。
但这份乐观预期背后,高通主打的低TCO理念能否真正形成竞争力,仍需经过市场检验。
“高通一直强调行业最低总拥有成本的概念,但其高效能和内存处理能力是否具备足够竞争优势,还需要在实际应用场景中验证后才能判断。”二级市场分析师张翔表示,“AI推理芯片主要考量固定成本下的Token吞吐率,即单位时间内产生的Token数量与总成本的比例。在这方面,英伟达确实优势明显,其迭代能力实在太强了。”
从Blackwell架构到新一代Rubin平台,英伟达的迭代速度正在不断加快。
Rubin CPX采用解耦推理设计,支持百万级Token处理,GDDR7内存使得成本大幅降低,投资回报率达到30-50倍。Vera Rubin NVL144平台算力较前代提升3.3倍,单位Token成本进一步摊薄。
面对激烈竞争,高通也正在通过实际合作推进产品落地验证,其宣布与沙特AI公司HUMAIN达成战略合作。
根据规划,HUMAIN将从2026年开始部署高通AI200、AI250架构解决方案,总规模达200兆瓦。同时双方还将联合开发尖端AI数据中心,实现云到边缘的混合AI推理服务。
“大规模订单合作往往伴随着定制化开发需求。现阶段模型网络架构已趋于成熟,不会出现颠覆性变化,因此无需过度追求通用性很高的产品,通过定制化模式可以精准匹配客户特定需求,实现深度性能优化。”国产芯片厂商从业者李沐表示,“而高通在成本管理及端侧NPU领域积累的经验,也能为这种模式提供支撑,理论上具备一定可行性。”
聚焦AI推理赛道,无疑是当前高通应对英伟达竞争的最佳选择。
据QYResearch调研显示,2024年全球推理AI芯片市场规模约为142.1亿美元,预计2031年将达到690.1亿美元,2025-2031期间,年复合增长率为25.7%。
AI推理包含Prefill和Decode两个阶段,与模型训练相比,它对硬件的要求存在明显差异。推理更看重显存带宽的稳定性、适配性以及充足的显存容量,同时无需训练所需的极致浮点算力,转而追求高能效比与低延迟。
在集群建设方面,存力的重要性也日益凸显。
“算力集群的计算过程是将数据从存储搬运到计算单元,计算完成之后,计算的中间结果以及最终结果会返存回存力集群。在这个过程中,存力能否以更大的带宽、更低的时延将数据迁移到算力集群中进行计算,将影响整个计算单元的算力利用率。”存储芯片专家陈峰表示。
此外,由于计算集群会不定时发生故障,此时需要将中间的参数以及计算结果定期保存回存力集群。这个检查点的保存时间耗时越短,整个计算过程被中断的时间便越少,同样可以进一步提升计算的效率,且保证计算的可靠性。
高通此次推出AI推理芯片的重要亮点便是更高的内存容量。Qualcomm AI200支持每卡768 GB LPDDR,而Qualcomm AI250则将首次采用基于近内存计算的创新内存架构,通过提供超过10倍的有效内存带宽和更低的功耗,实现AI推理工作负载效能的显著提升。
“现在推理Token使用量每个月都在大幅上涨,高通的推理卡显存非常大,单卡可以支持768GB,相当于单卡可以跑完完整的DeepSeek,是目前所有卡中显存最大的,非常适合私有化部署。”陈冲表示。

除了硬件上的显存容量与内存架构创新,高通在软件生态建设上也同步发力,为产品落地铺路。
其AI软件栈覆盖从应用层到系统层的端到端链路,并针对AI推理场景做了专门优化,支持领先的机器学习框架、推理引擎、生成式AI框架及LLM/LMM推理优化技术。开发者可以通过相关套件,实现模型导入与Hugging Face模型一键部署。
“英伟达在云端芯片市场一家独大,但凭借差异化的硬件设计以及丰富的软件栈,高通的入局具有合理性。后续将其网络芯片集成进去,能打造出具有性能优势的产品。”大厂数据中心专家江杰表示。
作者长期追踪芯片行业相关动态,欢迎添加微信YONGGANLL6662互通有无。
注:文中陈冲、张翔、李沐、陈峰、江杰均为化名。
原创文章,未经授权禁止转载。详情见转载须知。
热门专题
热门推荐
4月3日消息,今日,OPPO官微宣布,OPPO Find X9s Pro将首发新一代1nit明眸护眼屏,宣称全场景都护眼。据悉,这块屏幕来自新一代天马天工屏,搭载全新U9 Pro发光基材,从材料、器
Word行距异常增大可按五步解决:一、重置段前段后间距为0并设单倍行距;二、改用固定值行距(如小四号设18磅);三、清除样式继承并修复Normal模板;四、禁用自动格式更正干扰项;
汽车4月3日消息,4月3日,“年轻人第一台GT”比亚迪2026款海豹06GT新车交付仪式在深圳举行,作为海洋网又一搭载第二代刀片电池和最新闪充技术的重磅车型,上市售价12 89万元-16 99万元,
汽车4月3日消息,广汽埃安宣布将于 4 月 16 日举办品牌焕新发布会,埃安 N60 汽车将同步开启预售。目前新车已开启盲订,支付 99 元定金可享价值 5088 元礼遇。该车由曾任职于宝马等品牌的
4月5日消息,一起教育科技(NASDAQ: YQ)日前发布截至2025年12月31日的财报。财报显示,一起教育科技2025年营收为1 06亿(约1520万美元),较上年同期的1 89亿元下降44%。





