全球领先的出行服务平台Uber近期宣布了一项关键的战略合作升级——深化与亚马逊云科技(AWS)的伙伴关系,计划将包括实时派单算法、动态运力预测在内的更多核心网约车业务系统,迁移至亚马逊基于自研AI芯片构建的算力集群上运行。这并非一次简单的服务扩容,而是被行业观察家视为一次具有风向标意义的“核心供应商切换”:Uber正系统性地采用AWS的全栈解决方案,逐步替代其原先依赖的Oracle及谷歌云服务。对亚马逊云科技而言,此次合作无疑是其自研AI芯片在竞争激烈的企业级云服务市场中赢得的又一重要胜利,同时也进一步撼动了英伟达在AI加速计算硬件领域的传统主导地位。
此次合作升级的具体细节已于2026年4月正式对外披露。根据已公开的信息,Uber首批迁移的业务模块将聚焦于对实时性要求最为严苛的消费者端出行服务场景。首批投入使用的亚马逊自研芯片集群,其总算力规模已突破1200 PetaFLOPS,足以高效、稳定地支撑Uber在全球17个国家和地区的日常出行订单匹配与调度需求。
回顾过去两年,呈爆炸式增长的全球AI算力需求,正强力驱动所有头部云服务商投身于自研芯片的赛道。这一战略布局背后蕴含着双重目标:既能有效降低对英伟达GPU单一供应链的潜在依赖风险,也能为最终客户提供更具成本优势与能效表现的算力选项。亚马逊在此领域布局较早,其自研芯片项目始于2018年,目前已成功迭代至第三代Inferentia推理芯片与第二代Trainium训练芯片。依据第三方公布的基准测试数据,在典型推理场景下,其单位算力成本相较英伟达A100 GPU可降低约42%,而能效比则显著提升了60%。
实际上,在Uber做出这一决策之前,Snap、Spotify等知名互联网企业已率先将部分AI应用负载迁移至亚马逊的自研芯片平台。然而,Uber的加入具有不同寻常的行业意义——作为出行共享经济领域的全球领导者,它是该行业内首个大规模采纳此类方案的核心企业,其产生的示范效应与产业影响力无疑更为深远。
对Uber而言,底层AI芯片的性能与效率绝非次要考量,它直接关乎其核心业务的用户体验与至关重要的运营成本控制。试想其业务场景:实时智能派单系统需要在毫秒级时间内完成海量乘客与司机的高效匹配;应对早晚高峰的运力预测模型,需要实时处理PB级别的历史行程与交通数据;甚至包括车内的智能语音交互、行程安全监控等功能,其背后都离不开大规模、低延迟的AI推理算力持续支撑。
在此之前,Uber的AI算力基础设施由Oracle云与谷歌云共同分担,但长期面临两大核心挑战。其一,谷歌自身也在积极推进自动驾驶及智慧出行相关业务,这难免令Uber对其核心业务数据的安全性与独立性产生顾虑。其二,来自不同供应商的AI算力资源,在快速扩容时往往面临成本高昂、交付周期较长的问题,难以匹配Uber在高速增长的新兴市场快速拓展业务的敏捷性需求。而AWS所提供的、深度整合的“自研芯片+全托管云服务”一体化方案,据评估能够帮助Uber将其核心业务的端到端推理延迟降低23%,年度算力总成本更有望削减近3亿美元。
Uber此次的战略选择,向整个云计算与AI市场释放了一个明确信号:企业客户在采购AI算力时,其决策逻辑正在发生根本性演变。大家不再盲目追求“唯GPU论”或单一品牌,而是更加注重“场景适配优先”与“总拥有成本最优”,不再愿意被任何单一供应商的硬件技术路线所锁定。
当前,这场由全球云服务巨头主导的“换芯”趋势正在持续加速。除亚马逊外,谷歌的TPU、微软的雅典娜(Athena)项目等自研芯片均在加速其商业化落地进程。同时,多家AI芯片初创公司的专用解决方案也正在进入客户测试阶段。行业分析预测显示,到2030年,云服务商自研AI芯片在全球数据中心AI加速市场的份额,将从2025年的约8%大幅攀升至32%。英伟达一家独大的市场格局必将被重塑,而面向不同应用场景的AI模型与服务,也将因此获得更加多元化、更经济且更高效的基础算力支撑。
