11月6日消息,苹果自研大模型的进展似乎并没有达到预期——公司最终决定引入谷歌Gemini大模型来为Siri的智能化升级提供技术支撑。换句话说,新版的Siri,终于要迎来一次真正的“智力跃升”。
据知情人士透露,苹果计划每年向谷歌支付约10亿美元,以获得定制版的Gemini模型授权。这个版本的核心是当前参数规模高达1.2万亿的Gemini 2.5 Pro。没错,1.2万亿参数——这个数字放在任何一个主流大模型排行榜上,都足以让人多看两眼。

具体来说,这颗“外来大脑”将承担Siri最吃力的几项任务:信息摘要的生成、任务规划,以及复杂多步指令的执行。作为对比,现在Siri依赖的云端模型还停留在1500亿参数的水平。从1500亿到1.2万亿,这不仅仅是数字上的跃迁——上下文理解深度、多模态交互能力以及128K token的超长文本输入,都意味着Siri在处理复杂对话和应用协同时的表现将截然不同。可以这么理解:以前你问Siri“帮我总结今天上午的邮件并安排一个会议”,它可能只理解前半句;升级之后,整段指令甚至包括后续的调整,它都能接住。
升级版Siri预计于2026年春季随iOS 26.4系统正式上线。而更长远来看,在2026年6月的WWDC大会上预览的iOS 27、macOS 27等新一代操作系统中,Siri与Gemini的融合将进一步加深——届时呈现的恐怕会是完全不同的交互体验。
那么,苹果为什么最终选择了谷歌,而不是此前传闻中的OpenAI或Anthropic?根据行业渠道透露的信息,苹果对谷歌Gemini、OpenAI的ChatGPT以及Anthropic的Claude三大主流模型都做了全面测试。最终敲定谷歌方案,原因其实不难理解:整体合作成本更可控——Anthropic方面报出的年费超过了15亿美元;再加上双方长期存在的合作关系,以及Gemini 2.5 Pro当前在主流大模型评测榜单上确实领先,三重因素叠加,谷歌胜出几乎是必然。
值得一提的是,Gemini采用的是混合专家(MoE)架构设计。通俗点说,虽然模型的参数规模突破了万亿级别,但每次处理请求时并不会把所有“专家”都叫醒,只激活必要的子网络——用更少算力完成高难度任务,既保证了强大的推理能力,又把计算开销控制在合理范围内。这对苹果来说,意味着更低的成本和更可控的运营压力。

当然,引入外部大模型最大的隐忧是数据隐私。苹果在这方面的处理方式依然沿用了自己一向的“隔离”思路:谷歌为苹果专门开发的AI模型将被部署在苹果自有的私有云服务器上,谷歌方面根本无法访问任何用户数据。换句话说,数据在苹果的围墙里跑,谷歌只看得到围墙,看不到里面的人在做什么。
在此基础上,苹果还采用了一套“双引擎”混合架构策略。谷歌Gemini负责处理复杂云端任务,比如网页内容摘要、跨设备多应用协同调度等;而苹果自研的小型模型则继续在本地设备运行,专门处理健康数据、个人文件调用等敏感操作。这种“云端智能+本地隐私”的分层协作模式,既让Siri变得真正聪明起来,又牢牢掌控了用户的数据主权——说到底,这才是苹果真正看重的东西。
