关于苹果与谷歌在人工智能领域的深度合作,近日又有新动态被曝光。科技媒体 The Information 于昨天(5月28日)发布了一篇深度报道,详细揭示了两大巨头在AI协作中的具体战术——信息密度很高,值得逐层解读。
先聚焦苹果方面的策略。核心思路其实相当清晰:一切围绕隐私优先原则展开,主攻端侧AI。如何实现?苹果采用了一种名为“蒸馏”(Distillation)的技术方案,将谷歌的Gemini模型作为“教师”,训练出一个更轻量化的端侧模型。所谓知识蒸馏,通俗来讲,就是把大模型(教师模型)所掌握的知识压缩、迁移到小模型(学生模型)上,让小模型在推理成本显著下降的同时,依然保持接近大模型的表现水平。
知情人士透露,苹果AI团队目前正全力调动谷歌Gemini模型的能力,利用其输出结果“教”出一个更精炼的版本,最终让这一版本直接在Apple设备本地运行。如此设计优势明显:端侧运行AI不仅响应速度更快,而且用户数据无需默认上传至云端——这恰好契合苹果多年来反复强调的隐私保护路线。
除了自身开展蒸馏工作,苹果还在积极寻找能够协助其压缩模型规模的初创企业。有消息称,苹果一度考虑收购Liquid AI——这家公司位于美国马萨诸塞州剑桥,专注于让AI模型在设备本地运行的技术方向。

再看云端一侧。完整的Gemini模型参数规模高达数万亿,对算力的要求极为苛刻,苹果自家的Private Cloud Compute基础设施难以完全承载。为了缓解服务器压力,消息人士指出,在iOS 27版本中的Siri,部分用户请求会被路由至Google Cloud,调用授权版本的Gemini模型进行处理。
当然,苹果也清楚云端处理会带来隐私方面的担忧。为尽可能守住用户承诺,近几周内,苹果据称已批准采用NVIDIA的“机密计算”技术。该技术会在GPU处理数据与模型时对内容进行加密,代价是云端AI查询速度会略有下降——但话说回来,能让敏感信息的保护力度提升一个层级,这一代价在许多场景下是值得的。
如果这套方案最终落地,苹果在云端运行AI功能时,很可能会同时依赖Google Cloud的算力与NVIDIA的AI芯片。双线并行的策略,确实是务实且稳妥的选择。

