2024年的WWDC,苹果没有让等待者失望。当库克在舞台上揭晓“Apple Intelligence”时,整个科技圈都意识到,一场关于个人智能体验的深刻变革,正式拉开了序幕。这并非一个孤立的应用,而是深深嵌入iOS、iPadOS和macOS血脉的智能系统,旨在重新定义我们与手中设备互动的方式。
Apple Intelligence是什么
简单来说,Apple Intelligence是苹果打造的一套个人智能系统。它于2024年6月11日的WWDC大会上首次亮相,将全面集成于iPhone、iPad和Mac。这套系统的精髓在于,它并非“凭空想象”,而是将强大的生成式模型与对用户个人背景的深度理解相结合,从而提供既实用又高度相关的服务。更关键的是,它在努力读懂你、预测你的同时,把隐私保护放在了前所未有的高度,试图在个性化和安全性之间找到一个完美的平衡点。
Apple Intelligence的核心功能
那么,这套被寄予厚望的系统,到底能为我们做些什么?它从多个维度重塑了苹果生态的体验。
AI驱动的写作工具
首先,写作这件事变得轻松多了。Apple Intelligence提供了一套系统级的写作辅助工具,你可以在邮件、笔记乃至任何文本输入框里,直接调用它来重写段落、校对语法甚至总结长篇内容。无论是想让邮件语气更专业,还是需要快速提炼一份会议纪要的核心要点,它都能胜任。你甚至可以自由调整文本的风格,从随意到正式,一键切换。
Genmoji和Image Playground
创意表达也有了新玩法。全新的“Image Playground”功能让你能轻松生成三种风格的趣味图像:动画、插画或素描。更有趣的是“Genmoji”——你可以用文字描述一个独一无二的表情符号,系统便能生成一个专属于你的“Genmoji”,精准捕捉那些难以言传的情绪瞬间。对于喜欢涂鸦的用户,“图像魔杖”功能还能将简单的草图转化为精致的图像,让灵感快速成真。
改进的照片和视频体验
照片应用变得更聪明了。现在,你可以直接用自然语言搜索视频中的特定片段,比如“找到宝宝第一次走路的画面”。新增的“清理”工具可以神奇地移除照片背景中不想要的杂物,而主体毫发无损。此外,经典的“回忆”功能也获得AI加持,你只需简单描述一个主题,它就能自动挑选照片和视频,生成一段充满故事感的影片。
隐私和安全
隐私,是苹果为AI时代划下的底线。Apple Intelligence的隐私策略是双管齐下的:绝大多数简单的请求,都由一个在设备端本地运行的小模型直接处理,你的数据根本无需离开手机。只有当遇到极其复杂的任务时,系统才会调用全新的“私有云计算”功能。关键在于,即便是云端处理,数据也经过严格加密,且不会被存储或用于模型训练,从设计源头杜绝了隐私泄露的风险。
Siri的全面升级
是的,那个熟悉的Siri,这次真的要脱胎换骨了。得益于Apple Intelligence,Siri的理解能力和上下文记忆得到了质的飞跃。它现在能跟上你的思路,记住对话的前因后果。你甚至可以选择用打字来代替语音与它交流。更重要的是,Siri获得了在应用间执行复杂操作的能力——比如,你可以让它“把我上周在备忘录里记的那本小说书名,发微信问问小明觉得怎么样”,它便能理解并执行这一连串指令。
ChatGPT集成
苹果也展现了开放的一面。系统层面集成了OpenAI的ChatGPT。当Siri遇到自己无法处理的复杂问题时,在征得用户同意后,可以调用ChatGPT来提供专业解答。同时,系统级的写作工具也能借助ChatGPT来生成内容和图像。对于ChatGPT的付费用户,还可以直接关联账户,享受更高级的服务。这标志着苹果在构建自身能力的同时,也为用户接入了更广阔的外部AI生态。
Apple Intelligence的技术细节
如此流畅的体验,背后是一套复杂而精巧的技术架构在支撑。Apple Intelligence并非依赖单一模型,而是一个由苹果自研的多种生成模型构成的“组合拳”,包括设备端模型、服务器端基础模型、用于图像生成的扩散模型等,并在需要时灵活调用如ChatGPT这样的第三方模型。
设备端的模型
为了在手机上实现实时响应,苹果打造了一个高度优化的设备端小模型。它拥有约30亿参数,采用了低比特量化、分组查询注意力等前沿技术来压缩体积、提升速度。实测在iPhone 15 Pro上,从发出指令到生成第一个词元(token)的延迟仅需0.6毫秒,后续生成速度可达每秒30个词元,确保了交互的流畅性。
服务器端的模型
当任务超出设备能力时,更强大的服务器端模型就会接手。这个模型词汇量更大,能力更强,通过“私有云计算”来处理复杂请求。它采用了推测性解码、上下文修剪等技术来优化性能。更重要的是,这套云服务建立在专门强化的iOS基础架构上,配合端到端的加密和安全的启动流程,从硬件到软件全方位守护用户数据隐私。
训练和优化
模型的“智慧”从何而来?苹果强调,其模型训练使用的是经过精心筛选的数据集,其中不包含任何个人用户数据。数据来源包括授权内容、由苹果网络爬虫AppleBot收集的公开数据以及合成的数据。训练完成后,团队还采用了拒绝采样微调、基于人类反馈的强化学习等算法,让模型更好地理解和遵循人类指令。
为了让这些模型能在移动设备上高效运行,苹果应用了一系列尖端优化技术。通过共享嵌入表、低位量化、高效键值缓存更新等方法,最终实现了在严苛的内存、功耗和性能限制下,依然保持高质量的模型输出。
低秩适应(LoRA)
与谷歌Gemini Nano、微软Phi等通用模型不同,苹果模型的一个关键特色在于“低秩适应”技术。你可以把它理解为给一个博学的大脑安装不同的“技能模块”。通过向预训练好的基础模型层中插入小型神经网络适配器,模型就能快速适应摘要、邮件回复、校对等特定日常任务,同时保留其广泛的通用知识。这些适配器可以动态加载和切换,让一个基础模型灵活变身为多个专家。
如何使用Apple Intelligence
好消息是,这套强大的智能系统将面向用户免费提供。其测试版将于今年秋季,随着iOS 18、iPadOS 18和macOS Sequoia的更新一同推出。不过,初期仅支持美国英语,部分功能、平台适配和其他语言支持要等到明年才会陆续上线。需要注意的是,由于对算力有较高要求,Apple Intelligence仅支持iPhone 15 Pro/Pro Max,以及搭载M1或更新芯片的iPad和Mac设备,并且需要将设备和Siri的语言设置为英语(美国)。
常见问题
Apple Intelligence基于什么大模型?
它基于苹果自研的一系列生成模型,包括设备端的约30亿参数小模型和服务器端更复杂的模型,并可根据需要整合第三方模型如ChatGPT。
Apple Intelligence国内可以用吗?
秋季推出的Beta版初期仅支持美国英语,暂未覆盖中国区。后续是否会以及何时进入中国市场,还有待官方进一步公布。
Apple Intelligence如何保护用户隐私?
其隐私保护采用本地优先策略:简单任务由设备端模型处理;复杂任务通过“私有云计算”处理,该服务采用强加密且不存储用户数据。
Siri在Apple Intelligence中有哪些改进?
Siri获得了更强的自然语言理解、跨请求的上下文记忆能力,支持文本输入交互,并能执行涉及多个应用的复杂操作。
延伸阅读
- Apple Intelligence 官方网站
- 新闻稿 – Apple Intelligence 登陆 iPhone、iPad 和 Mac
- 苹果智能背后模型公布:3B模型优于Gemma-7B,服务器模型媲美GPT-3.5-Turbo
