苹果在最新的 iOS 27 开发者测试版本中,为 iPhone 17 Pro、iPhone Air 等机型引入了新一代高级 AI 语音转写功能。不过,这项功能默认处于关闭状态,想要体验的用户需要进入系统设置手动开启。

据苹果官方介绍,此次推出的 AI 听写系统在识别准确率上实现了“显著提升”。特别是在实时处理大小写转换、自动添加标点符号等细节方面,比现有听写系统更加可靠,目标非常明确——全面提升语音输入的整体体验。
这一效果的背后,依赖于一套全新的模型:AFM 3 Core Advanced。这是一款拥有 200 亿参数的原生多模态系统,采用稀疏架构设计。其巧妙之处在于,虽然参数总量庞大,但在具体执行请求时,仅会激活其中的 10 亿至 40 亿个参数,从而在性能与算力消耗之间达到了良好的平衡。
为了在手机这类设备中部署如此大规模的模型,苹果将完整模型存储在闪存中,而非传统的 DRAM。处理流程上,首先通过一个轻量级的“路由模块”在初始阶段选定一组固定的“专家”子网络,随后在生成过程中还会周期性重新选择。苹果将这项技术命名为“Instruction-Following Pruning”,即指令跟随剪枝。
在苹果内部进行的人工并行评测中,他们将 AFM 3 Core Advanced 与之前量产版听写系统在七个质量维度上做了对比。结果显示,在整体质量维度上,新模型以 44.7% 对 17.6% 的比例获得了明显的偏好优势。而且这一优势贯穿所有维度——无论是标点符号、大小写、版式,还是语义捕捉、口语赘词处理以及风格,新模型的表现都基本一致地更为出色。
当然,优秀功能往往设有门槛。由于模型体积与算力要求较高,升级后的听写功能目前仅对少数新款设备开放。支持的机型包括:iPhone 17 Pro、iPhone 17 Pro Max、iPhone Air、搭载 M5 芯片的 Apple Vision Pro、配备 M4 及以上芯片且至少拥有 12GB 运行内存的 iPad,以及配备 M3 及以上芯片且至少拥有 12GB 运行内存的 Mac。值得留意的是,标准版 iPhone 17 被排除在支持列表之外,原因很简单——它仅配备 8GB 运行内存,未达到苹果设定的 12GB 门槛。与此同时,苹果推出的可自定义表达风格的新一代 Siri 语音,同样基于这套 AFM Core Advanced 模型,目前也以可选预览功能的形式呈现,需要用户主动开启。
苹果特别强调,新的听写模型完全在本地运行。这意味着无论 iPhone 是否联网,转写质量都保持一致。同时,用户的语音数据无需上传至云端,对隐私保护而言是一个加分项。
至于等到 iOS 27 正式版发布时,这个高级 AI 听写功能是继续保持默认关闭,还是在后续测试版周期中就改为自动启用,苹果目前尚未确认,还需等待后续更新。
