谷歌推出可离线使用的 AI 听写应用 Google AI Edge Eloquent,可自动剔除语气词
4月7日,谷歌在iOS平台低调上线了一款新应用,名为“Google AI Edge Eloquent”。这款应用主打离线语音听写,直接对标市场上已有的Wispr Flow、SuperWhisper、Willow等同类产品。
具体来说,应用可以免费下载。用户只需完成一次基于Gemma模型的自动语音识别(ASR)模型下载,就能在手机上开始使用了。它的工作流程相当直观:一边说话,一边就能实时看到转录出的文字。当你按下暂停键,软件的后处理就开始了——它会自动过滤掉那些“嗯”、“啊”之类的口头禅和填充词,并对文本进行初步的润色和优化,让记录下来的内容看起来更整洁。
更实用的是,在转录文本的下方,还提供了几个快捷调整选项,比如“要点”、“正式化”、“精简”和“详细”。点一下,文本就能快速转换成不同的风格和格式,适应邮件、笔记或报告等不同场景。

为了满足对隐私和即时性有要求的用户,这款应用允许关闭云端模式,完全依赖本地设备进行处理。当然,如果你开启云端模式,它则会调用云端更强大的Gemini模型来优化文本。此外,它还能从用户的Gmail账户中学习并导入特定的关键词、联系人姓名和专业术语。用户也可以手动添加自定义词汇表,确保一些行业黑话或特定名称能被准确识别。
管理功能也没落下。应用会完整保存每一次语音转录的会话历史,并且支持全文检索,找起之前的记录来很方便。每次会话结束后,还会贴心地显示一些统计数据,比如上次说了多少单词、每分钟的输入字数以及总发言字数,让你对自己的表达效率有个数。
谷歌在App Store的介绍里毫不谦虚,将其定义为一款“高端语音听写应用”,目标是“打通自然语音与专业、可直接使用的文本之间的壁垒”。介绍中进一步解释,与普通听写软件那种机械的逐字记录不同,Eloquent的核心是依靠AI去理解用户的真实意图。它会自动剔除“嗯”、“呃”等语气词,甚至能处理说到一半的自我修正,最终输出一份整洁、精准的文本。
目前,这款应用还只是iOS用户的专属。不过,细看App Store的介绍页面,里面已经明确提到了安卓版本的存在。

根据描述,安卓版的Eloquent将实现“系统无缝适配”。这意味着它可以被设置为默认键盘,在手机的任何文本输入框里都能随时调用。此外,它还会配备一个悬浮按钮功能,这点和Wispr Flow在安卓端的实现方式很相似,方便用户在任何界面快速启动语音转录,随时记录灵感。
显而易见,随着语音转文本模型的精度和效率不断提升,AI驱动的智能转录应用正成为一个越来越热门的赛道。谷歌此次通过这款试验性应用入局,无疑让这场关于“如何把说的话变成好用的字”的竞争,变得更加有趣了。
