首页 游戏 软件 资讯 排行榜 专题
首页
iphone
谷歌推出可离线使用的 AI 听写应用 Google AI Edge Eloquent,可自动剔除语气词

谷歌推出可离线使用的 AI 听写应用 Google AI Edge Eloquent,可自动剔除语气词

热心网友
96
转载
2026-04-07

谷歌推出可离线使用的 AI 听写应用 Google AI Edge Eloquent,可自动剔除语气词

4月7日,谷歌在iOS平台低调上线了一款新应用,名为“Google AI Edge Eloquent”。这款应用主打离线语音听写,直接对标市场上已有的Wispr Flow、SuperWhisper、Willow等同类产品。

具体来说,应用可以免费下载。用户只需完成一次基于Gemma模型的自动语音识别(ASR)模型下载,就能在手机上开始使用了。它的工作流程相当直观:一边说话,一边就能实时看到转录出的文字。当你按下暂停键,软件的后处理就开始了——它会自动过滤掉那些“嗯”、“啊”之类的口头禅和填充词,并对文本进行初步的润色和优化,让记录下来的内容看起来更整洁。

更实用的是,在转录文本的下方,还提供了几个快捷调整选项,比如“要点”、“正式化”、“精简”和“详细”。点一下,文本就能快速转换成不同的风格和格式,适应邮件、笔记或报告等不同场景。

谷歌推出可离线使用的 AI 听写应用 Google AI Edge Eloquent,可自动剔除语气词

为了满足对隐私和即时性有要求的用户,这款应用允许关闭云端模式,完全依赖本地设备进行处理。当然,如果你开启云端模式,它则会调用云端更强大的Gemini模型来优化文本。此外,它还能从用户的Gmail账户中学习并导入特定的关键词、联系人姓名和专业术语。用户也可以手动添加自定义词汇表,确保一些行业黑话或特定名称能被准确识别。

管理功能也没落下。应用会完整保存每一次语音转录的会话历史,并且支持全文检索,找起之前的记录来很方便。每次会话结束后,还会贴心地显示一些统计数据,比如上次说了多少单词、每分钟的输入字数以及总发言字数,让你对自己的表达效率有个数。

谷歌在App Store的介绍里毫不谦虚,将其定义为一款“高端语音听写应用”,目标是“打通自然语音与专业、可直接使用的文本之间的壁垒”。介绍中进一步解释,与普通听写软件那种机械的逐字记录不同,Eloquent的核心是依靠AI去理解用户的真实意图。它会自动剔除“嗯”、“呃”等语气词,甚至能处理说到一半的自我修正,最终输出一份整洁、精准的文本。

目前,这款应用还只是iOS用户的专属。不过,细看App Store的介绍页面,里面已经明确提到了安卓版本的存在。

谷歌推出可离线使用的 AI 听写应用 Google AI Edge Eloquent,可自动剔除语气词

根据描述,安卓版的Eloquent将实现“系统无缝适配”。这意味着它可以被设置为默认键盘,在手机的任何文本输入框里都能随时调用。此外,它还会配备一个悬浮按钮功能,这点和Wispr Flow在安卓端的实现方式很相似,方便用户在任何界面快速启动语音转录,随时记录灵感。

显而易见,随着语音转文本模型的精度和效率不断提升,AI驱动的智能转录应用正成为一个越来越热门的赛道。谷歌此次通过这款试验性应用入局,无疑让这场关于“如何把说的话变成好用的字”的竞争,变得更加有趣了。

来源:https://www.ithome.com/0/936/311.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

2026谷歌I/O大会开发者主题演讲精华回顾
科技数码
2026谷歌I/O大会开发者主题演讲精华回顾

GoogleI O2026开发者大会聚焦AI智能体生态进化,发布了性能更强的Gemini3 5模型并升级Antigravity平台。新工具支持高效编排智能体、简化全栈开发流程,并提供托管与自定义两种部署路径。Android开发引入智能体调用工具与迁移助手,Web领域则推出新标准与工具,旨在提升智能体任务执行效率与开发体验。

热心网友
05.24
谷歌就反垄断裁决提起上诉 称搜索成功源于创新而非排他协议
业界动态
谷歌就反垄断裁决提起上诉 称搜索成功源于创新而非排他协议

谷歌就反垄断裁决提起上诉,坚称其搜索市场主导地位源于产品创新、持续投入与努力,而非排他协议。谷歌认为苹果选择其作为默认搜索引擎是自主商业决策,且未损害竞争,要求法院撤销此前要求其开放数据等整改措施。

热心网友
05.23
谷歌与XREAL合作推出XR眼镜真机首秀年内全球量产
科技数码
谷歌与XREAL合作推出XR眼镜真机首秀年内全球量产

谷歌与XREAL合作的ProjectAuraAR眼镜在I O2026大会上首次公开实机体验,并宣布年内量产。该设备搭载AndroidXR系统,融合GeminiAI能力,实现空间计算与物理世界的连接。其硬件采用自研芯片与光学技术,展示了三维绘画等交互场景。双方合作旨在推动AR生态发展,加速轻量化设备进入消费市场。

热心网友
05.21
谷歌高管反思Google Glass失败原因 时尚比技术更关键
AI资讯
谷歌高管反思Google Glass失败原因 时尚比技术更关键

谷歌高管总结GoogleGlass失败教训,认为消费级穿戴设备中时尚比技术更重要。新一代AndroidXR眼镜因此与时尚品牌合作,强调外观与实用并重。初代产品曾因价格高昂、功能单一而遇冷。如今谷歌借助AI与生态协同寻求突破,未来计划推出搭载专用安卓系统的带屏版本。

热心网友
05.21
谷歌Nano Banana 2实测14图融合角色一致性表现如何
AI资讯
谷歌Nano Banana 2实测14图融合角色一致性表现如何

谷歌NanoBanana2在角色一致性上实现突破,能通过14张参考图融合稳定锚定角色与物体特征,支持跨图像语义对齐。该技术适用于系列插画、品牌资产批量生成等场景,通过固定种子、调节权重等协同控制确保输出稳定。其强项在于结构保真与特征复用,但在复杂交互、动态流体及长文本渲染方面仍有局限。

热心网友
05.21

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

AI Agent能力进化平台 水产市场实用技能全解析
AI资讯
AI Agent能力进化平台 水产市场实用技能全解析

水产市场是什么 在AI Agent的生态中,能力共享与协同进化是核心驱动力。水产市场(Seafood Market)正是为OpenClaw框架量身打造的AI Agent能力共享平台。你可以将其理解为AI领域的“应用商店”或“技能交易中心”,旨在实现AI能力的快速流通与组合创新。 目前,平台已集成超过

热心网友
05.24
MeowTXT AI音视频转文字工具 智能识别说话人
AI资讯
MeowTXT AI音视频转文字工具 智能识别说话人

在信息爆炸的时代,高效地将音视频内容转化为可编辑、可检索的文字,已经成为内容创作者、研究者和职场人士的刚需。今天要聊的这款工具——MeowTXT,正是瞄准了这一痛点,它不仅仅是一个简单的转录工具,更是一个集成了智能识别、摘要和翻译的AI生产力平台。 MeowTXT是什么 简单来说,MeowTXT是一

热心网友
05.24
开源AI Agent操作系统OpenFang自动执行完整工作流
AI资讯
开源AI Agent操作系统OpenFang自动执行完整工作流

OpenFang是什么 在AI Agent领域,我们常常面临一个困境:大多数系统仍然停留在“你说一句,它动一下”的被动模式,离真正的自动化还有距离。今天要聊的OpenFang,正是在尝试打破这个局面。它是一个用Rust语言构建的开源Agent操作系统,其核心创新在于引入了“Hands”的概念——你可

热心网友
05.24
腾讯混元开源全模态大模型压缩工具包AngelSlim详解
AI资讯
腾讯混元开源全模态大模型压缩工具包AngelSlim详解

AngelSlim是什么 随着大模型参数规模不断增长,如何实现高效推理与低成本部署已成为开发者面临的核心挑战。腾讯混元团队推出的开源工具包AngelSlim,正是为解决这一难题而生。它是一个面向全模态大模型的综合压缩与加速解决方案,集成了量化、投机采样、稀疏化及知识蒸馏等前沿技术,旨在为各类大语言模

热心网友
05.24
AI音视频转录工具Transcript LOL 智能区分说话人
AI资讯
AI音视频转录工具Transcript LOL 智能区分说话人

在信息过载的数字化时代,音频与视频内容已成为知识传递、创意表达与商业沟通的核心载体。然而,如何将这些宝贵的非结构化媒体资产,高效、精准地转化为可搜索、可分析、可编辑的文本格式,始终是内容创作者、市场研究人员、学者及商务人士的核心痛点。一款强大的AI转录工具,正是打通音视频内容价值闭环、释放生产力潜能

热心网友
05.24