游乐游手机版
首页/业界动态/文章详情

谷歌Gemini 3.5实时语音翻译支持70多种语言延迟仅数秒

时间:2026-06-11 14:12
Google推出Gemini3 5LiveTranslate,支持70多种语言实时语音到语音翻译,延迟仅几秒,并尽力保留说话人语调。已通过API和AIStudio开放,GoogleTranslate逐步上线。该能力从产品功能转为模型能力,任何应用均可嵌入,同时带来伪造风险,Google用SynthID水印标识。

先说一个刚确认的消息:6月10日,Google正式推出了Gemini 3.5 Live Translate,将实时语音到语音翻译打造为可供开发者直接调用的模型能力。该功能支持70多种语言,延迟控制在数秒内,译后的语音会尽可能保留说话人原有的语调、语速和音高。目前已在Gemini Live API和Google AI Studio中对开发者开放,Google Translate的Android和iOS端也逐步开始上线。

变化不在翻译本身,在入口

Google在实时翻译领域并非刚刚起步。但过去的体验往往被限制在特定硬件上——Pixel手机、Pixel Buds或者某个特定App。是否能使用,完全取决于你手里的设备是哪一款。

这次真正的变化在于:将“听到一种语言、实时说出另一种语言”从产品功能升级为模型能力。系统会自动检测输入语言,并对语音流进行持续处理,无需等待对方说完一整句才行动。Google表示,模型会在“获取更多上下文”与“尽快输出跟上节奏”之间不断权衡,因此译后语音通常会比原声延迟几秒钟。

这意味着,任何应用都能嵌入这一能力。跨国电话、视频会议、旅行问路、在线课程——翻译不再是一个独立的App,而是变成了一个随时可用的开关。

保留语气会提升可用性,也放大冒充风险

这次更新中最容易被用户感知的一点是:译后语音不再只是机械地朗读翻译结果,而是尽量听起来像同一个人在用另一种语言表达——语调、节奏、音高都得到了尽力保留。

好处非常直接。客服电话、网约车沟通、在线教学等场景中,语气和停顿本身就是关键信息。过去的TTS式朗读让对话显得生硬,如今保留语气后,更接近“有人在旁边帮你转述”的自然感。

风险也同样明显。译后语音越接近真人,就越容易被用来伪造对话、冒充身份、制造误导音频。Google表示会嵌入SynthID水印来标识AI生成内容。但问题是,水印在经过转录、压缩、转发、二次录音后是否仍能稳定识别,还需根据后续实际检测效果来判断。

谁先受影响

首先是经常跨语言沟通的人群。跨国团队开会、海外旅行、跨境客服,不再需要额外翻译设备,只要常用工具接入了这个API,翻译就会成为默认选项。

其次是小型团队和应用开发者。过去要实现实时语音翻译,需要自行串联语音识别→机器翻译→语音合成→低延迟传输。现在一条API调用即可解决,多语言客服、直播翻译、会议工具的开发门槛将显著降低。

至于翻译从业者,影响则更为复杂。专业同传依赖背景知识、临场判断和高准确率,短期内仍不可替代。但大量“不要求逐字精确、只要求马上听懂”的场景会被分流。真正的边界不在于模型是否能翻译一句话,而在于长对话、强口音、专业术语、多人抢话时它是否还能保持稳定。

演示不等于日常

Google没有公布可供比较的准确率数据。覆盖70多种语言说明应用范围扩大了,但不同语言之间的质量差异可能相当大——低资源语言、方言、口音、专业术语,每一个都是潜在难点。

目前的演示音频都来自受控环境。地铁站、咖啡馆、多人同时说话的电话会议,才是真正的检验场。Gemini 3.5 Live Translate的意义在于,它将实时语音翻译推向了更开放的产品入口;它能否从“令人惊艳”进化为“足够可靠”,还需要等待真实场景中大规模使用的实际验证。

来源:https://www.163.com/tech/article/KV2ELGA400097U7T.html
上一篇市集经营数字化 从固定摊位费到自动抽佣 下一篇宝马3系裸车20万奔驰E级28万 豪华车价格跳水
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
中关村论坛年会AI未来论坛聚焦跃迁投资共生
业界动态 · 2026-06-30

中关村论坛年会AI未来论坛聚焦跃迁投资共生

3月30日,中关村国际创新中心成为人工智能领域瞩目的焦点——2026中关村论坛年会人工智能主题日的重要活动“AI未来论坛:跃迁·投资·共生”在此正式拉开帷幕。本次论坛传递出一个清晰的信号:人工智能正从技术突破迈向产业落地的关键阶段,而资本信心的背后,映射出产业演进的明确风向。海淀区明确表态,将以开放

泰国CP AXTRA与菜鸟合作复制中国闪购模式
业界动态 · 2026-06-30

泰国CP AXTRA与菜鸟合作复制中国闪购模式

3月27日,菜鸟集团与泰国正大集团旗下核心零售企业CP AXTRA正式签署战略合作协议。此次合作的核心目标十分明确:菜鸟将充分发挥自身在数字供应链技术、仓储自动化领域的技术优势,以及多年深耕海外仓的运营经验,全力支持CP AXTRA在泰国及东盟国家打造一套线上线下一体化的即时零售物流网络。 CP A

云英谷科技VTDR6135参评SID中国区显示行业奖
业界动态 · 2026-06-30

云英谷科技VTDR6135参评SID中国区显示行业奖

云英谷科技携国内首颗支持1 5KRealRGB显示的AMOLED驱动芯片VTDR6135参评SID中国区显示行业奖。该芯片已量产并用于高端手机,采用28nm制程,支持240Hz刷新率,集成自研APDBI技术与烧屏补偿机制。在ICDT2026大会C06展位展示。

马斯克警告柏林工厂扩张受外部干预需保自主
业界动态 · 2026-06-30

马斯克警告柏林工厂扩张受外部干预需保自主

3月1日消息,特斯拉CEO埃隆·马斯克向柏林工厂的员工传递了一个信号:如果工厂无法在“不受外界干扰”的环境下自主运转,那么后续的扩建计划可能需要延后。这番话源自一段提前录制的视频,由马斯克在得克萨斯州奥斯汀与格伦海德工厂厂长安德烈·蒂里格共同完成录制,随后在柏林超级工厂内部播放给员工观看。 这段视频

高通钱堃博鳌谈构建用户中心智能生态
业界动态 · 2026-06-30

高通钱堃博鳌谈构建用户中心智能生态

高通钱堃指出,AI正重塑人机交互,2026年称为智能体之年。6G被设计为AI原生系统,2026年为标准化关键年,高通已与近60家伙伴达成共识。高通构建以用户为中心的智能生态系统,通过端-边-云协同架构,结合5G 6G技术,并推出AI加速计划,推动个人、物理、工业AI规模化应用。