先给出一个核心观点:语音交互正在演变为AI助手的必争之地,而谷歌此次的布局,标志着这场竞赛正式迈入全民化阶段。
就在昨天,谷歌通过X平台发布了一则重磅消息:Gemini Live功能现已通过Gemini应用,面向所有安卓用户开放。没错,是所有安卓设备用户,不再局限于Pixel 9系列。
什么是Gemini Live?简单来说,它是谷歌为AI助手量身打造的“语音对话引擎”。在Pixel 9发布会上首次亮相时,它就展现了与以往截然不同的交互方式——不再是机械的一问一答,而是更接近朋友间的自由聊天。你可以随时打断、继续追问、灵活切换话题,它都能自然衔接。
这样一来,它的对标目标就非常明确:OpenAI的Advanced Voice模式。两者都在探索同一个命题——如何让AI的语音对话更自然、更具情感、更像真人互动。Gemini Live采用增强型语音引擎,在多轮对话的连贯性和情感表达上确实下足了功夫。

当然,当前版本仍带有“早期产品”的痕迹。目前仅支持美国英语语音,但谷歌贴心提供了多种口音选项,例如可以选择英国口音的“Capella”发音。对于追求沉浸式体验的用户而言,这一细节确实加分不少。
安卓版谷歌 Gemini Live 正式开放,助力AI语音聊天迈入全民时代
值得关注的是实际使用体验。根据早期测试者Richard Priday的反馈,Gemini Live在持续对话能力上明显优于其他文本助手。这个评价很有意思——它说明语音交互的真正门槛不在于“能回答”,而在于“能聊下去”。许多AI助手在单轮问答中表现优异,但一旦进入多轮对话,就容易出现上下文断裂、逻辑混乱的问题。从现有信息来看,Gemini Live在这一领域实现了实质性突破。
不过也要提示一点:功能仍在持续优化中,语音响应的准确性和复杂指令的处理能力,还需要更多真实场景的验证。毕竟,从实验室走向日常应用,往往隔着一条不小的鸿沟。
