最近,豆包APP的实时语音通话功能迎来了一次关键的“内核升级”——全双工语音大模型Seeduplex正式上线。官方信息显示,这是一个原生全双工端到端语音大模型,能够在复杂声学环境下实现精准抗干扰与动态判停。简单来说,它的目标就是让AI语音交互变得更加顺畅、自然,更贴近人与人之间的真实对话。
从实际体验来看,这次更新在对话的自然度、响应速度和抗干扰能力等几个核心维度上,确实带来了可感知的提升。
首先值得关注的是它在复杂环境下的“定力”。在餐厅、展厅这类人声嘈杂的典型场景里,以往AI语音助手很容易被背景聊天声或噪音“带跑偏”,出现误打断用户、或者误响应他人指令的尴尬情况。实测发现,升级后的豆包在这方面表现得更加稳健,能更精准地聚焦当前用户的语音信号,对无关声音的过滤能力有所增强,整个对话过程因此更少受到意外干扰。
除了“听清”,更关键的是“听懂”对话的节奏。人与人交流时,短暂的停顿常常是思考或换气的自然过程,并不总意味着发言结束。此次升级的一大亮点,就是豆包能结合语音信号和语义信息,更智能地判断用户是“暂时停顿”还是“发言完毕”,从而有效减少对话中AI“抢话”的情况。这让交互的节奏感更加舒适自然。
与此同时,对话的响应时延也得到了进一步优化。这一点在接龙、飞花令这类需要快速高频互动的场景中表现得尤为明显——AI的回复更加即时,几乎感觉不到明显的等待间隙,交互的流畅感显著提升。
目前,搭载了Seeduplex模型的实时语音通话功能已在豆包APP内全面上线。用户只需在应用内点击“打电话”按钮,即可开始体验这种更自然、更抗干扰的语音交互。

