OpenAI双向语音模型:打断也能秒回应,对话流畅更自然
3月7日最新消息显示,OpenAI正在秘密研发一款突破性的语音交互模型,目标是让用户与ChatGPT的对话体验更接近真人交流的流畅度。这项技术的核心创新在于:当用户在对话过程中突然打断系统发言时,AI能够实时调整回应内容,彻底改变现有语音模式那种突兀中断的交互体验。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
目前ChatGPT的高级语音模式采用回合制对话机制,用户必须完整说完一段话,AI才会开始处理语音并生成答复。如果在AI发言时插入"好的"或"嗯"这类简短回应,系统通常会直接停止响应,无法像真实对话那样持续深入交流。
为解决这一痛点,OpenAI正在开发的BiDi(双向语音模型)能够持续处理说话者的语音输入,因此在被打断时可以立即调整回应策略。相比之下,现有语音模型一旦开始生成答复,输出内容就基本固定,无法根据新的输入进行动态调整。
这项前沿技术目前仍处于开发阶段。据知情人士透露,原型模型在持续对话几分钟后容易出现故障,有时甚至会发出不自然的机械音。OpenAI研发团队原本希望在今年第一季度发布BiDi模型,但最新消息显示发布时间可能会推迟到第二季度或更晚。
OpenAI认为,如果语音模型在响应速度上能接近文本模型,AI的应用场景将进一步扩展,因为大多数用户更习惯通过语音与AI交流,而非手动输入文字。BiDi模型在客服场景中尤其具有应用价值,能够显著提升人机对话的自然度。
举例来说,当顾客与零售商的AI客服通话时,如果顾客在对话过程中临时决定选择换货而非退货,BiDi模型理论上可以让AI客服顺畅调整对话方向,不会出现突然中断或逻辑混乱的情况。
知情人士还透露,BiDi模型在调用外部工具和应用方面也更为灵活。OpenAI此前表示,公司计划为未来主打语音交互的AI设备优化语音模型,并考虑开发一款智能音箱,通过语音指令即可查看邮件或预订服务。

相关攻略
3月24日,人工智能领域迎来了一次沉重的转折。美国开放人工智能研究中心(OpenAI)在社交媒体上正式发布公告,宣布关停旗下人工智能视频生成工具Sora,这款明星产品,在历经两年的高光与挣扎后,正
OpenAI还能不能 回到 最初 的 样子 , 保持 初心 、 做出正确的取舍?文|晓静编|徐青阳文章来源|腾讯科技(ID:qqtech)2026年3月24日,OpenAI宣布关停Sora。这是Op
软银斥资400亿美元桥接贷款押注OpenAI,贷款结构本身或已透露华尔街对这家AI巨头上市时间表的判断。软银集团周五宣布,已获得一笔400亿美元的桥接贷款,用于支持其对OpenAI的投资承诺及一般企
IT之家 3 月 28 日消息,据《商业内幕》今天报道,最新解封的法庭文件显示,特斯拉 CEO 马斯克曾在去年 2 月提出 OpenAI 收购邀约之前,向 Meta CEO 马克 · 扎克伯格询问是
硅谷最昂贵的视觉神话,倒在IPO前夜。AIX财经(AIXcaijing)原创作者 | 陈丹编辑 | 魏佳毫无预兆,OpenAI按下了Sora的停止键。2026年3月24日,OpenAI正式发布声明,
热门专题
热门推荐
惠普部分型号支持主板集成RAID功能,用户可在系统启动阶段进入RAID配置环境,完成磁盘阵列的创建与维护操作。1、 开机过程中,根据屏幕提示,同时按下 Ctrl + I 组合键,即
F5公司已发布解决方案指南,强烈建议各组织立即遵循最新缓解步骤。 美国网络安全和基础设施安全局(CISA)已将新披露的F5 BIG-IP系统漏洞纳入其已知已利用漏洞(KEV)目录,警告该漏洞正在真实
helium10 chrome插件怎么安装?helium10浏览器扩展安装故障排查解答在电商运营的世界里,helium10可是一款相当强大的工具。而它的chrome插件安装,对于很
3月29日消息,据报道,此前,许先生以所在公司名义花费85万元购置了一辆玛莎拉蒂,后续在苏州某玛莎拉蒂4S店完成维保及延保办理。2019年5月,该车行驶中突发熄火故障,送至该4S店检修后,店方告知需
幻兽帕鲁中的帕鲁农场充满了奇幻与趣味,吸引了众多玩家想要体验。那么,它该如何下载安装呢?接下来为大家详细介绍。首先,要确定你的设备系统是否支持。幻兽帕鲁目前支持多种主流移动设备系统





