首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
OpenAI研发懂人双向语音模型,对话更自然

OpenAI研发懂人双向语音模型,对话更自然

热心网友
47
转载
2026-03-06

内容源自环球网

根据The Information在3月6日的报道,人工智能领域的领先企业OpenAI正在研发一款名为BiDi的双向语音模型。这款新模型的研发目标,是优化用户与ChatGPT进行语音对话时的交互体验,让机器与人的交流听起来更接近真实、自然的人际沟通模式。据称,BiDi模型能够在对话被打断时,实时调整自己的回应内容,实现更流畅的双向交谈。

当前ChatGPT的高级语音模式采用的是回合式对话机制,这在交互体验上存在一定的局限性。用户需要完整表达完毕,模型才会开始处理语音并生成回答;如果在模型发言过程中,用户发出类似“okay”或“mm-hm”的回应,甚至直接打断,系统往往会立刻停止发言,无法像正常人际对话那样流畅地衔接和继续。


此次推出的BiDi双向语音模型,其核心突破在于能够持续处理说话者的语音输入。与现有语音模型一旦开始生成答复,输出内容便基本固定、无法根据新输入调整的特点不同,BiDi模型在对话中被用户打断时,可以立即根据新的语音信息来动态调整回应内容,从而实现更为流畅的实时交互。

不过,这项技术目前仍处于开发阶段,尚未完全成熟。有了解项目情况的人士透露,BiDi原型模型在持续对话数分钟后容易出现故障,还可能产生听起来不够自然的声音。原研发团队曾计划在今年一季度推出该模型,但目前的发布时间很可能已推迟至第二季度甚至更晚。

OpenAI方面认为,如果语音模型的性能能够逐步接近文本模型,人工智能的应用范围将得到进一步拓展。原因在于,语音交流是大多数人更习惯的交互方式,相比于文字输入,语音交互能够降低使用门槛,使AI技术触及更广泛的用户群体。

从实际应用场景来看,BiDi双向语音模型极具想象空间,尤其在客户服务领域的表现值得期待。例如,顾客在与零售商的AI客服对话时,若在交流中临时改变需求,比如将退货改为换货,BiDi模型能让AI客服流畅地调整对话逻辑,避免出现突然停顿或回应混乱的状况,从而有效提升服务效率与用户体验。此外,该模型在调用外部工具和应用方面,也具备更高的灵活性。

据了解,OpenAI此前已透露相关规划,计划为未来一款主打语音交互的AI设备优化其语音模型,还考虑开发智能音箱类产品,用户通过语音指令,即可实现查收邮件、预订服务等操作。而此次BiDi双向语音模型的研发,或将为相关产品的落地提供关键的技术支撑。(作者:纯钧)

来源:https://www.163.com/dy/article/KNB7M0KB0514R9OJ.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

警惕人工智能依赖 避免大脑能力退化
业界动态
警惕人工智能依赖 避免大脑能力退化

科学家警告,过度依赖人工智能可能削弱创造力与批判性思维,类似GPS损害方向感。研究显示,AI替代需“认知摩擦”的思考过程,或导致认知能力衰退。专家建议应有意识使用AI,使其成为思维“扩音器”而非替代品,例如先自主判断、加深信息处理、主动创意构思,以保护并锻炼大脑独特能力。

热心网友
05.18
松鼠 Ai 入选时代全球百大影响力企业 开启个性化教育新纪元
业界动态
松鼠 Ai 入选时代全球百大影响力企业 开启个性化教育新纪元

松鼠Ai凭借多模态智适应教育大模型入选《时代》2026全球百大最具影响力企业。该系统能精准诊断学生薄弱点并动态调整学习路径,推动个性化教育规模化落地。其已服务超4300万学生,并计划进军美国市场,展现中国AI教育解决方案的国际影响力与全球化愿景。

热心网友
05.18
三星电子工会宣布将按计划举行罢工行动
AI
三星电子工会宣布将按计划举行罢工行动

三星电子工会坚持推进罢工,此举可能影响全球半导体供应链稳定性,为产业格局增添不确定性。

热心网友
05.18
2026年全球GEO优化服务商精选与五大平台商业应用指南
业界动态
2026年全球GEO优化服务商精选与五大平台商业应用指南

随着生成式AI平台流量增长,生成式引擎优化(GEO)成为企业数字营销核心战略。服务商通过技术整合帮助品牌在AI对话中提升可见性与推荐权重,打通高质量流量入口。企业需考量需求契合、行业适配及效果量化,其深层价值在于让品牌内容成为AI采信的权威信源,构建长期品牌资产。

热心网友
05.18
腾讯混元Hy3预览版实测体验不追榜单专注实用能力提升
AI
腾讯混元Hy3预览版实测体验不追榜单专注实用能力提升

这周国产大模型领域可谓热闹非凡,阿里Qwen 3 6 Max、月之暗面Kimi 2 6、DeepSeek V4等新品接连登场,箭在弦上。在这波发布潮中,腾讯的混元Hy3 preview也于昨日正式亮相。值得注意的是,这是由腾讯首席AI科学家姚顺雨主导的第一代模型,其定位从一开始就非常清晰:不追求榜单

热心网友
05.18

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

警惕人工智能依赖 避免大脑能力退化
业界动态
警惕人工智能依赖 避免大脑能力退化

科学家警告,过度依赖人工智能可能削弱创造力与批判性思维,类似GPS损害方向感。研究显示,AI替代需“认知摩擦”的思考过程,或导致认知能力衰退。专家建议应有意识使用AI,使其成为思维“扩音器”而非替代品,例如先自主判断、加深信息处理、主动创意构思,以保护并锻炼大脑独特能力。

热心网友
05.18
谷歌阿里微软云端AI决战 云电脑迎来行业新机遇
业界动态
谷歌阿里微软云端AI决战 云电脑迎来行业新机遇

谷歌推出云端AI驱动的安卓电脑,重塑PC形态。当前AIPC多依赖云端算力,本地硬件价值受质疑。云电脑与AI结合成为新方向,对网络延迟更宽容。谷歌联合硬件伙伴推进该方案,阿里等云服务商也已布局。传统芯片、终端厂商及微软、苹果正以不同策略应对AIPC趋势。未来竞争将聚焦云端能力、系统重构与生态协。

热心网友
05.18
企业数字化转型全流程解析:从战略规划到AI智能体落地
业界动态
企业数字化转型全流程解析:从战略规划到AI智能体落地

结论先行:在2026年的商业环境中,企业数字化转型方法的核心不再是单纯的IT系统堆砌,而是“业务流程自动化”与“AI智能化”的深度融合。成功的数字化转型方法论应遵循“小步快跑、场景切入、数据驱动”的原则,利用AI Agent(智能体)技术打通烟囱式系统,实现平滑升级,而非推倒重来。 一、 拒绝假大空

热心网友
05.18
产品设计软件推荐与选择指南
业界动态
产品设计软件推荐与选择指南

面对琳琅满目的产品设计软件,许多设计师和团队都在追问:究竟哪一款才是最好的选择?然而,真正的答案并非一个简单的软件名称,而是一套基于您具体工作流程的适配逻辑。本文将为您系统解析,如何跳出“最好”的迷思,找到最“对”的那款工具,从而最大化团队效率与产出价值。 核心决策逻辑 首先,我们必须确立一个核心原

热心网友
05.18
跨境电商售后难题的智能客服解决方案
业界动态
跨境电商售后难题的智能客服解决方案

跨境电商的售后环节,本质上是客户信任的二次考验。当问题出现时,初次交易建立的信任已然动摇,若处理不当,将直接导致客户永久流失。因此,构建一套真正高效的售后体系,必须实现三大核心目标:响应速度需如本地支付般即时;处理规则需预先设定,实现小额纠纷的自动化化解;最终,所有流程数据必须形成闭环,驱动供应链的

热心网友
05.18