首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
OpenAI发布三款实时语音模型支持推理对话与实时翻译转录

OpenAI发布三款实时语音模型支持推理对话与实时翻译转录

热心网友
18
转载
2026-05-20

OpenAI近期发布的三款全新实时语音模型,再次将人工智能与语音交互的融合推向新高度。GPT‑Realtime‑2、GPT‑Realtime‑Translate以及GPT‑Realtime‑Whisper的推出,并非简单迭代,而是针对不同垂直场景提供了一套专业且完整的语音AI解决方案,旨在彻底革新人机对话体验。

作为核心旗舰模型,GPT‑Realtime‑2被定位为首款具备GPT‑5级别推理能力的实时语音AI。它的突破在于能够进行复杂的上下文理解与多轮对话管理,以接近人类的反应速度进行持续、自然的交流。该模型支持在用户说话的同时进行实时思考,不仅能灵活调用外部工具,还能智能处理对话中的打断、纠正等动态交互,从而将智能语音助手的自然度和实用性提升至全新水平,为开发高级语音应用提供了强大引擎。

专注于解决跨语言沟通难题,GPT‑Realtime‑Translate是一款专业的实时语音翻译模型。它支持超过70种输入语言与13种输出语言,旨在实现接近“同声传译”的低延迟翻译效果。无论是国际商务会议、跨国客户服务,还是实时直播与内容本地化,该模型都能显著降低语言壁垒,保障交流的即时性与流畅性,是构建全球化语音应用的关键工具。

针对语音转文本这一基础需求,GPT‑Realtime‑Whisper是一款高性能的实时流式转录模型。其核心优势是极低的延迟,能够在音频流输入的同时,几乎实时地生成精准的文字记录。这使其非常适用于需要即时字幕的场景,如视频直播、在线会议、远程教学以及实时访谈记录等。通过提供高效可靠的语音识别基础能力,该模型能够显著提升各类应用的响应速度与用户体验。

在接入与商业化层面,OpenAI已将这三款模型全面整合至其Realtime API服务平台。GPT‑Realtime‑2采用Token计费模式,每百万输入Token收费32美元,输出为64美元。而GPT‑Realtime‑Translate和GPT‑Realtime‑Whisper则按分钟计费,价格分别为每分钟0.034美元和0.017美元。目前,开发者已可通过官方Playground进行测试,并能够便捷地将其集成到现有的产品或服务中,快速部署高质量的实时语音功能。

从文本生成到多模态交互,再从异步处理迈向实时智能,生成式AI的发展路径日益清晰。OpenAI此次密集发布实时语音模型套装,正是这一趋势下的关键举措。它不仅为开发者提供了更细分、更强大的工具选择,也预示着基于实时语音交互的智能应用,如智能客服、实时翻译、会议助手等,即将进入大规模创新与普及的新阶段。

核心要点总结:

• GPT‑Realtime‑2 拥有高级推理与上下文理解能力,可实现拟人化实时对话交互。

• GPT‑Realtime‑Translate 提供多语言低延迟翻译,打造同声传译级沟通体验。

• GPT‑Realtime‑Whisper 具备高速流式转录能力,是直播字幕与会议记录的理想选择。

来源:https://www.aibase.com/zh/news/27760
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

OpenAI推出算力保障服务长期合约享折扣锁定容量应对紧缺
AI资讯
OpenAI推出算力保障服务长期合约享折扣锁定容量应对紧缺

OpenAI近期正式发布了名为“保证容量”(Guaranteed Capacity)的全新服务方案,旨在帮助企业客户提前锁定未来一至三年的AI计算资源。在当前全球算力供应持续紧张的背景下,这项服务相当于为企业提供了一张长期稳定的“算力保障票”。 根据官方披露的细则,该服务的运行机制清晰直接:客户可自

热心网友
05.20
OpenAI内部文件曝光 Ilya Sutskever披露70页机密信息
AI资讯
OpenAI内部文件曝光 Ilya Sutskever披露70页机密信息

一份由OpenAI前首席科学家伊尔亚·苏茨克维秘密备份的70页内部文件,连同他超过200页的私人笔记,近日被《纽约客》杂志曝光。文件披露的细节堪比谍战片:偷拍关键内容、刻意绕过公司内部系统、使用阅后即焚的方式传递信息。而其中最核心的指控,直指公司首席执行官山姆·奥特曼——文件援引多方证据指出,其诚信

热心网友
05.20
OpenAI收购脱口秀公司背后的战略布局
AI资讯
OpenAI收购脱口秀公司背后的战略布局

刚刚拿下史上最大融资的OpenAI,转身就收购了一家视频播客?这操作着实让不少人摸不着头脑。 就在刚刚,OpenAI正式宣布收购科技脱口秀节目「TBPN」。官方给出的理由是,旨在加速全球范围内围绕人工智能的交流与讨论。 单从粉丝体量看,TBPN并非大众意义上的“顶流”:其在推特(X)平台拥有约32

热心网友
05.20
GPT5仅用18分钟破解黑洞方程效率远超人类科学家
AI资讯
GPT5仅用18分钟破解黑洞方程效率远超人类科学家

2026年,科学研究的范式正在悄然改变。人工智能,这位曾经的“辅助工具”,如今正以“合作者”的身份,深度介入从数学证明到黑洞物理的前沿探索。它带来的不仅是效率的提升,更是一种思维模式的拓展——科学加速的时代,已然拉开序幕。 从三个夜晚到一页证明:AI如何成为数学家的“思维翻跟斗” 数学,被誉为科学的

热心网友
05.20
欧盟拟依据数字服务法对OpenAI实施严格监管
AI资讯
欧盟拟依据数字服务法对OpenAI实施严格监管

欧盟的监管目光,正聚焦于ChatGPT。据路透社4月10日报道,欧盟委员会已启动一项评估,核心议题是:ChatGPT是否应被认定为《数字服务法》(DSA)框架下的“大型在线平台”,从而接受更严格的监管。 这一审查的触发点,是OpenAI主动披露的用户规模数据。根据DSA规定,月活跃用户数超过4500

热心网友
05.20

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

AI文档助手理想编审选择指南
AI教程
AI文档助手理想编审选择指南

人工智能的浪潮正席卷每个角落,智能办公工具无疑是其中备受瞩目的弄潮儿。以自然语言处理和机器学习为内核的AI文档助手,承诺用高效与精准重塑我们的文字工作。但一个值得玩味的问题随之浮现:它究竟是一场碘伏传统的革命性创新,还是更像一位得力的职业伙伴? AI文档助手的革命性创新 不得不说,AI文档助手的出现

热心网友
05.20
北电数智星火AI云2.0发布 AI系统工程如何重塑产城发展新范式
AI资讯
北电数智星火AI云2.0发布 AI系统工程如何重塑产城发展新范式

2026年5月13日至14日,备受瞩目的Create 2026百度AI开发者大会将在北京隆重举行。本届大会以“万物一体”为核心主题,并实现了一项重要升级:首次将“Create百度AI开发者大会”与“云智大会”全面合并。此次整合旨在为参会者提供一站式、全景式的洞察体验,无论是关注AI基础设施的企业决策

热心网友
05.20
雷蛇鸣潮达妮娅联名外设系列将于2026年5月20日正式发售
科技数码
雷蛇鸣潮达妮娅联名外设系列将于2026年5月20日正式发售

雷蛇与《鸣潮》联名的达妮娅主题外设系列将于2026年5月20日推出,涵盖无线鼠标、机械键盘、电竞椅和超大鼠标垫四款产品。系列兼顾轻量化设计、高性能硬件与角色主题元素,致力于为玩家打造兼具操作性能与沉浸氛围的全方位游戏体验。

热心网友
05.20
极限竞速地平线6评测 开放世界赛车游戏进化详解
科技数码
极限竞速地平线6评测 开放世界赛车游戏进化详解

《极限竞速:地平线6》登陆Xbox与PC平台,首次将舞台设定于日本。本作画质显著提升,以丰富细节呈现东京霓虹、樱花林与山间晨雾。玩法上重构开局身份,玩家需从普通访客逐步成长为传奇车手,并引入庄园系统与探索乐趣。游戏对硬件性能要求较高,但借助DLSS4等技术可实现画质与流畅度的平衡。

热心网友
05.20
AI表格制作教程:零基础一键生成动态数据图表
AI教程
AI表格制作教程:零基础一键生成动态数据图表

人工智能正改变传统表格制作方式,通过自然语言指令自动生成表格与图表,显著提升工作效率。人机协作虽带来便利,确保数据准确性仍是关键。未来更智能的预测功能值得期待,但使用者仍需掌握数据分析基本功,以充分释放数据价值。

热心网友
05.20