首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
OpenAI推出三款实时语音模型实现GPT5级别推理能力

OpenAI推出三款实时语音模型实现GPT5级别推理能力

热心网友
29
转载
2026-05-08

语音交互的体验,又要被改写了。最近,OpenAI 正式向开发者开放了三款全新的实时语音模型:GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper。这可不是一次简单的功能更新,而是直指语音交互领域几个长期存在的“老大难”问题——高延迟、无法自然打断、多语言支持薄弱。看来,AI 巨头这次是打算从技术底层,彻底重塑我们与机器对话的方式。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

GPT-Realtime-2:不只是助手,更是实时协作者

这次发布的核心,无疑是 GPT-Realtime-2。官方将其定位为目前最智能的 AI 语音模型,更重要的是,它被称作首个具备 GPT-5 级别推理能力的语音工具。这意味着什么?

简单来说,未来的语音助手可能不再是那个你说一句、它干一件的“呆板执行者”了。GPT-Realtime-2 在保持对话极度自然流畅的基础上,核心突破在于能进行复杂的实时逻辑推理,并灵活调用外部工具。比如,你可以在描述一个多步骤任务时随时补充细节或改变主意,它能精准识别你的打断或纠正,并实时调整后续的思考和行动路径。这背后的潜台词是,语音交互正从“简单响应”迈向“深度实时理解与协作”。

当然,强大的能力也对应着相应的成本。GPT-Realtime-2 的音频输入定价为每百万 Token 32 美元(约合软妹币 218 元),输出费用为 64 美元(约合软妹币 436 元)。不过,对于缓存输入的处理,成本则大幅降低至每百万 Token 仅 0.4 美元。

翻译与转录:专精领域的极致体验

除了核心的推理模型,另外两款功能性产品同样瞄准了具体的痛点场景。

GPT-Realtime-Translate 主打实时翻译,其性能相当强悍。它支持高达 70 种输入语言与 13 种输出语言的即时互译,关键是速度——翻译结果几乎能与说话者的语流同步。这种级别的实时性,让跨国会议、即时商务洽谈等高要求场景的沟通壁垒被大幅削弱。

另一款 GPT-Realtime-Whisper 则专注于流式转录,追求“音随人动”的低延迟体验。它极大压缩了从语音到文本的等待时间,对于需要实时会议记录、即时字幕生成的场景来说,效率提升是显而易见的。

在计费上,这两款模型采取了更灵活的按分钟计费模式,GPT-Realtime-Translate 每分钟 0.034 美元,GPT-Realtime-Whisper 则为每分钟 0.017 美元。

从这一系列动作不难看出,OpenAI 正在系统性地构建其语音交互的技术护城河。当语音 AI 不仅能“听清”、更能“听懂”并“实时思考”时,它所开启的,或许是一个远比我们想象中更自然的、人机协同的新阶段。行业的游戏规则,恐怕又要被重新定义了。

来源:https://news.aibase.com/zh/news/27773
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

马斯克前女友出庭作证 曾提议奥特曼加入特斯拉董事会
科技数码
马斯克前女友出庭作证 曾提议奥特曼加入特斯拉董事会

马斯克与OpenAI的法律交锋本周迎来关键庭审。随着新证据不断浮出水面,这场备受瞩目的诉讼案变得愈发复杂,其中一些证据与马斯克此前的证词存在明显出入,让案件的最终走向充满了不确定性。 本周三,与马斯克育有四名子女的希冯·齐利斯出庭作证。她曾担任OpenAI董事会成员,并一度是马斯克与OpenAI管理

热心网友
05.08
OpenAI芯片项目进展受阻 博通与微软要求包销四成产能才肯投资
业界动态
OpenAI芯片项目进展受阻 博通与微软要求包销四成产能才肯投资

OpenAI自研芯片计划“Nexus”正面临关键融资挑战,其摆脱对英伟达依赖的战略路径遭遇现实考验。作为项目核心合作伙伴,芯片制造商博通(Broadcom)提出了明确的前置条件:只有微软承诺包下首批芯片产能的40%,博通才愿意进行实质性投资。这一要求使得OpenAI的芯片自主化进程陷入微妙博弈。 代

热心网友
05.08
OpenAI推出可信联系人功能用人工智能构筑自残预防新防线
业界动态
OpenAI推出可信联系人功能用人工智能构筑自残预防新防线

为了给人工智能的安全防护再加一道“锁”,OpenAI在5月7日正式上线了一项名为“可信联系人”的新功能。简单来说,这项功能的核心,就是利用AI的监测能力,为那些可能身处心理危机中的用户,铺设一条额外的“数字生命线”。 那么,这条“生命线”具体如何运作呢?根据官方说明,当OpenAI的自动化系统以及背

热心网友
05.08
郭明錤预测OpenAI手机2027年量产 出货量或达3000万台
AI
郭明錤预测OpenAI手机2027年量产 出货量或达3000万台

知名分析师郭明錤更新预测,OpenAI的AI智能体手机量产时间从2028年提前至2027年上半年。预计2027至2028年合计出货量近3000万台。设备将搭载联发科定制芯片、双NPU架构及先进存储,并引入硬件级安全技术强化AI数据保护。OpenAI加速布局或因IPO需求及市场竞争加剧,其硬件项目可能重塑移动设备交互体验。

热心网友
05.08
币安注册指南:解析马斯克与OpenAI股权争议及火星计划影响
web3.0
币安注册指南:解析马斯克与OpenAI股权争议及火星计划影响

马斯克曾要求控制OpenAI以支持其火星城市融资计划,但遭拒绝后退出。如今OpenAI与SpaceX均计划于2026年公开上市,后者更将火星殖民目标写入治理章程。马斯克同时整合旗下AI公司xAI与SpaceX,强化AI领域布局。投资者需关注头部企业战略动态、平衡风险配置并理解技术趋势,以把握科技变革中的机遇。

热心网友
05.08

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

飞利浦显示器生产日期与保修期查询方法
电脑教程
飞利浦显示器生产日期与保修期查询方法

飞利浦显示器生产日期与保修政策完全解读 选购显示器,除了参数和价格,售后保障同样是关键。飞利浦显示器的机身标签上,你找不到具体的生产日期和保修起止时间,这常常让用户心里犯嘀咕。别担心,这套体系其实相当严谨:每一台设备都拥有唯一的序列号,它就是这台显示器的“身份证”。通过官方渠道查询这个号码,所有的出

热心网友
05.08
游戏键盘中文系统支持选购全攻略
电脑教程
游戏键盘中文系统支持选购全攻略

游戏键盘怎么选?关键就三点:匹配游戏类型、契合操作习惯、兼容系统生态 这事儿其实挺有意思,选游戏键盘就像给武器做适配。FPS玩家追求的是极致的瞬时反应,所以低延迟、紧凑布局和线性轴体那种干净利落的触发感,就成了刚需。MOBA或者MMO玩家呢,战场在另一维度,他们更需要全键无冲的保障、可以一键连招的宏

热心网友
05.08
怎样解除JBL蓝牙设备配对教程
电脑教程
怎样解除JBL蓝牙设备配对教程

JBL蓝牙设备取消配对,其实是这么一回事 很多人可能会把“取消配对”和“断开连接”搞混。简单来说,断开连接只是一次断开本次通信,配对记录还在设备里存着,下次靠近可能又自动连上了。而取消配对,本质上是让你手里的手机或电脑,主动清除掉它本地存储的关于那个JBL设备的“身份证”和配对密钥。这操作不会损伤音

热心网友
05.08
海尔滚筒洗衣机筒自洁功能操作步骤详解
电脑教程
海尔滚筒洗衣机筒自洁功能操作步骤详解

海尔滚筒洗衣机“桶自洁”功能:一键深度洁净全指南 想轻松搞定洗衣机内筒的清洁?海尔滚筒洗衣机的“桶自洁”功能可以帮大忙。整个流程简洁明了,只需三步:通电开机,旋钮找到那个专属程序,然后按下启动键。这个功能的核心,在于海尔自家的高温水流循环系统和智能温控算法。它能在60℃到90℃的范围内精准控温,配合

热心网友
05.08
欧易OKX安卓版App官方下载 最新v9.0.76版本安全安装指南
web3.0
欧易OKX安卓版App官方下载 最新v9.0.76版本安全安装指南

对于安卓用户来说,获取一个安全、官方的数字资产交易客户端至关重要。欧易OKX最新推出的v9 0 76安卓版App,已全面适配Android 5 0及以上系统,不仅提供实时的币币交易与合约下单功能,还能确保现货行情时刻刷新,是进行全球数字资产管理的可靠工具。 一、通过欧易OKX官网直接下载 最稳妥的方

热心网友
05.08