首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
OpenAI发布语音模型可实时推理翻译与转录

OpenAI发布语音模型可实时推理翻译与转录

热心网友
84
转载
2026-05-12

OpenAI正式发布三款革命性的实时语音模型,旨在为开发者构建下一代语音应用提供强大支持。这些模型凭借各自独特的能力,有望彻底改变人机语音交互的体验。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

OpenAI推出全新语音模型,能在说话同时推理、翻译和转录

这意味着,开发者现在可以利用这些先进的工具,打造出响应更快、更智能、更自然的语音应用,满足用户日益增长的需求。

三款模型,三种核心能力

根据OpenAI官方介绍,此次推出的三款全新语音模型及其核心功能分别是:

GPT-Realtime-2:这是首个具备GPT-5级别高级推理能力的实时语音模型。它能够深入理解复杂的用户请求,并以高度拟人化的方式推进多轮对话,标志着语音助手在智能化程度上实现了重大飞跃。

GPT-实时翻译:一款专为跨语言沟通设计的实时翻译模型。其强大性能体现在能够将超过70种输入语言的语音,几乎无延迟地同步翻译成13种输出语言,翻译节奏与说话者的语速完美匹配。

GPT-Realtime-Whisper:专为流式语音识别优化的新工具。它能够在用户说话的同时完成高准确率的实时语音转文字,这将让实时字幕生成、会议纪要同步、语音笔记等功能的体验变得极其流畅和高效。

深度解析:新特性意味着什么?

OpenAI重点解读了旗舰模型GPT-Realtime-2。这款为实时对话而优化的模型,其根本性突破在于内置的“实时推理”能力。它不仅保障对话的连贯性,还能在交流过程中动态分析用户意图、灵活调用工具、智能处理用户的中断或修正,并给出最贴合语境的回应。这推动语音助手从执行简单指令的工具,进化成为真正能理解和思考的协作伙伴。

而实时翻译模型的突出优势在于其广泛的语种支持和近乎为零的延迟,使得无缝的跨语言实时交流成为现实,极大降低了沟通壁垒。

至于语音转录模型GPT-Realtime-Whisper,其核心价值在于极低的延迟。可以预见,线上会议的发言实时转成文字记录,或视频内容同步生成精准字幕,都将变得更加轻松易得。

接入方式与定价策略

目前,这三款全新的语音模型均已通过OpenAI的实时语音API向开发者开放接入。具体的收费方案如下:

GPT-Realtime-2:采用按token用量计费,音频输入每百万token收费32美元(缓存输入的token价格为每百万0.40美元),音频输出每百万token收费64美元。

GPT-实时翻译:采用按使用时长计费,价格为每分钟0.034美元。

GPT-Realtime-Whisper:同样按使用时长计费,价格为每分钟0.017美元。

从定价结构可以看出,OpenAI针对不同计算复杂度和资源消耗的应用场景提供了灵活的选择。随着这些模型被广泛集成与应用,我们即将迎来由下一代智能语音交互技术所驱动的产品变革。

来源:https://www.163.com/dy/article/KSD0IVRM0519U3I5.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

美国防部与七家AI巨头达成合作协议
科技数码
美国防部与七家AI巨头达成合作协议

美国防部与SpaceX、OpenAI等七家顶尖AI公司达成协议,将其技术部署至军方机密网络,以提升AI工具运用能力并拓宽合作版图。Anthropic因供应链风险未参与。目前国防部内部AI平台用户已超130万,凸显军方对AI技术的依赖日益加深。

热心网友
05.12
OpenAI将推出AI手机挑战苹果预计2028年量产
业界动态
OpenAI将推出AI手机挑战苹果预计2028年量产

OpenAI迈出了堪称最“激进”的一步。 近日,天风国际证券分析师郭明錤透露,OpenAI正在自研手机,将与联发科、高通合作开发手机处理器,立讯精密为独家系统协同设计与制造商,预计2028年量产。 图源:社交媒体截图 当硬件创新难以催生质变级体验,“AI”正被整个手机行业视为驱动下一轮换机潮的核心引

热心网友
05.12
OpenAI推出ChatGPT图像生成2.0 印度用户增长领先全球
业界动态
OpenAI推出ChatGPT图像生成2.0 印度用户增长领先全球

OpenAI这周四公布了一组挺有意思的数据:自上周发布以来,他们最新的图像生成工具ChatGPT Images2 0,其最大的用户群体竟然在印度。这款工具主打处理复杂指令和生成带有多语言精确文字的精细图片,算是OpenAI在多模态交互上又往前扎了一步。 不过,全球市场的反应有点冷热不均。根据Sens

热心网友
05.12
OpenAI将推出ChatGPT专用智能手机
业界动态
OpenAI将推出ChatGPT专用智能手机

科技行业近期迎来重磅消息:据知名分析师郭明錤最新报告披露,OpenAI正加速布局其首款智能手机产品,预计将于2027年初正式投入量产。与市场常见的贴牌合作模式不同,这款手机将深度定制联发科天玑9600旗舰处理器,旨在通过底层硬件与AI技术的深度融合,重新定义下一代智能设备的交互体验。 在影像能力方面

热心网友
05.12
OpenAI发布语音模型可实时推理翻译与转录
科技数码
OpenAI发布语音模型可实时推理翻译与转录

OpenAI发布三款全新实时语音模型。GPT-Realtime-2具备高级推理能力,能处理复杂对话;实时翻译模型支持超70种语言互译,延迟极低;GPT-Realtime-Whisper专为流式转录设计,响应迅速。三款模型均已通过API开放,采用按token或使用时长的差异化计费模式,旨在推动语音应用体验革新。

热心网友
05.12

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

赛车方向盘按键功能详解与高效设置指南
游戏资讯
赛车方向盘按键功能详解与高效设置指南

初次接触赛车模拟器,或是观看职业赛事的方向盘特写镜头,你一定会被那些密集排列的旋钮与按键所吸引。这绝非单纯的视觉装饰,每一个控件都承载着在毫秒间精准调控车辆动态的关键使命。从牵引力控制到刹车平衡,从引擎图谱到实时数据,这些为极速盲操而生的设计,正是区分业余爱好者与专业车手的重要标志。熟练掌握其功能并

热心网友
05.12
OKX欧易新手教程:USDT购买入金下单划转正确顺序详解
web3.0
OKX欧易新手教程:USDT购买入金下单划转正确顺序详解

本文介绍了在OKX欧易平台首次购买USDT的完整流程,重点强调了入金、下单、划转三个关键步骤的正确顺序。内容涵盖了从法币充值到币币交易,再到资产划转至资金账户的详细操作与注意事项,旨在帮助新手用户理清逻辑,避免因操作顺序错误导致交易失败或资金滞留,实现顺畅的首次加密货币购买体验。

热心网友
05.12
Malady退赛1W核心赛S1原因解析 专注备战BLAST Slam S7
游戏资讯
Malady退赛1W核心赛S1原因解析 专注备战BLAST Slam S7

Dota 2 7 41c版本现已更新,对于希望使用五号位英雄上分的玩家而言,当前环境中有几位英雄的表现尤为突出。根据Yandex战队职业选手Malady在最新视频中的深度解析,发条技师、工程师以及树精卫士,均是此版本中极具上分潜力的强势辅助选择。 除了分享强势辅助英雄推荐,Malady也透露了队伍近

热心网友
05.12
电竞世界杯2026年举办地或将改为法国
游戏资讯
电竞世界杯2026年举办地或将改为法国

近日,一则关于2026年电竞世界杯可能更换举办地的消息在电竞社区引发热议。据独联体知名爆料人harumi透露,原定于沙特阿拉伯利雅得举行的本届赛事,存在将主办地转移至法国的可能性。这一潜在变动,无疑为这项全球顶级电竞赛事的最终落地增添了新的看点与悬念。 目前,电竞世界杯赛事组委会尚未对此传闻发布任何

热心网友
05.12
OKX官网网址真伪识别教程 如何安全访问欧易交易所与帮助中心
web3.0
OKX官网网址真伪识别教程 如何安全访问欧易交易所与帮助中心

本文介绍了在访问OKX(欧易)平台时,如何准确识别其官方网站、帮助中心及处理页面跳转问题。重点分析了官方域名的核心特征与常见后缀,并提供了遇到非官方页面时的安全验证步骤与处理建议,旨在帮助用户有效规避风险,确保资产与信息安全。

热心网友
05.12