OpenAI押注无屏交互,语音AI实时对话设备预计明年发布

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
智东西
编译|万贵霞
编辑|王涵
智东西1月5日消息,1月1日,据外媒The Information报道,有知情人士称,OpenAI计划于2026年第一季度推出全新的语音AI模型,而其首款完全通过语音指令操控而非屏幕交互的个人设备,预计仍需一年左右时间才能正式面世。
该设备或为OpenAI CEO萨姆・阿尔特曼(Sam Altman)2025年11月21日访谈中提及的AI硬件产品矩阵中的另一款产品。除单一产品外,OpenAI还在规划一整套设备矩阵,可能包括智能眼镜和无屏幕智能音箱等。
多位ChatGPT员工透露,目前OpenAI的语音AI模型在回复准确性和响应速度上明显落后于文本模型。为此,OpenAI在过去两个月内整合了多个工程、产品和研究团队,对语音AI进行了一次全面重构。
一、语音AI模型架构重塑,更自然、更“像人”的语音对话
OpenAI计划在2026年第一季度初发布的全新语音AI模型,将在音质、延迟和交互方式上进一步逼近真实对话体验,甚至能够在用户说话的同时进行语音播报,呈现更接近“对话伙伴”的状态。
回顾OpenAI在语音方向上的技术演进,2024年其推出的Whisper是一套以高准确率著称的自动语音识别(ASR)系统,主要解决“听懂人说话”的问题;2025年,OpenAI进一步发布了GPT-realtime语音转语音模型,开始探索低延迟、连续对话式的语音交互。这一系列尝试,也为如今全新一代语音AI模型的架构重塑奠定了基础。

▲GPT-realtime功能介绍(来源:OpenAI Platform)
The Information报道称,OpenAI在语音AI模型上的改进已初见成效。新一代模型在架构层面进行了调整,能够生成听感更自然、情绪更丰富的语音回复,同时在回答深度和准确性上也有明显提升。
与现有模型相比,新的语音AI模型可以实现与用户“同步说话”,并在对话中更好地应对打断和插话。这种实时、连续的语音交互能力,是当前语音AI模型尚未具备的。
值得注意的是,驱动语音AI模型的底层大型语言模型,与当前驱动ChatGPT文本回复的模型并不完全相同。
在团队配置上,语音AI项目的关键负责人之一是昆丹·库马尔(Kundan Kumar)。他是一名语音AI研究员,于今年夏天从全球AI陪伴应用“一哥”、美国AI聊天机器人独角兽公司Character.AI加入OpenAI,负责主导相关工作。
此外,项目核心成员还包括产品研究主管本·纽豪斯(Ben Newhouse),他曾推动OpenAI将原本面向文本AI的基础设施重构为支持语音模型,多模态ChatGPT的产品经理杰基·香农(Jackie Shannon)。
二、AI“伴侣型”设备,主动理解环境与用户目标
OpenAI的研究人员正在同步推进一款语音驱动的个人设备,其核心理念是让用户通过语音而非屏幕与AI交互。
据知情人士透露,今年夏天,参与该设备研发的研究人员曾向内部员工展示相关构想:这款AI语音设备将更像是一个与用户并肩工作的伙伴,能够主动提供建议,帮助用户完成目标,而不仅仅是应用程序或软件的语音入口。
在获得用户授权的前提下,该设备可通过语音和视频感知周围环境及用户自身状态,从而提供更具情境感知能力的服务。
目前,已有多名OpenAI员工参与到与该设备相关的不同环节中,包括供应链管理、工业设计以及模型研究等。
在硬件设计层面,据此前智东西报道,OpenAI于2025年5月21日以近65亿美元(约合人民币455亿元)的价格收购了io公司,io团队的大部分成员(约55人)加入OpenAI。io公司由前苹果首席设计官乔纳森·艾维(Jony Ive)联合创立,负责为OpenAI设计这款全新的AI硬件产品。


▲OpenAI发文,io团队已正式加入OpenAI(来源:OpenAI正式)
多位知情人士还透露,OpenAI并不打算只推出单一设备,而是计划分阶段发布一系列产品,内部讨论过的形态包括智能眼镜以及完全无显示屏的智能音箱。
三、无屏交互的前提是先习惯使用语音功能
The Information的报道中提到,OpenAI的研究人员正在开发这款语音驱动的个人设备,是希望用户通过语音而非屏幕进行交互。
这一思路在Al研究界并非个例。包括Thinking Machines Lab在内的不少研究机构都认为,语音是人类最自然的交流方式,人机交互也应回归这一形态。
不过,一位前OpenAI员工提到,目前的现实挑战在于,大量ChatGPT用户并不习惯使用语音功能。原因既可能是语音体验尚不成熟,也可能是部分用户根本不知道ChatGPT支持语音交互。
这意味着,在推出语音优先的硬件产品之前,OpenAI需要先培养用户的使用习惯。
结语:当AI走向“去屏幕化”,下一代设备轮廓初现
在OpenAI的设备设想中,“无屏幕”被视为一项重要设计方向。部分业内人士认为,这种形态有助于降低用户对设备的成瘾程度。
乔纳森·艾维目前正深度参与OpenAI的硬件研发。他曾提到,对他而言,参与这类项目至关重要,因为他认为未来的新型设备,或许是修复过去消费电子产品所带来问题的一种方式。
与谷歌、亚马逊、Meta、苹果等科技巨头类似,OpenAI也在积极布局新一代个人AI设备,包括可穿戴产品。在这些公司看来,当前最主流的设备形态——如iPhone——并未真正为未来的AI能力而设计,而这正是下一轮硬件创新的突破口所在。
来源:The Information、TechCrunch、维基百科
相关攻略
“安装龙虾送Token”“OpenClaw实战应用”“OpenClaw攻防实战”……周六一早,2026全球开发者先锋大会就迎来了汹涌人潮,“龙虾”相关体验区更是人气爆棚,现场一片“百虾大战”的景象。
智东西作者|三北编辑|漠影智东西3月26日报道,刚刚,云知声交出了一张“硬核成绩单”。该公司2025年营收12 1亿元,同比增长29%;其中大模型相关收入达6 1亿元,同比暴涨1076%,首次撑起半
这项由新加坡Knovel工程实验室开展的研究成果,发表于2026年3月17日的arXiv预印本(编号:arXiv:2603 16184v1),为多语言自动语音识别领域带来了令人瞩目的突破。对于那些想
全文共2199字,阅读大约需要5分钟“未来每个人都将拥有专属的人工智能助手,它可通过车载、手机、家居、床头、厨房等各类终端与我们交互”。北京商报记者丨魏蔚2026年全国两会期间,全国人大代表、科大讯
2026年全国两会期间,全国人大代表、科大讯飞董事长刘庆峰的公文包里多了一件特别的 "随行装备 "——一台能装进口袋的智能办公本。这不仅是一台录音设备,更是一个搭载着自主可控大模型的 "随身秘书 ",会议内
热门专题
热门推荐
4月3日消息,今日,vivo年度影像旗舰X300 Ultra正式开售,新机定位专业V单+口袋摄影机,影像能力全面拉满。vivo X300 Ultra配备蔡司大师镜头群,覆盖14mm蔡司超广角、35m
4月2日消息,微软资深Windows工程师Raymond Chen发布长文,呼吁用户和企业IT团队,不要每次在系统出现问题后就第一时间将责任归咎于Windows更新。Chen指出,许多被归咎于每月更
近期,日本玩家围绕卡普空旗下女性角色视觉风格的变迁展开了广泛讨论。有玩家将十年前以当时技术水准塑造的代表性美少女角色玛莉·萝丝,与近年运用最新技术打造的英格丽德进行对比,认为后者在角色表现力上并未体
有多少资深玩家还记得AQUAPLUS旗下那款经典的恋爱冒险作品ToHeart?多年来,关于推出第三部续作的呼声始终不绝于耳。然而,这一计划事实上已被官方终止。近日,该公司社长在一次访谈中透露了项目搁
2026年4月5日,电动自行车行业正面临双重压力:国家层面的以旧换新补贴政策正式退出,叠加原材料成本持续攀升,导致终端售价普遍上调,市场销售明显承压。根据2026年最新实施的消费品以旧换新政策,电动





