融资5.6亿AI语音新星被谷歌收购,核心团队入职DeepMind

智东西
编译|万贵霞
编辑|云鹏
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
智东西1月23日消息,谷歌正在通过“引入团队+技术授权”的方式,加速补齐Gemini在语音与情感理解上的短板。
据TechCrunch与美国《连线》昨日报道,谷歌旗下DeepMind已与AI语音初创公司Hume AI达成授权合作协议。Hume AI创始人兼CEOAlan Cowen将与约7名核心工程师加入DeepMind,直接参与Gemini语音与情感智能的研发。
这笔交易并非整体收购,根据Hume AI新任CEO Andrew Ettinger的说法,谷歌获得了Hume AI全部知识产权的非独家使用权,相关技术将被整合进谷歌的模型研发流程,而Hume AI公司主体仍将独立运营,并继续向其他AI实验室提供服务。
Hume AI的核心优势在于“情感智能”语音模型,该公司专注于通过语音信号识别用户情绪与心理状态。2024年其推出“共情语音接口”(Empathetic Voice Interface),并已累计融资约8000万美元(约合人民币5.6亿元),预计今年营收可达1亿美元(约合人民币7亿元)。
谷歌此次引入其核心团队,被视为在语音体验上正面迎战ChatGPT语音模式的关键一步。
一、核心团队加入DeepMind,主打“情感智能”的语音模型
据报道,Hume AI创始人兼前CEOAlan Cowen将与多名工程师加入谷歌DeepMind,主要任务是帮助谷歌将语音与情感智能整合进其前沿模型,提升Gemini在自然对话和情绪理解方面的能力。

▲Hume AI创始人Alan Cowen(图源:Alan Cowen个人 )
Cowen本人拥有心理学博士背景,这也被认为是Hume在“情感建模”方向上的重要优势。
此次交易的具体金额尚未披露。Hume AI新任CEO、投资人兼科技高管Andrew Ettinger告诉TechCrunch记者,谷歌获得了Hume AI全部知识产权的非独家使用权,相关技术将被整合进谷歌的研发流程,但公司并未被整体出售。

▲Andrew Ettinger继任Hume AI CEO的消息(图源:领英Andrew Ettinger个人主页)
Hume AI将继续对外提供技术服务,并计划在未来几个月内发布新模型。Ettinger预计,Hume AI有望在今年实现约1亿美元的营收目标。
Hume AI成立以来,始终聚焦一个相对细分但潜力巨大的方向——理解人类语音中的情绪与心理状态。
2024年,Hume AI推出“共情语音接口”,其核心能力在于通过语音信号判断用户的情绪变化,并据此调整回应方式。与传统语音助手侧重指令识别不同,Hume的模型试图解决“用户当下处于什么状态”这一问题。

▲Hume AI正式页面(图源:Hume AI正式)
WIRED报道中提到,Hume AI在模型训练过程中投入了数百万美元,通过专家标注大量真实对话中的情绪线索,使模型能更精细地区分语气、语调与情绪变化。
PitchBook数据显示,Hume AI目前累计融资约8000万美元,投资方包括AEGIS Ventures等机构。
二、谷歌补齐Gemini语音短板,语音赛道全面升温
对谷歌而言,引入Hume AI团队并不意外。近年来,谷歌持续推进Gemini Live功能,允许用户以语音方式与AI进行连续对话。
上个月,谷歌还发布了面向Live API的原生音频模型,强调其在复杂流程处理方面的能力。但在“自然度”和“情感感知”层面,Gemini仍面临来自OpenAI等对手的压力。

▲谷歌Gemini Live API概览(图源:谷歌Cloud)
在此背景下,Hume AI团队被视为一个“即插即用”的补强方案。多位匿名消息人士向WIRED透露,Cowen及其团队将在谷歌内部,专注于将情感智能深度嵌入新一代模型。
Hume AI并非孤例。过去一年,语音能力正在成为AI厂商投入资源最多的方向之一。
本月初,AI语音生成公司ElevenLabs披露,其年度经常性收入(ARR)已突破3.3亿美元(约合人民币23.1亿元),显示出市场对高质量语音技术的真实需求。
与此同时,OpenAI被曝正在与前苹果设计师Jony Ive团队合作开发一款主打音频功能的个人设备,为今年发布做准备。近期泄露的消息说,该设备可能是一款耳塞。
Meta同样在加速布局。去年,Meta收购语音初创公司Play AI,其Ray-Ban智能眼镜已越来越依赖语音输入,在嘈杂环境下实现通话、信息与多媒体控制。投资人Vanessa Larco直言:“在可穿戴设备上,语音几乎是唯一可行的输入方式。”

▲Ray-Ban智能眼镜(图源:Reddit)
结语:“授权+挖人”成为常态,语音成为AI的“下一层接口”
值得注意的是,Hume AI的交易再次触及一个监管敏感问题:“收购式招聘”。与直接并购公司不同,大型科技公司通过引入初创团队、获取技术授权,往往可以绕开传统并购所需的反垄断审查。
类似案例已多次出现,谷歌此前以授权方式引入Character AI相关技术;微软招募了Inflection团队;亚马逊引入Adept核心人员;Meta则挖走了Scale AI的CEO。
从当前趋势来看,语音正在演变为AI与人类交互的核心入口。对科技公司而言,理解“说了什么”只是第一步,更重要的是理解“为什么这样说”“说话时的情绪状态是什么”。
随着语音、情感与多模态能力进一步融合,AI的竞争焦点正在从模型参数规模,转向真实交互体验的细节层面。
来源:《连线》杂志、TechCrunch
相关攻略
谷歌TurboQuant算法遭中国博士后质疑,论文争议点深度剖析 近日,AI模型压缩领域发生了一场引人关注的学术风波。事件的起因是谷歌研究院在3月25日重磅发布的全新极端压缩算法TurboQuant。该技术旨在破解大语言模型推理过程中的核心瓶颈——键值缓存(KV Cache)所导致的庞大内存占用问题
新智元报道编辑:倾倾【新智元导读】全世界都在等ASI降临,OpenAI却在年初悄悄上线广告位。9亿用户撑不起数百亿美元的算力账单,智力正在贬值,神仙也得下凡赚钱!2025年底,一份名为ChatGPT
谷歌Willow量子处理器启动限时早期访问,加速商业应用落地 近期,谷歌在量子计算领域的连续动作引发了业界广泛关注,其商业化节奏明显提速。从中性原子计算路径的探索,到后量子加密技术部署时间表的提前,一系列进展均显示出强烈的推进意图。而最新发布的 Willow 量子处理器限量早期访问计划,更被视为其从
谷歌 Pixel 手机将推“通勤模式”:智能优化公共交通出行体验 科技领域的最新动向显示,谷歌即将为其 Pixel 智能手机引入一项备受期待的新功能——“通勤模式”(Transit Mode)。该功能旨在深度优化用户在乘坐地铁、公交等公共交通工具时的手机使用体验,帮助乘客在嘈杂或拥挤的环境中更好地管
12 月 9 日消息,科技媒体 Android Authority 今天(12 月 9 日)发布博文,通过拆解谷歌翻译(Google Translate)安卓版 v9 29 安装包代码,发现了多项
热门专题
热门推荐
末日生存手游推荐:前往九游开启你的废土冒险之旅 近年来,末日生存题材手游以其独特的沉浸感与生存挑战,持续吸引着大量玩家。在废墟世界中探索资源、应对危机、重建秩序的核心玩法,带来了紧张而富有成就感的游戏体验。如果你正在寻找一款高品质的末日生存手游,九游平台无疑是理想的起点。这里汇集了多款深受好评的末日
《纪念碑谷3》第二关“小镇”超详细图文攻略 《纪念碑谷》系列凭借其独特的视觉艺术与空间谜题设计广受赞誉。最新发布的《纪念碑谷3》在第二章节“小镇”中,将这一美学风格与机关逻辑提升到了新的层次。本章节不仅延续了标志性的极简主义美学,其空间层次感与交互严谨性也更具挑战性。本攻略将为你完整解析《纪念碑谷3
《生存33天》:“沙漠之王”高效通关攻略 在热门生存手游《生存33天》中,玩家面临的挑战远不止于无尽的丧尸潮。游戏深度结合了生存资源管理与高难度首领战策略,其中“沙漠之王”堪称游戏中期最具考验的BOSS。它不仅是实力分水岭,击败后更能获得稀有材料、限定头衔及海量经验金币,大幅推动队伍成长。本文将深入
《生存33天》“四只手”首领完全通关攻略 你是否在“四只手”首领关卡止步不前?不必焦虑,这个Boss在《生存33天》中素有“新秀杀手”之称。初次遭遇时,其独特的机制与高额伤害往往让玩家措手不及,不少冒险者在此耗费了数日时光。然而,只要掌握了它的核心规律,你就会发现这个敌人不过是外强中干。以下这份详尽
《剑与远征:启程》前排坦克英雄赫普深度解析:双形态切换机制与实战搭配指南 在《剑与远征:启程》这款策略放置手游中,组建一支攻守兼备的队伍至关重要,而前排坦克英雄的选择往往是决定胜败的关键。今天,我们将聚焦于蛮血部族的一位特色英雄——赫普。作为一名超稀有品质的坦克,赫普不仅具备坚实的防御力,更凭借独特





