EMO机器人:自学对口型,精准模拟真人表情告别面瘫
1月17日,科技媒体New Atlas发布文章,报道了机器人面部表情系统的最新突破。哥伦比亚大学创意机器实验室研发的名为EMO的系统,致力于让仿人机器人的面部表情和语音达到自然、流畅的同步效果,从而有效克服“恐怖谷”效应中的关键挑战。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

系统演示(图源:哥伦比亚大学创意机器实验室)
与依赖预先编程的传统机器人不同,EMO具备自主学习能力。它通过观察人类的面部行为来优化自身表达,使其交互体验更加生动自然,甚至接近科幻作品中的设定。
为了实现接近真实人类的质感,EMO并未使用刚性外壳,而是在其面部覆盖了一层柔软的硅胶皮肤。在这层皮肤之下,研究团队精密部署了26个微型电机。
这些电机通过不同的组合方式协同工作,能够细腻地牵引皮肤,从而呈现出微妙的面部表情并精确控制唇形变化。这种硬件架构赋予了EMO极高的表达自由度,使其能够模拟出从微笑、惊讶到沉思等多种复杂神态。
为了教会EMO控制面部表情,研究团队引入了“视觉-动作”语言模型。在训练初期,团队将EMO置于镜前,让其自发进行数千次随机的面部运动。
EMO通过摄像头观察镜中的自己,分析每一次电机指令与最终呈现的面部表情之间的因果关系。这个过程类似于人类婴儿通过模仿和观察来学习控制肌肉,从而让机器人建立起内在的“本体感受”模型。
在建立了基础运动模型后,EMO进入了进阶训练阶段。这台机器人观看了数小时人类说话和唱歌的视频资料。系统通过分析视频中的音频特征及其对应的口型变化,学习将听觉信号与视觉信号进行映射。
结合之前建立的VLA模型,EMO最终实现了在播放合成语音的同时,实时生成高度吻合的唇部动作。它甚至能在发声前几毫秒预判并预先调整口型。
尽管EMO在处理“B”、“W”等闭唇音时仍存在一些细微瑕疵,但其核心架构已展现出巨大潜力。研究人员指出,随着训练数据的不断增加,这些问题将逐步得到改善。未来,团队计划将EMO与先进的对话式AI进行整合,以探索更自然的人机互动。
相关攻略
你是否想过,当人类面对面交流时,我们的注意力更多地被放在哪里?第一直觉或许是眼睛。它们是心灵的窗户,能够传达出细微而生动的情感。科学研究也证实的确如此,在日常对话中,我们会频繁地注视对方的眼睛来捕捉
来源:科技日报美国哥伦比亚大学科学家设计出一种新型框架,使人形机器人面部能够根据音频生成逼真的唇部动作,实现与人类语音的同步。该技术还展示了较强的泛化能力,可推广至包括法语、汉语和阿拉伯语在内的多种
IT之家 1 月 17 日消息,科技媒体 New Atlas 今天(1 月 17 日)发布博文,报道称哥伦比亚大学创意机器实验室(Creative Machines Lab)研发名为 EMO 的机器
12月16日,即梦AI网页版官宣全面升级,打造一站式“AI片场”。此次升级核心是即梦AI最新视频生成能力“视频 3 5 Pro”,基于字节自研模型Seedance 1 5 pro,在即梦AI全球首发
热门专题
热门推荐
3月28日消息,中国联通近日发布2025年度业绩报告,在网络建设领域交出亮眼答卷。中国联通表示,公司持续落实信号升格、宽带升级相关举措,目前近九成宽带已具备千兆接入能力,万兆光网更在全国100多个城
163邮箱个人版登录入口为https: mail 163 com,支持网页及手机浏览器直接访问,提供手机号、邮箱账号、扫码三种登录方式,界面简洁,功能齐全,适配多终端使用。163
在冒泡社区中,设置键盘能为用户带来更便捷、舒适的操作体验。以下是详细的设置方法。首先,打开冒泡社区应用程序。进入社区主界面后,找到屏幕上的设置选项。这通常可以在界面的某个角落,以一
一场谎言的终幕是崩坏星穹铁道中4 1版本的新光锥之一,其属性可以提高装备的暴击率,下面小编就为大家带来《崩坏:星穹铁道》一场谎言的终幕光锥效果一览,不清楚的一起来看看吧。《崩坏:星
2026年3月28日中午12时整,由腾讯视频全网独播的古装奇幻剧《白日提灯》准时上线。该剧开播前预约人数高达674万人次,被平台力推为“年度古偶扛鼎之作”,然而仅播出六小时后,口碑便急速崩塌,引发全





