AI机器人EMO自学口型模拟,精准告别面瘫式表情
1月17日,科技媒体 New Atlas 发布文章,介绍了哥伦比亚大学创意机器实验室(Creative Machines Lab)的最新成果。该团队成功研发出一款名为 EMO 的机器人面部系统,它有望攻克仿人机器人领域的一大难题——让机器人的唇形变化与语音实现精准同步,从而有效缓解“恐怖谷”效应。

与需要预先编程的传统机器人不同,EMO 具备强大的自我学习能力。它能够通过观察人类的行为来不断优化自己的面部表达方式,使其交互体验更接近《西部世界》中的科幻设定。
EMO 没有采用刚性的金属外壳,而是覆盖了一层柔软的硅胶皮肤,质地十分接近真人。在这层皮肤之下,研究团队精巧地部署了 26 个微型电机(即致动器)。
这些电机通过不同组合的协同运作,能够精细地牵引皮肤,从而呈现出微妙的面部表情并控制唇形变化。这种硬件架构为 EMO 提供了极高的自由度,使其能够模拟出从微笑到惊讶等多种复杂神态。
为了让 EMO 掌握控制面部的技巧,研究团队引入了“视觉-动作”(Vision-to-Action, VLA)语言模型。在训练初期,团队将 EMO 置于镜前,让其随机进行数千次面部运动。
EMO 通过摄像头观察镜中的自己,分析电机指令与最终面部表情之间的因果关系。这一过程类似于人类婴儿通过模仿和观察自我来学习控制肌肉,使机器人建立了内部的本体感观模型。
在建立了基础运动模型后,EMO 进入了进阶训练阶段。该机器人观看了数小时人类说话和唱歌的视频,系统通过分析视频中的音频特征与对应的口型变化,映射听觉信号与视觉信号。
结合此前建立的 VLA 模型,EMO 最终实现了在发出合成语音的同时,实时生成高度吻合的唇部动作,甚至能在发声前几毫秒预判并调整口型。
尽管 EMO 目前在处理“B”和“W”等闭唇音时仍存在细微瑕疵,但其核心架构已展现出巨大潜力。研究人员指出,随着训练数据的增加,这些问题将逐步得到解决。未来,团队计划将 EMO 与 ChatGPT 或 Gemini 等先进的对话式 AI 进行整合。
相关攻略
面对资源紧张等时代挑战,爱普生提出“省、小、精”发展理念,旨在以更少资源创造更高价值。其依托精密技术,在工业自动化、数字印刷及教育等领域提供解决方案,提升效率并减少环境负担。该理念支撑着企业实现可再生电力使用与碳中和的长期愿景,推动可持续发展。
智元公司发布新一代机器人运控基座模型BFM-2,赋予机器人“肌肉记忆”。该模型使机器人能在任何姿态下自主进行高稳定性动作插补,实现动态任务闭环控制,提供更可靠灵活的运动基础。演示显示,搭载该模型的机器人被推倒后可迅速流畅地自行站起,并在过程中主动维持身体平衡。
杭州柯林计划以不超过3亿元收购上海开普勒机器人41 57%股权,实现控股。开普勒由行业资深人士创立,聚焦工业场景,订单超4700万元,但近期营收有限且处于亏损。当前具身智能赛道融资火热,估值飙升,但行业分化加剧,缺乏商业路径的项目面临挑战。
美国媒体探访北京一处机器人训练中心,中国正系统性培训机器人进入劳动力市场。训练师通过动作捕捉等技术引导机器人学习分拣等技能,数据将联网共享以应对复杂环境。机器人已开始在餐饮、零售等行业试岗,目标是与人类协作完成危险或重复性劳动。
京东与擎天租达成战略合作,上线机器人租赁旗舰店。双方将围绕产品方案共建、渠道供应链赋能展开合作,提供多款机器人及场景化租赁套餐,旨在降低使用门槛,推动机器人即服务模式向消费市场普及。此次合作致力于将机器人服务标准化,并拓展至更广泛的线下应用场景。
热门专题
热门推荐
在追求极致效率的现代软件开发中,一款名为Cursor的AI代码编辑器正引领着开发范式的变革。它被定义为“面向未来的IDE”,其核心理念清晰而有力:将人工智能深度无缝地集成到编码工作流的每一个步骤,为开发者创造一种前所未有的“AI结对编程”体验。 Cursor sh应用场景 那么,这款AI驱动的编辑器
在众多AI图像生成工具中,WHEE凭借其精准的产品定位与持续的功能迭代,正成为越来越多设计师和内容创作者的首选工具。它专注于打造高品质的AI视觉素材生成器,核心使命就是帮助用户快速、高效地获得可直接使用的优质图片素材。 那么,这款AI绘图工具究竟有哪些核心优势?下面我们从其关键特性与功能设计进行深入
在AI绘画工具不断涌现的当下,一款名为NightCafe Creator的应用以其全面的AI艺术生成能力脱颖而出。它不仅是一个简单的图片处理工具,更是一个融合了多种前沿人工智能技术的创意平台,帮助用户轻松实现从构思到成品的艺术创作。 NightCafe Creator是什么? NightCafe C
近期加密货币市场受到宏观经济不确定性及流动性紧缩影响,比特币(BTC)、以太坊(ETH)以及多种山寨币出现明显下行走势,市场情绪趋于谨慎。 比特币近期走势分析 比特币的价格近期表现如何?简单来说,它跌破了几个市场公认的关键支撑位,而且伴随交易量的放大。这种放量下跌的信号,往往意味着多空分歧加剧。无论
蔡司宣布将于6月2日发布一款新镜头,并称其为镜头技术的重大突破,标志着全新纪元的开启。官方仅公布了产品剪影,但措辞暗示其可能带来根本性的技术升级,例如全新光学结构、先进镀膜或对焦系统改进。具体细节需待发布日揭晓。





