美团开源LongCat视频生成模型：让虚拟人视频不开口也传神

首页

热心网友

转载

2025-12-18

12月18日消息，据“龙猫 LongCat”公众号今晚推文，美团LongCat团队正式发布并开源SOTA级虚拟人视频生成模型——LongCat-Video-Avatar。

该模型基于LongCat-Video基座打造，延续“一个模型支持多任务”的核心设计，原生支持音频/文本生成视频、音频/文本/图像生成视频及视频续写等核心功能，同时在底层架构上全面升级，实现动作拟真度、长视频稳定性与身份一致性三大维度的突破。

美团开源虚拟人视频生成模型 LongCat-Video-Avatar：号称“不说话”时都像人

据最新介绍，该模型具备如下技术亮点。

“告别僵硬，迎接鲜活”：不仅能准确驱动口型，还能同步指挥眼神、表情和肢体动作，实现丰富饱满的情感表达。

连“不说话”的时候，都很像人：美团通过Disentangled Unconditional Guidance（解耦无条件引导）训练方法，让模型明白了“静音”不等于“死机”。在说话的间隙，虚拟人也会如同人类一般自然地眨眼、调整坐姿、放松肩膀。

据介绍，LongCat-Video-Avatar因此成为首个同时支持文字、图片、视频三种生成模式的“全能选手”，虚拟人从此有了“真正的生命力”。

在HDTF、CelebV-HQ、EMTD和EvalTalker等权威公开数据集上的定量评测表明，LongCat-Video-Avatar在多项核心指标上达到SOTA领先水平。

美团开源虚拟人视频生成模型 LongCat-Video-Avatar：号称“不说话”时都像人

附项目地址：

GitHub: https://github.com/meituan-longcat/LongCat-Video

Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Video-Avatar

Project: https://meigen-ai.github.io/LongCat-Video-Avatar/

来源:https://www.ithome.com/0/906/097.htm

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：广汽丰田全新雷凌L官宣，轴距加长至2750mm/三套动力解析下一篇：南航联合阿里云发布“天盾”大模型，革新飞行训练与航班预警

相关攻略

科技数码

哈啰员工聚会脚踩共享单车合照引争议公司回应事件经过

近日，一张共享单车企业内部员工合影在社交网络引发广泛关注。照片中，数名身着哈啰工服的工作人员骑乘本公司单车，而前方地面则倒放着青桔与美团的车辆，众人面向镜头统一竖起拇指。这张被指源自哈啰某北方区域团队的图片，迅速将这家行业领军企业推至舆论风口。对此，哈啰官方迅速作出回应。公司声明称，近期在社交平台

热心网友

05.18

美团TAL模型发布：说话人视频生成效果逼真，自然度媲美真人

想要生成自然流畅的虚拟人视频，避免口型错位、表情生硬或动作机械的常见问题？其核心在于实现跨模态时序动态的精准协同建模。简而言之，就是要确保声音、视觉画面与肢体动作的节奏完美同步。本文将为您系统拆解一套从驱动、生成到交互与优化的全链路解决方案。一、基于InfiniteTalk实现稀疏帧音画驱动首要

热心网友

05.17

业界动态

美团外卖五折优惠直送寝室无需下楼

期末复习在图书馆熬到深夜，突然下起暴雨，裹紧羽绒服还得冒雨下楼拿外卖；军训结束累得只想瘫倒，宿管阿姨却把骑手拦在宿舍区外；想和室友凑单改善伙食，又被复杂的满减、助力规则搞得晕头转向……这大概是许多大学新生的共同经历，差点以为“冲刺取餐”成了宿舍生存的必备技能。其实，只要掌握正确方法，完全能省去这些奔

热心网友

05.16

刘炯接任GN06团队负责人向美团李树斌汇报

美团GN06团队现由刘炯负责，向李树斌汇报。该团队专注于AI娱乐与智能体应用，曾推出“妙刷”等产品。目前团队招聘趋缓，但仍在探索主营业务外的新AI应用。美团AI战略涵盖工作流程优化、产品改造与自研大模型，近期已发布多项技术成果。未来其AI应用如何与本地生活业务联动备受关注。

热心网友

05.16

科技数码

前大疆核心成员创业获美团等近亿元投资专注消费级CNC产品

消费级桌面CNC与智能数字制造平台无限工坊近日完成近亿元融资，投资方包括美团、昆仑资本及奇绩创坛。公司由前大疆核心成员创立，瞄准创客市场，致力于降低CNC使用门槛。其产品采用五轴联动技术，并自研CAM软件实现刀路自动生成与全流程自动化，未来计划构建涵盖硬件、软件与内容生态的创。

热心网友

05.15

热门推荐

业界动态

多平台推广的优势与核心价值解析

在流量日益分散的今天，把鸡蛋放在同一个篮子里，风险不言而喻。多平台推广，早已不是“要不要做”的选择题，而是“如何做好”的生存题。它的核心价值，可以概括为两点：实现“流量风险对冲”，以及构建“品牌触点全覆盖”。通过在不同生态位——无论是搜索、短视频、图文还是电商——建立内容矩阵，企业不仅能有效缓冲单一

热心网友

05.19

业界动态

DeepSeek知识库搭建教程从零开始构建企业智能问答系统

DeepSeek知识库的核心，是运用RAG（检索增强生成）技术，将DeepSeek强大的大语言模型推理能力，与您的私有文档资源——包括PDF文件、内部代码库、标准操作流程（SOP）等——深度融合。其最终目标是实现基于特定垂直领域数据的精准智能问答，让AI的回答不再是通用泛化，而是具备专业依据、内容详

热心网友

05.19