美团开源LongCat虚拟人视频生成模型,打造数字分身新标准
12月18日,美团 LongCat 团队正式对外开源了其 SOTA 级虚拟人视频生成模型——LongCat-Video-Avatar。该消息最早由“龙猫+LongCat”微信公众号发布。

该模型基于 LongCat-Video 基座打造,延续了“一个模型支持多任务”的核心设计理念,原生支持音频/文本生成视频、音频/文本/图像生成视频以及视频续写等核心功能。同时,其在底层架构上进行了全面升级,实现了动作拟真度、长视频稳定性与身份一致性三大维度的显著突破。
据介绍,该模型具备以下几大技术亮点。
告别僵硬,迎接鲜活:它不仅能够精准驱动口型,还能同步指挥眼神、表情和肢体动作,实现丰富饱满的情感表达。
“不说话”的时候,也很像人:美团采用了 Disentangled Unconditional Guidance(解耦无条件引导)训练方法,让模型理解“静音”不等于“死机”。在说话的间隙,虚拟人也会像人类一样自然地眨眼、调整坐姿、放松肩膀。
据介绍,LongCat-Video-Avatar 因此成为首个同时支持文字、图片、视频三种生成模式的“全能选手”,虚拟人从此拥有了“真正的生命力”。
在 HDTF、CelebV-HQ、EMTD 和 EvalTalker 等权威公开数据集上的定量测评表明,LongCat-Video-Avatar 在多项核心指标上达到了 SOTA 领先水平。

相关攻略
近日,一张共享单车企业内部员工合影在社交网络引发广泛关注。照片中,数名身着哈啰工服的工作人员骑乘本公司单车,而前方地面则倒放着青桔与美团的车辆,众人面向镜头统一竖起拇指。这张被指源自哈啰某北方区域团队的图片,迅速将这家行业领军企业推至舆论风口。 对此,哈啰官方迅速作出回应。公司声明称,近期在社交平台
想要生成自然流畅的虚拟人视频,避免口型错位、表情生硬或动作机械的常见问题?其核心在于实现跨模态时序动态的精准协同建模。简而言之,就是要确保声音、视觉画面与肢体动作的节奏完美同步。本文将为您系统拆解一套从驱动、生成到交互与优化的全链路解决方案。 一、基于InfiniteTalk实现稀疏帧音画驱动 首要
期末复习在图书馆熬到深夜,突然下起暴雨,裹紧羽绒服还得冒雨下楼拿外卖;军训结束累得只想瘫倒,宿管阿姨却把骑手拦在宿舍区外;想和室友凑单改善伙食,又被复杂的满减、助力规则搞得晕头转向……这大概是许多大学新生的共同经历,差点以为“冲刺取餐”成了宿舍生存的必备技能。其实,只要掌握正确方法,完全能省去这些奔
美团GN06团队现由刘炯负责,向李树斌汇报。该团队专注于AI娱乐与智能体应用,曾推出“妙刷”等产品。目前团队招聘趋缓,但仍在探索主营业务外的新AI应用。美团AI战略涵盖工作流程优化、产品改造与自研大模型,近期已发布多项技术成果。未来其AI应用如何与本地生活业务联动备受关注。
消费级桌面CNC与智能数字制造平台无限工坊近日完成近亿元融资,投资方包括美团、昆仑资本及奇绩创坛。公司由前大疆核心成员创立,瞄准创客市场,致力于降低CNC使用门槛。其产品采用五轴联动技术,并自研CAM软件实现刀路自动生成与全流程自动化,未来计划构建涵盖硬件、软件与内容生态的创。
热门专题
热门推荐
机器人行业迎来里程碑式突破。以视频生成模型Vidu著称的生数科技,正式发布了名为Motubrain的“世界动作模型”。这并非一次普通迭代,而是被定位为机器人的“物理大脑”,其核心目标在于:用一个统一的通用模型,彻底取代以往依赖多个专用系统拼凑而成的复杂架构。 正如其“一个大脑,无限可能”的口号所揭示
xAI正式进军AI编程智能体领域,于近日发布了专为软件工程与复杂编程任务设计的Grok Build。 简单来说,Grok Build是一款能在终端里直接跑起来的AI编程助手。它被定位为一个具备智能体能力的命令行工具,开发者用自然语言告诉它要做什么,它就能生成代码,甚至帮你搞定一系列编程和自动化任务。
近日,谷歌对其搜索引擎的核心规则进行了重要更新,此次调整直指当前备受关注的AI搜索领域。具体而言,谷歌在其垃圾内容政策中新增了明确条款,正式将“操纵AI搜索结果”的行为列为违规操作,划定了新的质量红线。 根据权威行业媒体Search Engine Land的报道,本次谷歌算法更新的核心在于,将任何企
硅谷的科技巨头们或许曾以为,自己已经远离了AI数据中心带来的电力压力——毕竟,高昂的地价和电费早就把大型数据中心项目“赶”到了别处。但现实总是出人意料,这场能源危机的涟漪,正悄然涌向他们心爱的度假后院。 没错,说的就是太浩湖。这个湾区精英们钟爱的避世天堂,如今正站在一场电力风暴的边缘。距离它必须找到
这项由高通AI研究院(Qualcomm AI Research)主导的创新研究于2026年5月正式发布,论文预印本编号为arXiv:2605 07721。 研究背景:当AI越想越费内存,我们该怎么办 设想一下,手机导航应用会在出发前规划好整条路线,而一位真正智慧的向导则会边走边思考,遇到路障时灵活应





