美团开源LongCat视频生成模型:让虚拟人视频不开口也传神
12月18日消息,据“龙猫 LongCat”公众号今晚推文,美团LongCat团队正式发布并开源SOTA级虚拟人视频生成模型——LongCat-Video-Avatar。
该模型基于LongCat-Video基座打造,延续“一个模型支持多任务”的核心设计,原生支持音频/文本生成视频、音频/文本/图像生成视频及视频续写等核心功能,同时在底层架构上全面升级,实现动作拟真度、长视频稳定性与身份一致性三大维度的突破。

据最新介绍,该模型具备如下技术亮点。
“告别僵硬,迎接鲜活”:不仅能准确驱动口型,还能同步指挥眼神、表情和肢体动作,实现丰富饱满的情感表达。
连“不说话”的时候,都很像人:美团通过Disentangled Unconditional Guidance(解耦无条件引导)训练方法,让模型明白了“静音”不等于“死机”。在说话的间隙,虚拟人也会如同人类一般自然地眨眼、调整坐姿、放松肩膀。
据介绍,LongCat-Video-Avatar因此成为首个同时支持文字、图片、视频三种生成模式的“全能选手”,虚拟人从此有了“真正的生命力”。
在HDTF、CelebV-HQ、EMTD和EvalTalker等权威公开数据集上的定量评测表明,LongCat-Video-Avatar在多项核心指标上达到SOTA领先水平。

附项目地址:
GitHub: https://github.com/meituan-longcat/LongCat-Video
Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Video-Avatar
Project: https://meigen-ai.github.io/LongCat-Video-Avatar/
相关攻略
近日,一张共享单车企业内部员工合影在社交网络引发广泛关注。照片中,数名身着哈啰工服的工作人员骑乘本公司单车,而前方地面则倒放着青桔与美团的车辆,众人面向镜头统一竖起拇指。这张被指源自哈啰某北方区域团队的图片,迅速将这家行业领军企业推至舆论风口。 对此,哈啰官方迅速作出回应。公司声明称,近期在社交平台
想要生成自然流畅的虚拟人视频,避免口型错位、表情生硬或动作机械的常见问题?其核心在于实现跨模态时序动态的精准协同建模。简而言之,就是要确保声音、视觉画面与肢体动作的节奏完美同步。本文将为您系统拆解一套从驱动、生成到交互与优化的全链路解决方案。 一、基于InfiniteTalk实现稀疏帧音画驱动 首要
期末复习在图书馆熬到深夜,突然下起暴雨,裹紧羽绒服还得冒雨下楼拿外卖;军训结束累得只想瘫倒,宿管阿姨却把骑手拦在宿舍区外;想和室友凑单改善伙食,又被复杂的满减、助力规则搞得晕头转向……这大概是许多大学新生的共同经历,差点以为“冲刺取餐”成了宿舍生存的必备技能。其实,只要掌握正确方法,完全能省去这些奔
美团GN06团队现由刘炯负责,向李树斌汇报。该团队专注于AI娱乐与智能体应用,曾推出“妙刷”等产品。目前团队招聘趋缓,但仍在探索主营业务外的新AI应用。美团AI战略涵盖工作流程优化、产品改造与自研大模型,近期已发布多项技术成果。未来其AI应用如何与本地生活业务联动备受关注。
消费级桌面CNC与智能数字制造平台无限工坊近日完成近亿元融资,投资方包括美团、昆仑资本及奇绩创坛。公司由前大疆核心成员创立,瞄准创客市场,致力于降低CNC使用门槛。其产品采用五轴联动技术,并自研CAM软件实现刀路自动生成与全流程自动化,未来计划构建涵盖硬件、软件与内容生态的创。
热门专题
热门推荐
在流量日益分散的今天,把鸡蛋放在同一个篮子里,风险不言而喻。多平台推广,早已不是“要不要做”的选择题,而是“如何做好”的生存题。它的核心价值,可以概括为两点:实现“流量风险对冲”,以及构建“品牌触点全覆盖”。通过在不同生态位——无论是搜索、短视频、图文还是电商——建立内容矩阵,企业不仅能有效缓冲单一
DeepSeek知识库的核心,是运用RAG(检索增强生成)技术,将DeepSeek强大的大语言模型推理能力,与您的私有文档资源——包括PDF文件、内部代码库、标准操作流程(SOP)等——深度融合。其最终目标是实现基于特定垂直领域数据的精准智能问答,让AI的回答不再是通用泛化,而是具备专业依据、内容详
三大运营商推出Token套餐,将大模型调用量包装为类似流量包的产品,以降低AI使用门槛。中国电信推出个人与企业多档套餐,最低月费9 9元;上海移动推出1元购40万Tokens服务;联通则提供个人与团队版套餐。运营商凭借用户渠道和支付优势,推动算力消费向大众市场普及,可能重塑AI服务消费模式。
HermesAgent本地运行缓慢常因未量化的大语言模型占用资源过多。可通过AWQ量化模型、llama cpp后端加载GGUF模型、配置vLLM引擎提升并发吞吐、禁用非必要工具降低上下文开销,以及调整SQLite记忆检索阈值等方案优化。这些方法能显著降低延迟,提升响应速度。
随着AI智能体能力的持续增强,确保其行为始终符合预设目标与安全边界,已成为行业亟待解决的核心挑战。然而,当前主流的治理方案在防止智能体“失控”或“脱轨”方面,仍面临显著的实践瓶颈。 在之前的探讨中,我们分析了主流治理思路:部署多样化的对抗性验证器,构建一个多层次的安全审查网络。该方案的核心逻辑并非限





