首页 游戏 软件 资讯 排行榜 专题
首页
AI
美团开源LongCat视频生成模型:5分钟长视频稳定生成

美团开源LongCat视频生成模型:5分钟长视频稳定生成

热心网友
17
转载
2025-10-28

10月27日,美团LongCat团队正式发布并开源了LongCat-Video视频生成模型。据介绍,该模型在文生视频和图生视频等基础任务上均达到了开源领域的最先进水平。通过原生视频续写任务的预训练,它能够生成长达数分钟且连贯流畅的视频,在跨帧时间序列一致性与物理运动合理性方面表现突出,为长视频生成领域带来了显著优势。

美团发布开源 LongCat-Video 视频生成模型,可稳定输出 5 分级内容

近年来,“世界模型”(World Model)被视为通往下一代人工智能的关键引擎,它能够让AI系统真正理解并预测真实世界的运行规律,甚至参与重构现实。作为一种能够建模物理规律、时空演变与场景逻辑的智能系统,世界模型赋予了人工智能“看见”世界本质的能力。在这一背景下,视频生成模型有望成为构建世界模型的重要路径:通过视频生成任务,系统得以压缩几何、语义、物理等多种形式的知识,进而在数字空间中模拟、推演乃至预测真实世界的动态变化。

作为基于Diffusion Transformer(DiT)架构的多功能统一视频生成基座,LongCat-Video创新性地引入“条件帧数量”机制以区分不同任务类型——文生视频无需条件帧输入、图生视频仅需1帧参考图像、视频续写则依赖多帧前序内容。原生支持三大核心任务且无需额外模型适配,形成了“文生/图生/视频续写”完整的任务闭环。

文生视频方面:模型可生成720p、30fps的高清视频,能够精准解析文本中关于物体、人物、场景、风格等细节指令,在语义理解与视觉呈现能力上均达到开源SOTA级别。

图生视频方面:系统严格保留参考图像的主体属性、背景关系与整体风格,生成的动态过程符合物理规律,支持详细指令、简洁描述、空指令等多种输入类型,内容一致性与动态自然度表现优异。

视频续写方面:作为LongCat Video的核心差异化能力,视频续写功能可基于多帧条件帧延伸视频内容,为生成长视频提供原生技术支持。

依托视频续写任务预训练、Block-Causual Attention机制和GRPO后训练,LongCat-Video能够稳定输出长达5分钟的视频内容,且全程保持高质量输出,号称已达到行业“顶尖”水平。

相关资源链接如下:

GitHub:https://github.com/meituan-longcat/LongCat-Video

Hugging Face:https://huggingface.co/meituan-longcat/LongCat-Video

Project Page:https://meituan-longcat.github.io/LongCat-Video/

来源:https://www.ithome.com/0/892/577.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

美团TAL模型发布:说话人视频生成效果逼真,自然度媲美真人
AI
美团TAL模型发布:说话人视频生成效果逼真,自然度媲美真人

想要生成自然流畅的虚拟人视频,避免口型错位、表情生硬或动作机械的常见问题?其核心在于实现跨模态时序动态的精准协同建模。简而言之,就是要确保声音、视觉画面与肢体动作的节奏完美同步。本文将为您系统拆解一套从驱动、生成到交互与优化的全链路解决方案。 一、基于InfiniteTalk实现稀疏帧音画驱动 首要

热心网友
05.17
美团外卖五折优惠直送寝室无需下楼
业界动态
美团外卖五折优惠直送寝室无需下楼

期末复习在图书馆熬到深夜,突然下起暴雨,裹紧羽绒服还得冒雨下楼拿外卖;军训结束累得只想瘫倒,宿管阿姨却把骑手拦在宿舍区外;想和室友凑单改善伙食,又被复杂的满减、助力规则搞得晕头转向……这大概是许多大学新生的共同经历,差点以为“冲刺取餐”成了宿舍生存的必备技能。其实,只要掌握正确方法,完全能省去这些奔

热心网友
05.16
刘炯接任GN06团队负责人 向美团李树斌汇报
AI
刘炯接任GN06团队负责人 向美团李树斌汇报

美团GN06团队现由刘炯负责,向李树斌汇报。该团队专注于AI娱乐与智能体应用,曾推出“妙刷”等产品。目前团队招聘趋缓,但仍在探索主营业务外的新AI应用。美团AI战略涵盖工作流程优化、产品改造与自研大模型,近期已发布多项技术成果。未来其AI应用如何与本地生活业务联动备受关注。

热心网友
05.16
前大疆核心成员创业获美团等近亿元投资专注消费级CNC产品
科技数码
前大疆核心成员创业获美团等近亿元投资专注消费级CNC产品

消费级桌面CNC与智能数字制造平台无限工坊近日完成近亿元融资,投资方包括美团、昆仑资本及奇绩创坛。公司由前大疆核心成员创立,瞄准创客市场,致力于降低CNC使用门槛。其产品采用五轴联动技术,并自研CAM软件实现刀路自动生成与全流程自动化,未来计划构建涵盖硬件、软件与内容生态的创。

热心网友
05.15
美团商家批量上架商品操作指南
业界动态
美团商家批量上架商品操作指南

对于在美团开店、需要管理海量商品的商家而言,手动逐一上架商品不仅效率低下、耗时费力,还极易出现信息错漏。那么,是否存在一种更高效、更精准的解决方案呢?答案是肯定的。借助RPA(机器人流程自动化)技术实现商品批量导入,能够将运营人员从重复性劳动中彻底解放,实现运营效率的指数级提升。本文将为您详细拆解美

热心网友
05.14

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

阿里AI生态全景解析:从夸克到通义千问的流量入口布局与未来展望
AI
阿里AI生态全景解析:从夸克到通义千问的流量入口布局与未来展望

如果你发现阿里系AI应用近期密集上线、品牌标识迅速统一、生态能力集中释放,这并非偶然——背后是一场精心布局的战略升级。阿里正在全面重构其AI时代的流量入口体系,具体正沿着以下几条关键路径加速推进。 一、品牌体系收束:从多头并进到千问单极 过去,阿里在AI产品线上采取分散布局:夸克侧重智能搜索,灵光聚

热心网友
05.17
UiPath中国名称是什么?五大国产RPA替代软件推荐
业界动态
UiPath中国名称是什么?五大国产RPA替代软件推荐

2023年初,一家欧洲奢侈品牌的中国区数字化负责人,收到了一份令人尴尬的年度审计报告。在“业务流程自动化覆盖率”这项关键指标上,中国区在全球各分公司的排名中,位列倒数第三。总部力推的UiPath平台,在中国团队的实际使用率竟不足30%。报告一针见血地指出,问题并非出在态度上,而是源于“工具与土壤的错

热心网友
05.17
Excel跨表提取整行数据的实用方法与步骤详解
业界动态
Excel跨表提取整行数据的实用方法与步骤详解

在Excel数据分析与报表制作中,跨工作表提取整行信息是一项常见且关键的操作。无论是进行多表数据整合、制作动态查询看板,还是完成日常数据核对,掌握高效的跨表提取技巧都能显著提升工作效率。本文将系统介绍六种实用方法,涵盖从基础函数到自动化工具的多种场景,帮助您根据数据结构和任务复杂度灵活选择最佳方案。

热心网友
05.17
小红书数据采集工具哪个好?免费采集软件推荐与使用指南
业界动态
小红书数据采集工具哪个好?免费采集软件推荐与使用指南

在小红书运营和内容创作中,分析爆款笔记、借鉴优质同行文案是提升账号表现的关键。然而,手动逐个点开笔记查看不仅耗时耗力,效率也难以保证。市面上虽然存在不少数据采集工具,但许多都需要付费订阅。实际上,也有免费且功能强大的替代方案,例如“实在Agent”平台推出的小红书采集智能体。它集成了热门笔记采集分析

热心网友
05.17
实在智能RPA财务机器人价格解析与选购全攻略
业界动态
实在智能RPA财务机器人价格解析与选购全攻略

在探讨实在智能RPA财务机器人的市场价格时,许多企业会发现其报价并非固定数值,而是呈现出从数千元到数十万元不等的宽幅区间。这种价格差异的背后,实际上是品牌实力、功能配置、性能水平、服务支持以及企业具体需求等多重因素共同作用的结果。 要清晰理解实在智能RPA财务机器人的定价逻辑,我们可以从以下几个核心

热心网友
05.17