视频生成：AI赋能创作，视觉内容革命新引擎_游乐网

文章

业界资讯单机攻略视频攻略新游看台八卦新闻手游资讯手游攻略游戏问答

游戏

全部角色扮演棋牌策略休闲益智赛车竞速飞行射击体育竞技模拟经营动作冒险卡牌桌游其他游戏应用辅助

首页游戏软件资讯排行榜专题

首页

专题列表

视频生成：AI赋能创作，视觉内容革命新引擎

视频生成：AI赋能创作，视觉内容革命新引擎

2026-02-03

视频生成技术正引领内容创作领域的深刻变革。本专题深入解析AI视频生成的核心技术原理，涵盖文本生成视频、图像转视频等前沿应用。我们汇集行业动态、实用工具评测与创作技巧教程，帮助内容创作者、营销人员及技术爱好者掌握从基础操作到高级制作的完整知识体系。专题聚焦AIGC趋势下的创新场景与实践案例，旨在为用户提供高效、专业的视频生成解决方案，助力提升创作效率与视觉表现力。

视频生成：AI赋能创作，视觉内容革命新引擎

TOP1

首个Deep Research评测基准：视频理解与开放网络搜索

来自QuantaAlpha、兰州大学、香港科技大学（广州）、北京大学等机构的研究者联合推出了首个视频深度研究（Video Deep Research）评测基准VideoDR。在传统的视频问答（Vi

首个Deep Research评测基准：视频理解与开放网络搜索

TOP2

MoonMath突破视频AI瓶颈：闪电生成背后的关键技术

这项由MoonMath ai团队的Dor Shmilovich、Tony Wu、Aviad Dahan和Yuval Domb共同完成的突破性研究发表于2025年神经信息处理系统会议（NeurIPS

MoonMath突破视频AI瓶颈：闪电生成背后的关键技术

TOP3

PickStyle指南：用上下文风格适配器实现视频风格转换

PICKSTYLE 是一个基于 VACE 构建的视频到视频风格迁移框架，它配备了上下文风格适配器和新颖的 CS-CFG 机制。利用扩散模型做视频风格迁移，想保留原视频内容的同时渲染成指定风格，但面

PickStyle指南：用上下文风格适配器实现视频风格转换

TOP4

MultiTalk模型解析：98.7%语音视觉对齐精度的多角色对话SOTA

MultiTalk以DiT（Diffusion-in-Transformer）为基础的视频扩散模型作为其核心骨架。由中山大学、美团、港科大开源的MultiTalk 可实现多虚拟人对话视频生成。在语

MultiTalk模型解析：98.7%语音视觉对齐精度的多角色对话SOTA

TOP5

华盛顿大学AI突破：视频生成实现“边想边画”创作

这项由华盛顿大学的洪苏成（Susung Hong）与Adobe研究院的葛崇健（Chongjian Ge）、张志飞（Zhifei Zhang）、王瑞贤（Jui-Hsien Wang）合作完成的研究发表

华盛顿大学AI突破：视频生成实现“边想边画”创作

TOP6

阿里与中科院：突破视频生成模型创意边界的关键一步

这是一项由中国科学院大学、阿里巴巴高德地图事业部、中国科学院自动化研究所以及清华大学、东南大学的研究团队共同完成的突破性研究。论文由吴美琪、朱家树、冯晓坤、陈楚彬、朱晨等多位研究者撰写，已发表在20

阿里与中科院：突破视频生成模型创意边界的关键一步

TOP7

豆包视频功能升级，支持同步生成声音与画面

近日，豆包App视频生成能力升级，支持Seedance1 5 Pro模型，可一键生成声音和画面相匹配的有声视频。打开豆包App对话框，选择“照片动起来”，上传图片并输入提示词，选择“1 5 Pro”

豆包视频功能升级，支持同步生成声音与画面

TOP8

字节跳动破解AI记忆难题：视频生成如何实现连续思维

这项由香港中文大学的郭宇伟、字节跳动的杨策元等研究团队合作完成的突破性研究，于2024年12月发表在计算机视觉领域的顶级会议上。对这项研究感兴趣的读者可以通过arXiv:2512 15702v1查询

字节跳动破解AI记忆难题：视频生成如何实现连续思维

TOP9

美团开源LongCat-Video-Avatar模型，支持情感表达虚拟人生成

IT之家 12 月 18 日消息，据“龙猫 LongCat”公众号今晚的推文，美团 LongCat 团队正式发布并开源 SOTA 级虚拟人视频生成模型 ——LongCat-Video-Avatar。

TOP10

P图级特效？O1视频生成器重塑内容创作未来

可灵O1不是那种只会在参数上卷数字的模型，它是奔着解决实际工作流问题去的。虽然它还不完美，但它展示了一种可能性：未来的视频创作，真的可以像现在P图一样简单、直观、随心所欲。作为一名每天都在和各种A

P图级特效？O1视频生成器重塑内容创作未来

TOP11

Rolling Forcing技术：用AI生成分钟级长视频的实用指南

Rolling Forcing 成功突破了实时长视频生成的不可能三角，在保持 16 fps 实时生成速度的同时，显著降低了长序列生成中的误差累积，实现了分钟级别的高质量视频流生成，为交互式世界模型、

Rolling Forcing技术：用AI生成分钟级长视频的实用指南

TOP12

美团视频生成模型1360亿参数揭秘，效率提升10倍媲美Sora

美团LongCat团队发布了LongCat-Video的基础视频生成模型，它拥有136亿的参数量，能在数分钟内生成720p、30帧每秒的高质量视频，并且在文本转视频、图像转视频和长视频续写等多个任务

美团视频生成模型1360亿参数揭秘，效率提升10倍媲美Sora

TOP13

Vidu三重进化：AI视频从碎片叙事迈向多线程复杂叙事

2024年9月，Vidu 在全球首个推出@主体参考功能，引领行业迈入“参考生视频时代”，收获全球创作者的广泛认可。10月21日，Vidu Q2 参考生视频再次进化，本次升级聚焦于高一致性，速度更快，

Vidu三重进化：AI视频从碎片叙事迈向多线程复杂叙事

TOP14

爱诗科技B轮融资1亿元年度收入突破4000万美元

10 月 17 日，AI 视频企业爱诗科技宣布完成 1 亿元人民币 B+ 轮融资，由复星锐正、同创伟业、顺禧基金等共同投资。此前 9 月 10 日，爱诗科技完成 B 轮融资，总金额超过 6000 万

爱诗科技B轮融资1亿元年度收入突破4000万美元

TOP15

可灵2.5 Turbo 模型上线：价格较上代模型低近30%

9月24日消息，9月23日，可灵AI再次迎来重磅升级，推出视频生成可灵2 5 Turbo 模型，同时更新文生视频、图生视频两大功能。模型质量大幅提升，生成效果行业领先。专业评估人员对可灵2 5 Tu

可灵2.5 Turbo 模型上线：价格较上代模型低近30%