首页 游戏 软件 资讯 排行榜 专题
首页
专题列表
视频生成:AI赋能创作,视觉内容革命新引擎

视频生成:AI赋能创作,视觉内容革命新引擎

2026-02-03

视频生成技术正引领内容创作领域的深刻变革。本专题深入解析AI视频生成的核心技术原理,涵盖文本生成视频、图像转视频等前沿应用。我们汇集行业动态、实用工具评测与创作技巧教程,帮助内容创作者、营销人员及技术爱好者掌握从基础操作到高级制作的完整知识体系。专题聚焦AIGC趋势下的创新场景与实践案例,旨在为用户提供高效、专业的视频生成解决方案,助力提升创作效率与视觉表现力。

视频生成:AI赋能创作,视觉内容革命新引擎

TOP1

首个Deep Research评测基准:视频理解与开放网络搜索

来自QuantaAlpha、兰州大学、香港科技大学(广州)、北京大学等机构的研究者联合推出了首个视频深度研究(Video Deep Research)评测基准VideoDR。 在传统的视频问答(Vi
首个Deep Research评测基准:视频理解与开放网络搜索
查看详情

TOP2

MoonMath突破视频AI瓶颈:闪电生成背后的关键技术

这项由MoonMath ai团队的Dor Shmilovich、Tony Wu、Aviad Dahan和Yuval Domb共同完成的突破性研究发表于2025年神经信息处理系统会议(NeurIPS
MoonMath突破视频AI瓶颈:闪电生成背后的关键技术
查看详情

TOP3

PickStyle指南:用上下文风格适配器实现视频风格转换

PICKSTYLE 是一个基于 VACE 构建的视频到视频风格迁移框架,它配备了上下文风格适配器和新颖的 CS-CFG 机制。 利用扩散模型做视频风格迁移,想保留原视频内容的同时渲染成指定风格,但面
PickStyle指南:用上下文风格适配器实现视频风格转换
查看详情

TOP4

MultiTalk模型解析:98.7%语音视觉对齐精度的多角色对话SOTA

MultiTalk以DiT(Diffusion-in-Transformer)为基础的视频扩散模型作为其核心骨架。 由中山大学、美团、港科大开源的MultiTalk 可实现多虚拟人对话视频生成。在语
MultiTalk模型解析:98.7%语音视觉对齐精度的多角色对话SOTA
查看详情

TOP5

华盛顿大学AI突破:视频生成实现“边想边画”创作

这项由华盛顿大学的洪苏成(Susung Hong)与Adobe研究院的葛崇健(Chongjian Ge)、张志飞(Zhifei Zhang)、王瑞贤(Jui-Hsien Wang)合作完成的研究发表
华盛顿大学AI突破:视频生成实现“边想边画”创作
查看详情

TOP6

阿里与中科院:突破视频生成模型创意边界的关键一步

这是一项由中国科学院大学、阿里巴巴高德地图事业部、中国科学院自动化研究所以及清华大学、东南大学的研究团队共同完成的突破性研究。论文由吴美琪、朱家树、冯晓坤、陈楚彬、朱晨等多位研究者撰写,已发表在20
阿里与中科院:突破视频生成模型创意边界的关键一步
查看详情

TOP7

豆包视频功能升级,支持同步生成声音与画面

近日,豆包App视频生成能力升级,支持Seedance1 5 Pro模型,可一键生成声音和画面相匹配的有声视频。打开豆包App对话框,选择“照片动起来”,上传图片并输入提示词,选择“1 5 Pro”
豆包视频功能升级,支持同步生成声音与画面
查看详情

TOP8

字节跳动破解AI记忆难题:视频生成如何实现连续思维

这项由香港中文大学的郭宇伟、字节跳动的杨策元等研究团队合作完成的突破性研究,于2024年12月发表在计算机视觉领域的顶级会议上。对这项研究感兴趣的读者可以通过arXiv:2512 15702v1查询
字节跳动破解AI记忆难题:视频生成如何实现连续思维
查看详情

TOP9

美团开源LongCat-Video-Avatar模型,支持情感表达虚拟人生成

IT之家 12 月 18 日消息,据“龙猫 LongCat”公众号今晚的推文,美团 LongCat 团队正式发布并开源 SOTA 级虚拟人视频生成模型 ——LongCat-Video-Avatar。
美团开源LongCat-Video-Avatar模型,支持情感表达虚拟人生成
查看详情

TOP10

P图级特效?O1视频生成器重塑内容创作未来

可灵O1不是那种只会在参数上卷数字的模型,它是奔着解决实际工作流问题去的。虽然它还不完美,但它展示了一种可能性:未来的视频创作,真的可以像现在P图一样简单、直观、随心所欲。 作为一名每天都在和各种A
P图级特效?O1视频生成器重塑内容创作未来
查看详情

TOP11

Rolling Forcing技术:用AI生成分钟级长视频的实用指南

Rolling Forcing 成功突破了实时长视频生成的不可能三角,在保持 16 fps 实时生成速度的同时,显著降低了长序列生成中的误差累积,实现了分钟级别的高质量视频流生成,为交互式世界模型、
Rolling Forcing技术:用AI生成分钟级长视频的实用指南
查看详情

TOP12

美团视频生成模型1360亿参数揭秘,效率提升10倍媲美Sora

美团LongCat团队发布了LongCat-Video的基础视频生成模型,它拥有136亿的参数量,能在数分钟内生成720p、30帧每秒的高质量视频,并且在文本转视频、图像转视频和长视频续写等多个任务
美团视频生成模型1360亿参数揭秘,效率提升10倍媲美Sora
查看详情

TOP13

Vidu三重进化:AI视频从碎片叙事迈向多线程复杂叙事

2024年9月,Vidu 在全球首个推出@主体参考功能,引领行业迈入“参考生视频时代”,收获全球创作者的广泛认可。10月21日,Vidu Q2 参考生视频再次进化,本次升级聚焦于高一致性,速度更快,
Vidu三重进化:AI视频从碎片叙事迈向多线程复杂叙事
查看详情

TOP14

爱诗科技B轮融资1亿元 年度收入突破4000万美元

10 月 17 日,AI 视频企业爱诗科技宣布完成 1 亿元人民币 B+ 轮融资,由复星锐正、同创伟业、顺禧基金等共同投资。此前 9 月 10 日,爱诗科技完成 B 轮融资,总金额超过 6000 万
爱诗科技B轮融资1亿元 年度收入突破4000万美元
查看详情

TOP15

可灵2.5 Turbo 模型上线:价格较上代模型低近30%

9月24日消息,9月23日,可灵AI再次迎来重磅升级,推出视频生成可灵2 5 Turbo 模型,同时更新文生视频、图生视频两大功能。模型质量大幅提升,生成效果行业领先。专业评估人员对可灵2 5 Tu
可灵2.5 Turbo 模型上线:价格较上代模型低近30%
查看详情