游乐游手机版
首页/科技数码/文章详情

中国视频大模型新星Sora登场开启视觉新时代

时间:2026-02-28 11:01
(文 万肇生 编辑 张光凯)中国的视频大模型,又发起了一场技术突围。2月27日,昆仑万维集团旗下Skywork AI正式发布多模态视频基础模型SkyReels V4。据称,该模型系“全球首个同时支持

(文/万肇生 编辑/张光凯)

中国的视频大模型,又发起了一场技术突围。

2月27日,昆仑万维集团旗下Skywork AI正式发布多模态视频基础模型SkyReels V4。据称,该模型系“全球首个同时支持多模态输入、联合音视频生成、统一生成/修复/编辑任务”的视频基础模型。

为此,观察者网查询第三方AI大模型评测机构Artificial Analysis发现,SkyReels V4目前在该机构“文生视频(带音频)的所有历史模型”排行榜中,位列第四名,已超过绝大多数明星产品。


截止27日,SkyReels V4在AA榜单所有模型中排名位置。Artificial Analysis 截图

而在实际成品方面,以最新下述参考图生成的一段15秒视频,镜头切换恰当,音画同步,整体效果已与目前短剧水平相当。


据介绍,SkyReels V4以双流多模态扩散 Transformer(MMDiT)为核心架构,实现了1080p分辨率、32 FPS 帧率、15 秒时长的音视频同步生成。同时,还可基于参考图片和参考运动的主体进行替换/动作迁移、修改属性(如服装颜色、物体形状)、更换背景,添删物体、修改局部纹理与属性等功能。

而在文本及音频生成方面,昆仑天工提到,SkyReels-V4支持包括中英日韩德法语等多个语种的文本合成,其中中文的语音合成上表现突出,多个指标也达到行业领先水平。

三大技术突破

昆仑天工表示,SkyReels-V4主要的贡献,是针对下述用户日常使用视频生成工具遇到的几个痛点,分别进行了突破。

目前,市面上视频生成工具多种多样,但普遍会出现包括声音和画面经常对不上,即口型对不准。而用户生成高清长视频又特别吃算力资源,又慢且价格昂贵。当用户希望自行将视频剪辑成复杂视频时,又需要在多个软件里来回切换。

SkyReels-V4则采用的双流 MMDiT 架构,可以实现视频和音频两条线从任务开始就并肩工作,共享同一个大脑(文本理解模型)。且通过互相参考的双向跨注意力机制,提高生成视频中角色的嘴型、动作和声音的匹配度。


SkyReels-V4还选择了"低分辨率全序列 + 高分辨率关键帧" 联合生成策略:模型先快速生成低分辨率完整视频和高分辨率关键帧,再通过专用超分辨率和帧插值模块重构高质量视频。如此可以直接用相对较少的计算资源,生成更高分辨率、更长时间的优质视频。这意味着用户制作高质量视频的门槛和成本都显著降低了。

当用户需要后续剪辑功能时,SkyReels-V4把生成、编辑、处理等整合在统一框架里,提出通道拼接(Channel-Concatenation)与时序拼接(Temporal-Concatenation)相结合的统一范式,减少用户剪辑时的多工具依赖,提升效率。

如何在创造与规则中寻求平衡?

需要注意的是,虽然SkyReels-V4展现出了强大的技术力,但与上个月字节跳动发布Seedance2.0时大环境不同的是,技术与规则的赛跑从未如此激烈,大模型竞争已不仅仅只需卷技术,数据来源的合法性与合规成本,已经成为新的壁垒。

就在半个月前,Seedance2.0因版权问题,陆续遭到美国电影协会(MPA)及六大好莱坞制片厂联合发出停止侵权函。随后许多用户发现,Seedance2.0开始出现了“降智”现象,原先那种令人惊艳的电影级打斗镜头一去不返,视频产出稳定性大幅下降,退回了纯抽卡游戏,令人痛心。演员王劲松也公开发文,控诉其形象被人用于AI生成视频,称“声音、口型完全看不出来真假”,他担忧深度伪造技术可能被用于诈骗,且“侵权者的代价可以忽略不计”。

另外,创作平权与版权保护的矛盾激化也不容忽视。许多视频生成工具都可以实现“人人当导演”,但当普通用户无意间将包含IP的素材用于生成时,所产生的侵权行为将变得更加普遍且难以追责。这些都与SkyReels-V4所解决的音画不同步难题一样,是目前视频生成工具的普遍痛点。

昆仑天工的突围值得振奋,但字节跳动的困境也提醒我们,对于中国AI企业而言,想要顺利进入并立足国际市场,所需要的远不止是算力和算法的领先。

来源:https://www.163.com/dy/article/KMRJI4OQ051481US.html
上一篇450亿红包后,中国AI的下一战如何布局? 下一篇2025年航天发射92次:商业航天占50次,创历史新高
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
俞浩梦想奖学金2026年度申报启动全国双通道开放
科技数码 · 2026-07-01

俞浩梦想奖学金2026年度申报启动全国双通道开放

2026年6月30日,追觅公益携手中国光华科技基金会与成都市教育基金会,正式启动俞浩梦想奖学金2026年度申报工作。该项目计划面向全国资助100名即将步入大学校园的2026级新生,重点聚焦品学兼优但家庭经济困难,或来自教育资源相对薄弱地区的学生。 谈及奖学金的设立背景,需追溯到2025年。当时追觅科

PRINCE PLANT勒内精油法式芳疗高端新定义
科技数码 · 2026-07-01

PRINCE PLANT勒内精油法式芳疗高端新定义

天然芳香疗法养护近年来热度持续攀升,全球高端精油市场也迎来爆发式增长。在众多品类与产区中,法式精油凭借卓越品质和专业功效稳居行业塔尖,成为高端芳疗消费者的首选。查阅多份权威行业报告可以发现,法国精油确实拥有得天独厚的产业优势和全球竞争力。而在这一赛道上,PRINCE PLANT勒内作为正统法式精油的

实测哪款0涂层电饭煲口碑好 避开粘锅陷阱
科技数码 · 2026-07-01

实测哪款0涂层电饭煲口碑好 避开粘锅陷阱

做饭最令人担忧的是什么?内胆涂层剥落、有害物质析出,想想就让人心生顾虑。为此,不少家庭开始关注0涂层电饭煲——但市面上产品琳琅满目,测评观点也各不相同,究竟哪款才真正可靠?今天我们用实测数据给出答案。 站在2026年的时间节点回顾,电饭煲行业早已跨越“能把饭煮熟”的初级阶段,健康化、精细化烹饪成为主

短途电动车选购指南:按需选这三类不踩坑省钱
科技数码 · 2026-07-01

短途电动车选购指南:按需选这三类不踩坑省钱

城市短途出行需求持续增长,电动自行车市场随之升温。走访多家门店后发现,许多消费者在选车时面临“配置焦虑”——销售人员极力推荐的高续航、智能化车型确实吸引眼球,但冷静思考后,不少功能在日常使用中并不必要。一位正在选车的上班族直言:“销售说无钥匙启动是趋势,可我觉得传统钥匙开锁也挺方便。” 从市场数据来

A股CPO概念走强 新易盛涨超5% 中际旭创涨超4%
科技数码 · 2026-07-01

A股CPO概念走强 新易盛涨超5% 中际旭创涨超4%

6月30日,A股CPO概念板块迎来集体爆发,多只个股强势封板,市场赚钱效应持续升温。具体来看,锐捷网络直接封死20CM涨停板,太辰光涨幅超过10%,铭普光磁、紫光股份、星网锐捷也纷纷收获10CM涨停。智立方、蘅东光涨超8%,九联科技涨超7%,立讯精密、长芯博创、仕佳光子、联特科技、航天电器涨幅均超过