商汤Seko 2.0:一人剧组拍剧,一键搞定全流程

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
作者 | 周一笑
邮箱 | zhouyixiao@pingwest.com
2025 年,对于 AI 视频生成领域来说,是一个祛魅的年份。
如果说过去很长一段时间,行业还沉浸在 OpenAI Sora 这样的模型带来的"现实扭曲力场"中,惊叹于光影的逼真和物理规律的模拟,那么到了今年下半年,从硅谷到中关村,所有的从业者都撞上了一堵冰冷的墙,模型很强,但怎么变成产品?
我们见过了太多惊艳的 5 秒钟镜头,燃烧的宇航员、赛博朋克的街道。但当创作者试图用它们拼凑出一部哪怕只有 3 分钟的连贯短剧时,灾难发生了,主角在第一个镜头是瓜子脸,切个近景就变成了方脸;上一秒还穿着冲锋衣,下一秒衣服上的 Logo 就换了位置。
生成无数个漂亮的碎片,但我很难造出一座完整的"房子"。这是当下 AI 创作者最真实的挫败感。
与此同时,行业的"内卷"速度远超预期。根据多方行业调研数据显示,AI 漫剧的单分钟制作成本,已经从年初的高位下降。这不是价格战,而是一场生存战。
平台的红利也在消退。主流短视频平台已开始收紧审核标准,那些靠模型"一键生成"、人物忽大忽小、衣服颜色反复横跳的低质量内容,正面临被限流甚至打回的风险。留给野蛮生长的时间不多了。
在这个背景下,商汤刚刚发布的 Seko 2.0 显得有些"反常识"。
在大多数模型还在卷谁生成的浪花更符合流体力学时,Seko2.0 把重点方在了一个听起来枯燥、甚至有点像项目管理软件的词上:多剧集管理。
也就是说,Seko认为 AI 视频的下半场,拼的不只是生成像素的能力,而是管理像素的逻辑。
它到底做的怎么样,我们先来看一段由平台创作者生成的作品集锦:
1
解剖“一人剧组”,从文本到成片的工业化链路
Seko 2.0 到底怎么用?简单来说,它把复杂的影视工业流程压缩成了三步走的"傻瓜式"操作:
1、丢剧本: 把小说或创意文案直接扔进对话框;
2、AI 拆解: 系统自动把剧本拆解成角色、场景、道具,并生成分镜图;
3、交互成片: 用户确认分镜无误后,一键生成连贯视频,并支持对画面进行"P图式"修改。
比如在Seko 2.0产品发布中的 《李白诗仙传》 演示,我们看到了这套逻辑的实际效果。
打开 Seko 2.0 的新界面,你会发现它越来越不像一个简单的聊天框,而更像是一个轻量级的非线性编辑软件。用户把一段关于李白的剧情文本扔进去,系统背后的 Agent( 并没有急着生成视频,而是像一个成熟的副导演一样,先做了一件事:拆解。
它自动分析文本,提取出角色(李白)、场景(宫廷/山水)、道具(酒壶),并生成了一份包含了三集内容的结构化大纲。不只是文本的梳理,更是资产的建立。
对于短剧创作者来说,最大的痛点莫过于"角色一致性"。以往,为了让角色在两张图里长得一样,用户可能需要填写复杂的 Prompt 甚至训练 LoRA。
而在 Seko 2.0 中,这套逻辑被 Agent 接管了。
这意味着,AI 也有了"记忆"。系统把角色的视觉特征提取出来,存入资产库,然后在每一次生成新分镜时,通过 Agent 强制注入这些特征。对于想要日更的短剧团队来说,他们终于不需要用 庞杂的Excel 表格来人工记录每个角色的 Prompt 参数了。
除了宏观的一致性,Seko 2.0 在微观层面的可控性上也做出了进化。
大部分的 AI 视频工具是生成器的逻辑,如果不满意,你大概率只能重新生成。Seko 2.0 则引入了"画布编辑"功能。如果对分镜中李白的动作不满意,用户可以直接在画布上进行局部重绘、消除甚至添加元素。
另外值得一提的是集成在Seko2.0产品中的,实时语音驱动数字人技术----SekoTalk功能,不但能精准实现多人、多语言对口型,保证超长时稳定生成同时,还极大提升了数字人生成效率,做到了真正的实时生成。
这些不是简单的加分项,而是能不能进入实际生产场景的门槛,它让AI视频真的可用、好用了。以下是 Seko 平台创作者利用SekoTalk生成的作品:
1
算力经济学
如果说“一致性”决定了 AI 短剧能不能看,那么“算力成本”则决定了 AI 短剧能不能赚。
这样解释了为什么商汤要死磕国产算力。
面对越来越卷的 AI 短剧、漫剧的市场,如果创作者还在使用昂贵且稀缺的英伟达高端显卡进行渲染,那么算力成本将吞噬掉仅有的利润。这也解释了为什么目前市面上充斥着 IAA(广告变现)模式的免费剧,因为用户付费意愿低,制作方只能靠极致的压缩成本来博取流量收益。
商汤显然算过这笔账。商汤科技 Seko 产品负责人王子彬在采访中透露了一个关键数据,相比半年前,Seko 单次推理的成本已经下降了 50% 左右。
这背后离不开商汤日日新大模型的底层创新和协同优化。比如,商汤开源的行业首个视频生成推理框架LightX2V,在 ComfyUI 社区下载量已超过 350 万次。它解决了制约AI视频落地最关键的,高质量视频生成与昂贵算力的矛盾。
LightX2V 的多项核心技术包括:
Phased DMD(步数蒸馏): 简单来说,就是让 AI “少走弯路”。通过原创的蒸馏算法,在极少的步数下(如 4 步)就能生成高质量视频,大幅缩短了推理时间。
LightVAE(轻量级 VAE): 这项技术将视频编解码的性能提升了 10 倍以上,同时保持了高清画质。
带来的直接结果是,在消费级显卡(如 5090)上,生成 5 秒的视频所需时间小于 5 秒,实现了“1:1 实时生成”。
更具战略意义的是,LightX2V 并不仅仅服务于英伟达生态,它还打通了国产芯片。目前,Seko 2.0 已经实现了对国产 AI 芯片的深度适配。
这是一个实打实的商业策略。对于那些对价格极其敏感的小型工作室来说,如果国产算力能提供价格优势,这就是无法拒绝的吸引力。
“从用户侧来看,其实基本是无感的。” 王子彬非常自信地表示。虽然在研发端经历了巨大的适配挑战,但最终呈现的结果是,国产芯片在生成质量上与英伟达方案基本一致。
1
把想象力还给普通人
在发布会上,商汤科技董事长兼 CEO 徐立引用了克莱顿·克里斯坦森的经典理论《创新者的窘境》:很多颠覆性的创新,最初都是从“低毛利、边缘化”的市场切入的。
这解释了 Seko 2.0 为什么要死磕“短剧”和“漫剧”。
相比于对光影、纹理要求苛刻的院线电影,短剧和漫剧对画质有着天然的宽容度。这里的观众更在意剧情的爽点和更新的速度。这正是 AI 目前最好的练兵场。
事实也证明,这条路走通了。Seko 孵化的真人短剧《婉心计》拿到了抖音 AI 短剧榜的第一名。并且 Seko 已经宣布与长江电影集团签约,计划孵化院线级 AI 电影。
从几分钟的竖屏短剧,到 120 分钟的大银幕,中间的鸿沟依然巨大,但 Seko 似乎想通过“农村包围城市”的策略,一步步填平它。
王子彬在与媒体沟通中也提到,Seko 的用户里,其实只有 10%-20% 是专业的短剧工作室,但他们贡献了最高频的使用量;而剩下的大量用户,是 MCN 机构、自媒体人,甚至是教育工作者。
在技术和商业的宏大叙事之外,发布会的尾声,徐立分享的一个小故事或许最能代表这款产品的初衷。
一位普通的语文老师,利用 Seko 把学生的优秀作文变成了动画视频,在课堂上播放,点燃了孩子们巨大的创作热情。
AI 视频工具的终极意义,或许并不是为了让好莱坞导演失业,也不是为了制造更多的电子垃圾,而是为了让一个不懂画画的程序员、一个没有摄像机的公务员、或者一个充满幻想的小学生,都能拥有把想象力变成现实的权利。
只有工具不再昂贵,技术不再高冷,AI 视频的“工业革命”,才可能发生。

点个“爱心”,再走 吧
相关攻略
商汤绝影发布可悠(Care U):从“陪你聊天”到“帮你做事”的家庭AI新成员 4月8日,商汤绝影旗下迎来了一位重磅“新成员”——AI智能硬件产品“可悠(Care U)”。这款产品的定位很有意思,它试图完成的,是一次从“陪你聊天”到“帮你做事”的实质性跨越。 那么,它是如何实现这一步跨越的呢?关键在
近日,作为2026中关村论坛核心组成部分,由趋境科技与九源智能计算系统生态联合体共同主办的“全栈智能 全域推理:Token爆发元年的全场景大规模推理服务”专题研讨会成功举办。商汤大装置首席架构师项铁
图片由AI生成当大模型的竞争焦点从参数竞赛转向落地实效比拼,真正将技术转化为生产力,成为了行业内玩家的核心命题。作为中国AI领域的先行者,商汤科技最新发布的2025年业绩报告,也是一份关于AI产品化
智东西作者|江宇编辑|漠影智东西3月26日报道,昨日,中国计算机学会(CCF)发布声明,强烈反对NeurIPS新增限制条款,并倡议中国学者暂停投稿与审稿。▲中国计算机学会发布声明强烈反对并发起抵制这
近日,商汤大装置联合大晓机器人与广西产业技术研究院达成战略合作,就AI基础设施建设、具身数据采集、世界模型研发、机器人应用场景拓展等领域达成深度合作,开启三方携手赋能具身智能产业发展的新篇章。此次战
热门专题
热门推荐
TripMate是什么 规划一次完美的旅行,最磨人的往往是前期的信息海选和行程拼图。现在,一款名为TripMate的AI旅行助手,正试图把我们从这种繁琐中解放出来。简单来说,它是一个由人工智能驱动的个人旅行规划工具,核心目标就一个:让个性化的行程规划变得又快又省心。用户不必再在各种攻略网站间反复横跳
Artwo是什么 浏览器标签页多到能开火车,收藏夹杂乱得像毛线球——这大概是每个深度上网冲浪者的日常痛点。Artwo的出现,正是为了终结这种混乱。这款工具的核心,是将AI的智能与网页资源管理深度结合,帮你把散落各处的网页信息,整理成井井有条的知识库。它不仅仅是个高级书签管理器,更像是一个能理解你需求
Best AI Jobs是什么 当你琢磨着在人工智能领域找份新工作时,面对海量却不精准的招聘信息,是不是常常感到头疼?这时候,一个专业的垂直平台就显得尤为重要了。Best AI Jobs,正是为此而生。它是一个专注于人工智能领域的职业搜索引擎,核心使命就是帮用户在全球范围内精准定位AI相关的职位。无
FreeAIKit是什么 当你听到“AI工具套件”时,脑子里会浮现什么?复杂的代码、难懂的术语,还是昂贵的订阅费?FreeAIKit的出现,可以说彻底打破了这些刻板印象。这个由Easy With AI打造的综合平台,目标非常明确:让AI变得触手可及。它集成了图像生成、市场营销、生产力提升等一系列工具
WPS Office是什么 提到办公软件,很多人的第一反应可能是微软的Office套件。但今天,我们得好好聊聊另一个重量级选手——WPS Office。它出自中国的金山软件,是一款功能完整的免费办公解决方案。简单来说,它集成了文档编辑、表格处理、幻灯片制作以及PDF工具于一体,旨在为用户提供一个流畅





