A16Z观察：视频模型从爆发到分化，谁能抓住产品化机遇？

首页/科技数码/文章详情

A16Z观察：视频模型从爆发到分化，谁能抓住产品化机遇？

时间：2025-10-28 09:07

在过去一年，几乎每周都有一款新的视频生成模型登场，不断刷新基准成绩：更长的视频、更真实的物理、更一致的角色与镜头语言。我们习惯了模型性能一路狂飙、不断突破。但今年，节奏变了。如果你密切关注基准

过去一年，几乎每周都有新的视频生成模型问世，不断刷新基准成绩：生成视频的时长越来越长、物理效果愈发逼真、角色形象与镜头语言也更加协调。我们已经习惯了模型性能一路飙升、持续突破。

但今年，节奏变了。如果你密切关注基准测试，可能会感觉"进步"放缓了：大多数主流模型都能生成10到15秒带同步音轨的视频，效果已经相当出色，但也不再令人惊艳。

这并非坏事。在A16Z合伙人贾斯汀·摩尔看来，我们正在进入一个新阶段：视频模型的"产品时代"。

简单来说，视频模型的进步不再体现在参数规模或基准分数上，而是转向多样性和专业化发展。例如，我们看到不同模型在特定能力上各有建树：物理模拟、卡通风格、多镜头剪辑……没有任何一个模型能够"通吃全场"，但每个模型都在特定维度上变得更擅长。

与此同时，更大的机会开始从模型本身，转向"围绕模型"的产品构建：那些能简化创作流程、抽象出复杂操作的工具，正变得比模型本体更有价值。

今天，就让我们跟随贾斯汀·摩尔来看看视频模型在过去一年的变化。

麻将

01 视频领域不存在最强模型

过去几年，各大扩散模型实验室不断发布性能更强的新版本，在各种测试榜单上刷新纪录。大家逐渐形成一个共识：总有一天会出现一个"神级模型"，在所有视频生成任务中表现最出色，成为行业默认标准。

但这个假设最近被打破了。上个月发布的Sora 2，在LMarena等测试中的表现甚至不如Veo 3，出现不升反降的情况。很多人开始怀疑，扩散模型的技术进步是不是开始变慢了。所谓"最强模型"的概念，在视频领域可能根本不存在。

其实，大语言模型也走过类似路径。2024到2025年，主流模型性能持续上升，之后在各种评测中逐渐趋于稳定。到了这个阶段，各家研究机构开始把重心放在具体场景和垂直领域上，而不是单纯追求更高分。同时，基于这些模型的AI产品也开始快速落地。

回头看，视频模型在公开测试上进展放缓其实也可以理解。过去几年，它们在"真实感"上突飞猛进，现在很多生成视频已经非常逼真。到了这个阶段，再想做得"更真实"就很困难了，因为它已经几乎和现实看不出区别。

这就好比17、18世纪的油画大师们，已经能画出接近照片的肖像和风景。那时大家不再纠结谁更写实，而是开始关注作品的风格和审美取向。

如果"更真实"不再是模型的优势来源，接下来会发生什么？我们可能会看到更多风格化、专业化的模型出现。每个模型不再追求通用，而是各有专长。资源丰富，选择也变多了。视频生成，正在进入一个"百花齐放"的新阶段。

02 视频模型价值开始分化

在聊模型越来越"专业化"之前，先简单回顾一下过去。

2024年初，我写过一篇文章，当时的视频生成技术还很原始。别说一分钟，连生成3到4秒的稳定片段都很难。物理效果经常崩坏，比如人物会突然"融化"到地板上，篮球会以奇怪的轨迹弹来弹去，最后却能神奇地进篮筐。

那时我说：距离AI拍出像皮克斯那样的短片，还有很长的路要走。而现在，一切都变了。

谷歌推出了Veo模型，直接登上多个排行榜榜首；OpenAI正在用30人团队、3000万美元预算，制作一部完整的AI动画长片（虽然不完全由模型生成，但依然是一次飞跃）。如今，视频长度更长，物理细节更真实。篮球从篮板反弹再落地？已经是标配。

不过，虽然整体水平在变好，我们也看到了另一个趋势：模型正在变得专一，各有专长。

为什么会这样？很简单，没有一款模型能满足所有用户的需求，比如有的团队专注提速和成本控制；有的专攻后处理阶段，让模型在某些场景表现得特别好。

比如：

Veo 3：最擅长物理细节、复杂动作，音画同步也做得最好

Sora 2：可以根据一句话生成有趣的多镜头视频，像是在帮你"拍短剧"

Wan：开源模型，支持很多风格化插件（LoRA），适合定制风格

Grok：速度快、成本低，特别适合动画内容

Seedance Pro：可以一次性生成多镜头结构

Hedra：长时间对话类视频的表现最稳

以Veo和Sora为例，两者都很强，但方向完全不同。

Sora适合创作趣味内容，比如用一句话生成一段"霍金打篮球"的视频，或把你和朋友放进某部电影里。它更像是一位"故事导演"，适合普通用户和meme创作者。但它在物理表现、音视频同步方面还不太稳定，经常出现嘴型不对、声音延迟等问题。

相比之下，Veo就更"专业"。它缺乏幽默感，需要你提供更清晰的指导，但它的动作、镜头、音画同步更精准，更适合内容创作者、影视工作者这类对质量要求高的用户。

这种"专业化"趋势也带动了整条生态链的发展。像Fal、Replicate这样的AI视频云平台，已经托管了几十种模型，供用户按需选择。Krea这类编缉工具，则提供了一个中心平台，让用户可以和多个模型打交道，并建立自己的工作流程。

当然，一些大公司仍在努力追求"万能型模型"，那种什么都精通的"上帝视角"模型。我们当然希望它能早点出现。但在这之前，不同模型在不同场景里"各显神通"，已经是一个非常现实、非常值得期待的阶段了。

03 AI视频下一个方向是更好的产品化

熟悉我的朋友都知道，我平时会用各种视频和图像生成模型，去尝试制作一些非常定制化的内容。这个过程往往涉及好几个工具来配合使用。

举个例子：如果我需要制作一个"定制化家具展示视频"，我通常会用到Ideogram、nano-banana和Veo3；如果是要在已有视频中添加"产品赠品"的动画片段，那就要靠nano-banana、Hedra，再加上一些编缉工具比如Krea和Kapwing。

这些组合工作流程其实挺复杂的，不是每个人都有时间、精力去折腾这么多工具。我们确实需要更好的一体化产品来简化整个创作过程。现在模型的能力已经很强大，但对应的产品进度，依然有很多"追赶空间"。

很多创作者正在手动拼接多个模型的功能，来完成模型本可以自动做到的事情。

比如，要让角色在不同镜头中保持一致，就需要在每段视频里手动调整人物形象；如果想延续上一个镜头的结尾画面，还得把最后一帧导出来，再作为下一段的起始条件去重新生成；控制镜头运动轨迹，也得先用图像模型画出起点和终点画面，再通过其他工具去"推导"中间的过渡过程；甚至连续做一张故事板，都要靠拼贴、截图、剪辑多个片段才能完成。

这些本可以由模型自动处理的工作，如今却依然依赖创作者手动拼接，正是产品体验和创作效率之间的巨大断层。好消息是，有些团队已经开始尝试解决这些问题。

Runway就发布了一套工具，可以让用户修改镜头角度、生成下一个镜头、切换风格、改变天气，甚至在画面里加东西或删东西。

OpenAI的Sora Storyboard也支持更细致地控制视频中每一帧的动作；而谷歌刚发布的Veo 3.1，更像是"产品更新"而非"模型升级"，它围绕视觉控制和视觉效果控制做了很多增强功能。

其实，这就像我们过去看到的大语言模型（LLM）一样：即便模型性能不再突飞猛进，围绕它构建产品的空间依然非常大。视频模型现在也处在这个阶段，能力不缺，缺的是好用的产品。

未来，我相信我们会看到越来越"小而美"的模型，专门为某个行业或某种场景优化，比如室内设计、营销、动画制作等等。

同时，我们也需要更强大的"创意工具包"来打通各种模态，让视频、配音、音乐这些元素的生成与编辑更顺畅，最终形成一套完整的AI视频工作流。

来源：https://36kr.com/p/3527986756983940

上一篇全面解读固态电池困局：技术瓶颈与未来突破路径 下一篇享界S9首月销量破2万，11月新款压轴登场

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-01

OpenClaw手机App上线，结果翻车了

OpenClaw 官方宣布，已正式推出 iOS 和 Android 原生移动 App，用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接：把 Agent 放进口袋里，让用户可以在移动端处理频道消息、任务和回复。从功能上看，OpenClaw 移动端并

科技数码 · 2026-07-01

优必选CEO周剑：家庭机器人生态核心投入过半精力

先说几个核心判断：优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上，直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进，现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景，另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间，技术路线尚未收敛

6月30日，申银万国在光连接系列研报中重点指出，MPO光连接器领域的投资机会值得高度关注。通俗来说，随着AI算力集群持续扩张，光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件，如今它直接决定着链路插损、可

科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上，区级部门一次性推出了7个AI“龙搭子”。其中，名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解，依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”，已在今年五一假期发布了内测版本。经过一个月市场验证后，该项目正式启动面向全社会的

科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日，南下资金持续大举买入港股，单日净流入金额高达58 95亿港元。接下来，我们直接盘点哪些个股获得资金青睐、哪些遭到减持：净买入方面，中芯国际领跑全场，单日吸金19 33亿港元；建滔积层板紧随其后，净买入10 59亿港元；腾讯控股获得7 65亿港元净流入；智谱（02513 HK）也有6 5