视频大模型的战场,硝烟味越来越浓了,而这场仗,正变得越来越“贵”。
5月11日,市场传出消息,快手有意分拆其视频生成大模型“可灵AI”,并以高达200亿美元的估值进行融资,本轮目标融资额约20亿美元,腾讯等投资方据传正在接洽中。更有消息指出,可灵AI当前的年化收入已达5亿美元,较春节前翻了一番。尽管快手与腾讯方面均未对此置评,但据《每日经济新闻》从接近交易人士处了解,围绕200亿美元估值的融资沟通确实在进行。
这背后是一个清晰的行业信号:当阿里、字节、快手等巨头悉数重兵压上,视频大模型的竞争已不可避免地滑向价格战的边缘。
“终端售价没变,技术却在不断迭代,一个客观事实就是,竞争越激烈,溢价空间就越被挤压。”一位国产视频模型公司的高管坦言。多家AI短剧公司的创始人也表达了类似看法:“本质上,随着模型公司不断下场‘调教’市场,模型的使用成本正在变得越来越亲民。”

然而,与终端市场“降价”趋势形成鲜明对比的,是模型研发端日益攀升的巨额成本。
首当其冲的是算力这座“吞金兽”。有报道称,字节跳动计划将2026年资本支出大幅提升约25%,至2000亿元规模,其中相当一部分将投向AI算力基础设施建设。快手也在业绩会上透露,预计2026年整体资本支出将达约260亿元,较2025年新增的110亿元投入,将主要用于支撑可灵大模型及其他基础大模型的算力需求。
与此同时,AI领域的人力成本也水涨船高,各大厂为争夺顶尖人才不惜重金。
字节跳动为旗下Seed团队设立了独立的“豆包股”激励计划,并对核心技术人员实施期权增发,根据绩效与职级,员工每月可获得价值数万至十余万元不等的期权,首批连续发放18个月,顶尖人才总包可达百万元级别。腾讯则通过升级“青云计划”应对竞争,将大模型作为招聘重点,相关岗位扩招超50%,并为顶尖技术人才提供极具市场竞争力的薪酬。
脉脉在2月5日发布的数据也印证了这股“抢人”热潮。互联网大厂发布的AI岗位年薪普遍高企,例如“豆包AI应用工程师”岗位年薪接近100万元,“千问APP用户增长算法工程师”岗位年薪最高可达128万元。
一面是研发与人力成本高企,另一面是市场端难以提价,资金实力自然就成了决定这场持久战胜负的核心筹码。
当然,激烈的竞争也催生了技术的快速进步。根据Artificial Analysis的文生视频榜单,目前排名前三的模型均为国产,分别是阿里的Happyhorse-1.0、字节的Seedance2.0和快手的可灵3.0。前述国产视频模型高管指出:“国产模型在底层技术上差距并不大,当下的核心竞争力在于谁能对视频垂类市场提供更深入、更贴身的服务。”其所在公司的业务增长也佐证了市场的潜力。
市场空间无疑是广阔的,尤其是随着AI短剧等新形态的兴起。Sensor Tower的数据显示,可灵移动端收入在2026年3月和4月环比增长显著,月活跃用户数也维持在700万以上的高位。
不过,热潮之下也需冷思考。视频大模型距离真正改造传统文娱工业,仍有不短的路要走。今年4月,可灵AI全球运营负责人曾雨珅在北京国际电影节的相关论坛上就指出,AI大模型尚未解决原生4K等影视级画质标准的问题,但她相信这只是时间问题。她认为,AI更可能催生像电子版《不眠之夜》或《西部世界》那样个性化、交互式的全新内容形态,但短期内未必会碘伏整个影视资本市场格局。
总而言之,无论是从技术攻坚的难度,还是市场竞争的白热化程度来看,视频大模型的这场竞赛,注定将走向一个更加“烧钱”的新阶段。
