汤臣核心刘宇再创业:10个月估值超13.2亿,红杉IDG押注多模态AI
尽管行业关注度持续攀升,很多人可能仍未注意到一个关键动态:前商汤科技研究总监、现象级AIGC产品"秒画"的核心研发者刘宇,已悄然带领新公司完成多轮融资,最新估值突破13.2亿美元。这一消息并非来自高调的融资公告,而是隐于其个人主页的更新轨迹:2025年1月创立的专注"实时交互多模态内容"的AI初创企业;2月完成种子轮融资,由红杉中国与IDG资本联合领投;8月Pre-A轮估值超4亿美元;11月A轮估值跃升至13.2亿美元。仅用一年时间,这家初创企业便跻身全球视频模型创业公司第一梯队,与Runway(30亿美元)、Luma(40亿美元)、Pika Labs(数亿美元)等头部玩家同台竞技。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
更引人瞩目的是,虽然估值已达13.2亿美元,这家公司却始终未正式公布名称,其核心产品也未公开亮相。不过业内人士通过蛛丝马迹推测,刘宇的创业项目极有可能是Vivix AI。Vivix明确描述的技术方向——聚焦"内容实时互动"与"下一代视觉生成引擎",与刘宇个人主页中的愿景高度契合。进一步追溯公开信息,Vivix Group Limited注册于香港,控股杭州、上海两家名为"维悦时刻科技"的企业,其法人代表余锋伟与宋广录均曾在商汤任职,而刘宇本人也长期担任商汤研究执行总监。这种"老同事再聚首"的创业组合,让市场推测更具可信度。今年刘宇在ICML、CVPR等顶会发表的多篇论文中,余锋伟与宋广录均位列合作者名单,公司对估值的官方表述也与刘宇个人主页一致,多重线索相互印证。
刘宇在学术与产业领域的履历堪称"教科书级别"。他在香港中文大学MMLab完成博士训练,师从王晓刚教授,早期研究聚焦图像识别、检测与多视角三维理解,曾在ImageNet、MOT等国际竞赛中斩获冠军。加入商汤后,他担任执行研究总监,带领近百人团队开发大规模AIGC与多模态交互模型,掌管超过4000张GPU的算力资源。其主导的"秒画"产品上线9天用户数突破300万,日活超53万,成为早期"AI绘图+内容社区"模式的标杆案例。这段经历赋予他双重优势:既具备"数千卡算力+千万级用户"的实战经验,又完成了从"识别"到"生成+多模态+长时序"的技术转型,为视频模型创业埋下伏笔。
从融资节奏看,这家初创企业的成长速度堪称"极致"。2025年1月成立后,2月即锁定红杉中国与IDG资本的种子轮投资;8月Pre-A轮估值突破4亿美元;11月A轮估值达13.2亿美元。这一速度在全球AI视频赛道亦属罕见:Runway在2025年4月完成3.08亿美元D轮融资后估值达30亿美元;Luma AI同年底融资9亿美元后估值升至40亿美元;Pika Labs在2024-2025年间多轮融资后估值徘徊于4.7亿至7亿美元区间。相比之下,刘宇的新公司在产品未全面公开、品牌知名度有限的情况下,已跻身估值中上部,资本押注的逻辑值得深究。
刘宇对公司方向的描述仅有一句话:"致力于实时交互式多模态内容",但结合Vivix的技术路线与他的研究轨迹,可勾勒出更清晰的图景。传统互联网以"信息流"为核心,内容被预制、编辑后单向推送,用户被动接收。Vivix则判断,下一代互联网的底层界面将是"交互式生成AI":用户与系统实时互动,系统通过视觉、听觉、文字、动作等多模态输入即时生成个性化内容,创作过程变为持续流动的互动。这一愿景的核心挑战在于"实时性"——当前最强视频生成模型虽质量惊人,但推理速度慢、成本高,难以支撑交互场景。Vivix的解决方案涉及三方面:其一,通过自适应低精度计算动态调整位宽,在精度与效率间取得平衡,降低计算、内存与通信成本;其二,开发基于深度学习编译器的推理引擎,自动优化算子切分与计算图融合,提升硬件利用率;其三,设计混合多维并行策略,针对视频的时间、空间、通道与模态维度拆分组和,适配异构GPU环境。这些技术创新使推理速度提升两个数量级,实现"0.6秒生成T秒画面"的突破。
在速度与成本问题解决后,Vivix将矛头指向"以语言为中心的智能范式"。当前主流大模型以"预测下一个token"为目标,本质是统计模仿,难以理解思想本质;训练数据经语言过滤后存在偏差,模型学到的世界是"语言回响"的缩影;多模态系统虽能处理图像、视频,但常将信息路由回语言通道,导致信息损失与认知偏差。Vivix的解决方案是构建原生多模态系统:视觉、听觉与动态画面作为"一等公民"在统一标记空间交互,语言仅是通路之一,而非"总路由"。这一设计旨在让AI直接跨模态感知世界,形成非语言中心的内部表征,从而更贴近现实、更具自主性。
这家估值13.2亿美元的初创企业之所以引发行业关注,不仅因其融资速度,更因其选择了一条"反向道路":在视频模型竞争白热化的阶段,不追求更精美的生成效果或更高参数量,而是试图将视频转化为实时交互语言,重新定义互联网界面为"AI原生、实时、多模态"形态。尽管团队规模不足20人,却覆盖模型、系统、编译器与产品体验全栈,技术野心可见一斑。目前,其核心产品尚未亮相,市场考验尚未开始,但若赌对方向,或将推动视频从被动内容形态升级为人与AI协同创造的实时界面。资本押注的是可能性,行业关注的是变量,而答案终将由产品揭晓——它是技术炫技的短暂火花,还是互联网交互新范式的开端?这道题,答案不远。
热门专题
热门推荐
加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这
微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿
稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D
基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一
PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票





