在连连亏损下,曾经的AI四小龙开始学着贴地飞行。
4月10日,商汤科技发布了“日日新V6”大模型,多模态能力对标国际水平,数理分析甚至超越了GPT-4o。

凭借新模型的亮眼表现,商汤科技总算在大众面前刷了一波存在感。
说个不太遥远的往事:八九年前,商汤科技与旷视科技、云从科技、依图科技并称为“AI四小龙”。那时候,这个名号在圈内响当当。
如今,“AI六小龙”“杭州七小龙”的名号遍地开花,龙多了,曾经的“四小龙”自然也就慢慢被淡忘了。

现实很骨感。3月26日,商汤科技发布2024年度财报:全年总营收37.72亿元,净亏损43.06亿元。算下来,2018到2024年,累计亏损已超546亿元。
另一家已上市的云从科技也好不到哪去。2024年总营收约3.98亿元,同比下滑36.6%,归母净亏损在5.9亿到6.8亿元之间。从2017到2024年,累计亏损超过44.75亿元。
裁员的风波同样没有放过这四家:
商汤去年裁撤非核心业务,战略重组后员工总数从2021年的6113人缩减到4672人,连新加坡办公室都搬到了成本更低的区域;
云从去年传出全员降薪20%的消息,今年核心技术成员张岭辞职,核心技术人员名单上只剩下创始人加上一位副总经理;
依图就更惨了,裁员超过70%,医疗业务几乎关停,武汉、西安等地的分公司纷纷注销……
说白了,如今的AI四小龙早已坠落凡尘,不得不抛开理想,回归现实,重新适应行业的新节奏。
陷入商业化难题,从辉煌跌落
时间拨回到2011到2015年,旷视、依图、商汤、云从依次成立,全都聚焦在计算机视觉这个赛道上。那时候,计算机视觉就是AI的核心赛道,靠着人脸识别、图像识别这些技术,四家公司很快在AI圈里崭露头角。
2016年是个转折点。AlphaGo横空出世,击败了世界围棋顶尖高手李世石,全球AI热潮被彻底点燃,资本开始疯狂涌入。因为技术领先,这四家被并称为“AI四小龙”。

2017年以后,四小龙进入高速发展期。商汤一跃成为全球估值最高的AI初创公司,2021年在港股上市,开市首日市值突破2000亿港元;旷视在安防领域拿下了重要份额;依图在医疗影像和智慧城市上有所突破;云从则背靠政府和国有资本,在金融和安防市场开疆拓土,2022年成功在科创板上市。
但繁荣背后,商业化是绕不开的坎。高额的研发投入,换来的却是日益扩大的亏损。
更麻烦的是,OpenAI出来后,行业风向变了。大家渐渐把以自然语言处理为主的新技术看成AI的主流,计算机视觉反而退居次席。

局势很清楚:四小龙想活下去,不转型不行。
奋力自救,要留在AI牌桌上
根据Epoch AI的研究报告,预计到2028年,训练大语言模型的文本数据需求将覆盖互联网上所有的公共可用文本。届时,无文本可用的局面将摆上台面。

从这个角度看,从计算机视觉再转去做大语言模型,无异于从一个死胡同走向另一个死胡同。
但话说回来,AI的最终目标是AGI(通用人工智能),语言只是其中的一个形态。这恰恰意味着,骨子里带着视觉基因的AI四小龙,并非没有卷土重来的可能。
算力基础加长期积累的视觉数据——几家公司不约而同地把宝押在了多模态大模型上。
商汤从2018年就开始建设智算中心,2022年正式建成了亚洲最大的人工智能计算中心AIDC。其SenseCore AI大装置已经积累了超过600种预训练模型,支持千亿级参数模型的训练。

依图则换了一条路,与华&为联合推出了昇腾大模型一体机,将硬件成本降低了50%。在南京“城市之眼”项目中,算力密度达到了英伟达H100的95%,但采购成本仅为五分之一。
云从同样基于昇腾芯片,与华&为联合推出了从容大模型训推一体机,也支持千亿级参数模型训练。此外,云从还在昇腾910B芯片上做了深度适配,构建了混合模型云服务,既可支持自有模型,也可支持第三方模型。
商汤科技董事长兼CEO徐立在4月10日的演讲中直言:纯粹的语言模型并不能真正完整地表达人类的智能。多模态恰恰能够补充互联网上文本数据的不足,从图像和视频等非文本数据中挖掘出更多知识。

日日新V6大模型不仅支持多模态的原生融合,更突破了传统语言模型加插件式多模态的拼接模式。它通过跨模态桥接技术,实现不同模态数据的联合编码,避免了多任务训练中经常出现的“跷跷板效应”。
此前有论文指出,从文本模型扩大到多模态模型,后加入的图像、视频数据与语言数据之间会产生拉扯,甚至拉低文本数据的表现——这就是所谓的多模态噪音。
商汤科技首席科学家林达华透露,商汤从去年5月起就坚信多模态大模型是方向。最初尝试的是“核心模态加次要模态”的路径,但发现总会有一个模态被削弱。之后投入了大量训练,最终才实现了两个及以上模态之间的并存。
成效如何?去年,商汤生成式AI业务的收入达到了24亿元,在总收入中占比63.7%,同比涨幅超过100%。
今年年初,依图科技联合创始人林晨曦在接受媒体采访时表示,依图现在专注做以视觉为中心的多模态模型。他认为,这是通向AGI的一个重要方向,也就是空间智能。

同时他也坦言:最近三年虽然没赚大钱,但公司是盈利的,业务现金流为正,已经在AI商业化的路上有了初步的探索基础。
而旷视科技在算力上缺乏优势,选择了一条不一样的路——通过算法优化来减少对硬件的依赖,并与车企合作,转向智能辅助驾驶的纯视觉方案。
旷视创始人印奇空降成为千里科技董事长,与吉利共同推出了覆盖全系车型的智能辅助驾驶系统。

在被问到依图未来10年的最终目标时,林晨曦的回答很实在:我们很少谈三年以上的事情,更多的在谈未来三个月、三周的事。因为发展不是靠口号喊出来的。
现在的AI四小龙,不飘了,很务实。
