解析从百模大战到大公司技术路径：为何仍需深入研究基础模型

时间：2026-01-18 12:55

2024年，中国人工智能（AI）行业上演了一场“百模大战”，截至当年年底，全国拥有10亿参数以上的大模型有近80个、100亿参数级的大模型逾10个，场面一度繁荣至极。两年多过去，当初的喧嚣已逐渐平息

2024年，中国人工智能（AI）行业上演了一场“百模大战”，截至当年年底，全国拥有10亿参数以上的大模型有近80个、100亿参数级的大模型逾10个，场面一度繁荣至极。两年多过去，当初的喧嚣已逐渐平息。据业内人士透露，还在持续研究基础大模型的企业已不足10家，其中包括商汤科技、稀宇科技、阶跃星辰等几家上海企业。

2025年，各种AI应用层出不穷，写文案、情感陪伴、重塑供应链……当甜美的果实已唾手可得，为什么上海AI企业还在“死磕”基础大模型？

Gemini 3成为爆款源于一次逆风坚守

2025年，AI领域的高潮一波接一波。11月，谷歌发布新一代人工智能模型Gemini 3，在最能体现大模型整体实力的LMArena排行榜上，它以1501分稳居第一；在“地狱难度”的数学能力测试中，它以23.4%的得分率远超竞争对手，而OpenAI的GPT-5.1等模型得分率仅在1%左右。

这被视作谷歌在AI领域的一场“绝地反击”，也彻底扭转了其在大模型竞赛中落后的风评。在2024年底ChatGPT引爆生成式AI浪潮后，被业内公认为AI“优等生”的谷歌一度陷入被动，产品迭代节奏滞后、市场信心动摇，有人不客气地评价它“起了个大早，赶了个晚集”。

上海模速空间内AI应用层出不穷。受访者提供

逆风局中，谷歌没有跟风OpenAI的“模仿学习到强化学习”路线，而是继续坚持自己的“理解生成一体化”路线，这与谷歌将大模型定义为提升效率的超级工具，而非情感伴侣有关。在生成式AI的长跑中，谷歌试图以耐力超越对手。凭借着出色的理解和推理，Gemini 3在应用市场上表现强劲，截至去年11月，其全球月活跃用户同比增长170%。

坚持是大模型研究的“稀有品质”。国内“百模大战”期间，复旦大学计算机科学技术学院教授邱锡鹏就注意到大模型同质化问题严重。在他看来，这些大模型虽然名字、作用不同，但背后都是“一张脸”，更令他焦虑的是，该领域的基础研究却在萎缩。以自然语言处理为例，2015年前，这个领域有对话、问答、机器翻译等各种方向，那时的学者互相分享自己的研究，并从别人那里获得灵感，而当大家都涌向语言模型这条赛道时，更多的可能性被扼杀了。

基础大模型决定应用能力上限

“我们会一如既往坚持基础大模型研究。”阶跃星辰副总裁李璟说。这家成立不到3年的沪上AI企业已累计发布22款基座模型，其中包括拥有强大视觉感知和复杂推理能力的新一代基础大模型Step 3。

阶跃星辰选择“死磕”基础大模型的逻辑相当简单：基础大模型的能力决定了应用的上限，目前大模型技术尚未收敛，如果过早将资源押注应用开发，一旦底层技术发生根本性变革，之前的研发将很快被新技术所取代。

在成立第十个年头、生成式AI成为产业主线的背景下，商汤于2024年底启动业务与组织架构分拆，推出“1+X”战略：将偏向应用层的智能驾驶“绝影”、家庭机器人“元萝卜”、智慧医疗“善萃”、智慧零售“善惠”等业务整合为“X创新业务”，自身则进一步聚焦生成式AI与视觉AI双引擎这“1”核心。

商汤元萝卜下棋机器人。受访者提供

这一调整并非技术路线的试探，而是商汤在完成AI代际转换之后，对核心能力与资源配置的再聚焦。生成式AI对商汤而言，已不再只是技术层面的突破，而是成为驱动公司未来增长的核心业务。

2025年，AI世界热点转换，世界模型成为焦点。美国斯坦福大学教授李飞飞领导的World Labs（世界实验室）推出3D世界生成模型Marble，并直言AI的下一个10年属于空间智能。同年，商汤也推出“开悟”世界模型3.0，在业内人士看来，该模型在对真实世界的建模能力上表现出色，其生成的视频具备很强的时间与空间一致性，有能力与Marble展开直接竞争。更令人惊讶的是，商汤早在2024年就已推出这一模型。

“不同的声音”正在复苏

产品覆盖200多个国家和地区、个人用户超2亿、月活用户超2700万——在个人用户端风生水起的Minimax（稀宇科技）也没有放弃基础大模型的研发。

去年10月，稀宇科技掀起一场AI技术的“全家桶”发布，文本大模型M2、视频模型海螺2.3、语音模型Speech 2.6和音乐模型Music 2.0，标志着中国AI企业在全模态技术领域的全面突破。

Minimax在港交所上市。受访者提供

其中，仅有10B激活参数的M2大模型在全球权威测评榜单Artificial Analysis（AA）上取得历史性突破——总分冲入全球前五、开源第一，跻身全球文本模型第一梯队。更令人称奇的是，M2的综合成本只有名列全球大模型“S级”梯队中的Claude 4.5的8%，推理速度却是后者的近两倍。这种“高智能，更实惠”的理念正在从根本上改写AI领域的“算力游戏”规则。

有意思的是，AI赛道上“不同的声音”正在复苏。复旦大学计算与智能创新学院教授张军平就提醒，现在AI的研究路径可能走反了，人类智能的进化应先从“感知”开始，再发展“认知”，也有人仍坚信能从以IBM沃森机器人为代表的“AI符号主义”技术路线中寻得新突破。

创新成果越是唾手可得，爆款越有可能出自冷门，这正是颠覆式创新的神奇之处。历史经验告诉人们，需要有组织的科研去捕捉“异常”，甚至颠覆已有体系。所以，为什么上海AI企业仍要“死磕”大模型？因为技术尚未收敛，一切皆有可能。

来源：https://www.163.com/dy/article/KJI4GCGF05506BEH.html