解析从百模大战到大公司技术路径:为何仍需深入研究基础模型

2024年,中国人工智能(AI)行业上演了一场“百模大战”,截至当年年底,全国拥有10亿参数以上的大模型有近80个、100亿参数级的大模型逾10个,场面一度繁荣至极。两年多过去,当初的喧嚣已逐渐平息。据业内人士透露,还在持续研究基础大模型的企业已不足10家,其中包括商汤科技、稀宇科技、阶跃星辰等几家上海企业。
2025年,各种AI应用层出不穷,写文案、情感陪伴、重塑供应链……当甜美的果实已唾手可得,为什么上海AI企业还在“死磕”基础大模型?
Gemini 3成为爆款源于一次逆风坚守
2025年,AI领域的高潮一波接一波。11月,谷歌发布新一代人工智能模型Gemini 3,在最能体现大模型整体实力的LMArena排行榜上,它以1501分稳居第一;在“地狱难度”的数学能力测试中,它以23.4%的得分率远超竞争对手,而OpenAI的GPT-5.1等模型得分率仅在1%左右。
这被视作谷歌在AI领域的一场“绝地反击”,也彻底扭转了其在大模型竞赛中落后的风评。在2024年底ChatGPT引爆生成式AI浪潮后,被业内公认为AI“优等生”的谷歌一度陷入被动,产品迭代节奏滞后、市场信心动摇,有人不客气地评价它“起了个大早,赶了个晚集”。

上海模速空间内AI应用层出不穷。受访者提供
逆风局中,谷歌没有跟风OpenAI的“模仿学习到强化学习”路线,而是继续坚持自己的“理解生成一体化”路线,这与谷歌将大模型定义为提升效率的超级工具,而非情感伴侣有关。在生成式AI的长跑中,谷歌试图以耐力超越对手。凭借着出色的理解和推理,Gemini 3在应用市场上表现强劲,截至去年11月,其全球月活跃用户同比增长170%。
坚持是大模型研究的“稀有品质”。国内“百模大战”期间,复旦大学计算机科学技术学院教授邱锡鹏就注意到大模型同质化问题严重。在他看来,这些大模型虽然名字、作用不同,但背后都是“一张脸”,更令他焦虑的是,该领域的基础研究却在萎缩。以自然语言处理为例,2015年前,这个领域有对话、问答、机器翻译等各种方向,那时的学者互相分享自己的研究,并从别人那里获得灵感,而当大家都涌向语言模型这条赛道时,更多的可能性被扼杀了。
基础大模型决定应用能力上限
“我们会一如既往坚持基础大模型研究。”阶跃星辰副总裁李璟说。这家成立不到3年的沪上AI企业已累计发布22款基座模型,其中包括拥有强大视觉感知和复杂推理能力的新一代基础大模型Step 3。
阶跃星辰选择“死磕”基础大模型的逻辑相当简单:基础大模型的能力决定了应用的上限,目前大模型技术尚未收敛,如果过早将资源押注应用开发,一旦底层技术发生根本性变革,之前的研发将很快被新技术所取代。
在成立第十个年头、生成式AI成为产业主线的背景下,商汤于2024年底启动业务与组织架构分拆,推出“1+X”战略:将偏向应用层的智能驾驶“绝影”、家庭机器人“元萝卜”、智慧医疗“善萃”、智慧零售“善惠”等业务整合为“X创新业务”,自身则进一步聚焦生成式AI与视觉AI双引擎这“1”核心。

商汤元萝卜下棋机器人。受访者提供
这一调整并非技术路线的试探,而是商汤在完成AI代际转换之后,对核心能力与资源配置的再聚焦。生成式AI对商汤而言,已不再只是技术层面的突破,而是成为驱动公司未来增长的核心业务。
2025年,AI世界热点转换,世界模型成为焦点。美国斯坦福大学教授李飞飞领导的World Labs(世界实验室)推出3D世界生成模型Marble,并直言AI的下一个10年属于空间智能。同年,商汤也推出“开悟”世界模型3.0,在业内人士看来,该模型在对真实世界的建模能力上表现出色,其生成的视频具备很强的时间与空间一致性,有能力与Marble展开直接竞争。更令人惊讶的是,商汤早在2024年就已推出这一模型。
“不同的声音”正在复苏
产品覆盖200多个国家和地区、个人用户超2亿、月活用户超2700万——在个人用户端风生水起的Minimax(稀宇科技)也没有放弃基础大模型的研发。
去年10月,稀宇科技掀起一场AI技术的“全家桶”发布,文本大模型M2、视频模型海螺2.3、语音模型Speech 2.6和音乐模型Music 2.0,标志着中国AI企业在全模态技术领域的全面突破。

Minimax在港交所上市。受访者提供
其中,仅有10B激活参数的M2大模型在全球权威测评榜单Artificial Analysis(AA)上取得历史性突破——总分冲入全球前五、开源第一,跻身全球文本模型第一梯队。更令人称奇的是,M2的综合成本只有名列全球大模型“S级”梯队中的Claude 4.5的8%,推理速度却是后者的近两倍。这种“高智能,更实惠”的理念正在从根本上改写AI领域的“算力游戏”规则。
有意思的是,AI赛道上“不同的声音”正在复苏。复旦大学计算与智能创新学院教授张军平就提醒,现在AI的研究路径可能走反了,人类智能的进化应先从“感知”开始,再发展“认知”,也有人仍坚信能从以IBM沃森机器人为代表的“AI符号主义”技术路线中寻得新突破。
创新成果越是唾手可得,爆款越有可能出自冷门,这正是颠覆式创新的神奇之处。历史经验告诉人们,需要有组织的科研去捕捉“异常”,甚至颠覆已有体系。所以,为什么上海AI企业仍要“死磕”大模型?因为技术尚未收敛,一切皆有可能。
相关攻略
在评估大模型API的调用成本时,“一百万Token”是一个核心的计价基准。这串数字究竟意味着多少实际文本?又会带来多少费用?对于希望将AI能力集成到业务中的开发者和企业决策者而言,透彻理解这笔账,是进行技术选型、制定预算和实现商业价值最大化的第一步。 图源:AI生成示意图 一、Token与文本量的实
生成式AI正以前所未有的速度重塑商业格局。Gartner的预测为我们描绘了清晰的未来图景:到2026年,超过80%的企业将在生产环境中部署或调用大语言模型。然而,当我们将目光从实验室的炫酷演示转向真实的业务场景时,会发现一条充满挑战的“最后一公里”。许多企业的首席信息官(CIO)都在反馈同一个核心问
在调用大语言模型API时,账单上那个按“Token”计费的标准,常常让人有些摸不着头脑。这背后其实是一套将人类语言转化为机器可量化计算单元的精密商业逻辑。理解它,是合理控制算力成本的第一步。 图源:AI生成示意图 一、Token 的基础概念与字数换算 大模型并非直接“阅读”文字,而是先将句子切分成最
2024年,大模型正从技术热潮的顶峰,稳步走向商业应用的深水区。麦肯锡在《2023年生成式AI的经济潜力》报告中给出了一个令人瞩目的数字:生成式AI每年有望为全球经济贡献2 6万亿至4 4万亿美元的增长。然而,对于身处一线的企业决策者而言,真正的挑战在于如何将这项前沿技术,从对话框里的“聊天机器人”
想要高效接入小米MiMo大模型,将其强大的云端AI能力快速整合到你的应用或项目中?这份详细的接入指南将为你梳理清晰路径,帮助你节省前期摸索成本,快速进入开发阶段。整个过程可以概括为三个核心环节:定位官方平台、完成身份认证、并充分利用官方提供的开发支持工具。 一、官方控制台入口 一切始于找到正确的官方
热门专题
热门推荐
以太坊基金会成立隐私研究集群,旨在推动私密支付与匿名投票等关键隐私技术的发展。该集群将整合研究资源,探索相关技术的最新趋势与潜在应用,为构建更安全、保护用户数据的去中心化生态系统提供支持。
MetaMask宣布将推出永续合约交易功能,允许用户进行双向开仓交易,覆盖多种加密资产。该功能伴随高波动性与爆仓风险,需谨慎操作。平台计划于十月底启动奖励计划,以吸引用户参与。投资者可通过主流交易平台注册并利用APP查看交易数据,同时需注重仓位管理、止盈止损及资金安全。
Meme币“币安汽车”市值近期大幅上涨,其背后与币圈知名人物贾跃亭的操盘策略密切相关。该现象揭示了当前加密货币市场中Meme币作为一种投机资产的波动性与关注度,反映了市场对特定人物影响力的高度敏感。
访问欧易官网需核对域名,防范钓鱼风险。建议通过官方渠道下载最新版APP。注册后需完成实名认证并绑定安全设备以提升安全。首次购币可通过C2C交易区进行,平台提供担保。此外,平台还提供合约交易、理财及行情分析等功能。新手应从官方渠道入手,逐步完成安全设置与交易。
币安交易所提供官网及移动应用两种访问方式,用户可通过官方渠道下载应用并完成注册,以使用其交易服务。平台支持多种数字资产交易,操作便捷,适合不同需求的投资者。





