2025年初,在DeepSeek V3及R1两款模型火爆市场前后,硅基流动敏锐抓住机遇,于2月1日率先推出了基于国产芯片服务的模型版本,赢得了广泛关注和大量用户。
彼时,硅基流动的主要目标用户集中在C端(消费者端),对企业端的大模型应用场景和需求尚持观望态度。经过半年发展,通过对700万注册用户和1万余家企业用户的观察,企业需求发生了显著变化。
硅基流动联合创始人胡健向记者透露,团队注意到多数企业已从最初的尝试性探索转变为发现更多实际应用场景(如智能办公、能源行业的系统优化等),并已具备规模化部署的条件。
在此背景下,公司正式推出了企业级MaaS(模型即服务)平台,该平台涵盖异构算力管理、模型训练、推理部署全流程。平台预装了多款主流开源与闭源大模型,配备多种算力卡推理加速方案,新模型仅需1-3天即可完成适配并部署至企业私有环境。
自AI大模型创业热潮兴起以来,在模型层与应用层的交替发展中,一批专注提供MaaS服务的中间层企业迅速崛起,致力于构建稳定的基础设施。硅基流动正是这一领域的代表性企业之一。

企业在部署大模型过程中长期面临诸多挑战,包括模型选择困难、适配周期长、成本效益比低、模型升级导致的业务中断等问题。硅基流动的核心解决方案是通过公有云模式快速响应模型和用户需求,同时完善国产芯片软件生态,提升算力运营效率,实现企业"开箱即用"的大模型能力。
在与传统云厂商的MaaS服务竞争中,硅基流动如何实现差异化是一个关键问题。
异构算力管理是差异化优势的重要体现。胡健指出,现有企业客户中大型国企占比较高,这些企业通常拥有大量国产芯片资源,需要基于异构算力进行模型部署。但目前国产芯片从基本可用达到优异性能仍存在提升空间。因此,针对国产芯片的模型适配与推理加速,使其性能接近英伟达等国际厂商GPU的水平,成为MaaS平台的重点工作。
为此,硅基流动开发了专有大模型推理引擎,支持英伟达、AMD、昇腾、沐曦、摩尔等主流芯片平台,其核心优势体现在新模型的快速适配能力。
例如,传统国产芯片对新模型的适配通常需要数周甚至数月。而基于硅基流动的国产芯片公有云平台,72B稠密模型可实现当日上线,MoE架构模型最快1-2天内即可部署完成。
对模型层与算力层的深刻理解,以及对其产品的精准把握,往往是中间层企业建立先发优势的关键。胡健回忆道,在DeepSeek V3和R1发布前,原团队建议配备40台H100服务器。考虑到成本因素,硅基流动选择与华为昇腾合作,迅速推出适配国产芯片的V3及R1版本。
事实证明,这一决策极具前瞻性。"我们最初用户基数不足50万,短短一个月就突破500万,增长近10倍。"胡健说。但类似R1这样的爆款机遇在行业内已难以复制。
目前更常见的做法是采用市场化策略,在新模型发布后及时评估性能,满足要求的模型会先用少量设备进行流量验证,再根据需求弹性扩展。"但市场遵循二八法则,20%-30%的热门模型承载着80%的流量需求。"
在商业模式方面,MaaS平台仍在持续探索。当前主要采用项目制和token计费两种模式,前者存在规模限制,后者则需应对token价格持续下降的趋势。胡健预测,未来token收费可能参考电力行业模式,根据不同行业和应用场景实施分级定价制度。他认为,市场仍在快速发展阶段。
根据IDC数据,2024年12月中国公有云大模型日均tokens调用量达9522亿次,较2024年6月的963亿次增长近10倍。随着模型迭代加速和应用场景不断丰富,业内普遍预计AI算力需求将保持长期增长态势。
"在如此快速增长的市场中,我们作为新兴企业,既有独特使命,也找到了生存发展空间。"胡健表示,当前市场远未达到红海竞争阶段,仍处在大模型应用服务的早期发展阶段。
随着模型和应用日益多元化,中间层企业也有机会在特定领域纵深发展,将模型能力、技术功能与行业特性深度结合,最终形成差异化的竞争壁垒。
