游乐游手机版
首页/科技数码/文章详情

中小厂商如何突围?硅基流动业务加速下的AI大模型竞争策略

时间:2025-12-13 16:45
2025年初,凭借在DeepSeek V3及R1爆火前后的迅速反应,硅基流动赶在2月1日上线了基于国产芯片服务的前述两款模型,赚得了市场一大波关注及用户。彼时,硅基流动的更多目标用户指向C端(消费者

2025年初,在DeepSeek V3及R1两款模型火爆市场前后,硅基流动敏锐抓住机遇,于2月1日率先推出了基于国产芯片服务的模型版本,赢得了广泛关注和大量用户。

彼时,硅基流动的主要目标用户集中在C端(消费者端),对企业端的大模型应用场景和需求尚持观望态度。经过半年发展,通过对700万注册用户和1万余家企业用户的观察,企业需求发生了显著变化。

硅基流动联合创始人胡健向记者透露,团队注意到多数企业已从最初的尝试性探索转变为发现更多实际应用场景(如智能办公、能源行业的系统优化等),并已具备规模化部署的条件。

在此背景下,公司正式推出了企业级MaaS(模型即服务)平台,该平台涵盖异构算力管理、模型训练、推理部署全流程。平台预装了多款主流开源与闭源大模型,配备多种算力卡推理加速方案,新模型仅需1-3天即可完成适配并部署至企业私有环境。

自AI大模型创业热潮兴起以来,在模型层与应用层的交替发展中,一批专注提供MaaS服务的中间层企业迅速崛起,致力于构建稳定的基础设施。硅基流动正是这一领域的代表性企业之一。

硅基流动MaaS平台

企业在部署大模型过程中长期面临诸多挑战,包括模型选择困难、适配周期长、成本效益比低、模型升级导致的业务中断等问题。硅基流动的核心解决方案是通过公有云模式快速响应模型和用户需求,同时完善国产芯片软件生态,提升算力运营效率,实现企业"开箱即用"的大模型能力。

在与传统云厂商的MaaS服务竞争中,硅基流动如何实现差异化是一个关键问题。

异构算力管理是差异化优势的重要体现。胡健指出,现有企业客户中大型国企占比较高,这些企业通常拥有大量国产芯片资源,需要基于异构算力进行模型部署。但目前国产芯片从基本可用达到优异性能仍存在提升空间。因此,针对国产芯片的模型适配与推理加速,使其性能接近英伟达等国际厂商GPU的水平,成为MaaS平台的重点工作。

为此,硅基流动开发了专有大模型推理引擎,支持英伟达、AMD、昇腾、沐曦、摩尔等主流芯片平台,其核心优势体现在新模型的快速适配能力。

例如,传统国产芯片对新模型的适配通常需要数周甚至数月。而基于硅基流动的国产芯片公有云平台,72B稠密模型可实现当日上线,MoE架构模型最快1-2天内即可部署完成。

对模型层与算力层的深刻理解,以及对其产品的精准把握,往往是中间层企业建立先发优势的关键。胡健回忆道,在DeepSeek V3和R1发布前,原团队建议配备40台H100服务器。考虑到成本因素,硅基流动选择与华为昇腾合作,迅速推出适配国产芯片的V3及R1版本。

事实证明,这一决策极具前瞻性。"我们最初用户基数不足50万,短短一个月就突破500万,增长近10倍。"胡健说。但类似R1这样的爆款机遇在行业内已难以复制。

目前更常见的做法是采用市场化策略,在新模型发布后及时评估性能,满足要求的模型会先用少量设备进行流量验证,再根据需求弹性扩展。"但市场遵循二八法则,20%-30%的热门模型承载着80%的流量需求。"

在商业模式方面,MaaS平台仍在持续探索。当前主要采用项目制和token计费两种模式,前者存在规模限制,后者则需应对token价格持续下降的趋势。胡健预测,未来token收费可能参考电力行业模式,根据不同行业和应用场景实施分级定价制度。他认为,市场仍在快速发展阶段。

根据IDC数据,2024年12月中国公有云大模型日均tokens调用量达9522亿次,较2024年6月的963亿次增长近10倍。随着模型迭代加速和应用场景不断丰富,业内普遍预计AI算力需求将保持长期增长态势。

"在如此快速增长的市场中,我们作为新兴企业,既有独特使命,也找到了生存发展空间。"胡健表示,当前市场远未达到红海竞争阶段,仍处在大模型应用服务的早期发展阶段。

随着模型和应用日益多元化,中间层企业也有机会在特定领域纵深发展,将模型能力、技术功能与行业特性深度结合,最终形成差异化的竞争壁垒。

来源:https://www.jiemian.com/article/13368614.html
上一篇英伟达联手英特尔发力AI PC市场,联发科或面临挑战 下一篇美团上线"现做现炒"商家标识,保障消费者知情选择权
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元
科技数码 · 2026-07-03

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售,支持4K165Hz与FHD520Hz双模切换,定价1888元。采用FastIPS面板,97%DCI-P3色域,配备升降支架及双HDMI2 1和双DP1 4接口。

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%
科技数码 · 2026-07-03

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年,DRAM与NAND闪存的供应持续紧张及价格不断攀升,正逐步传导至终端消费市场。可以预见,下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价,最终连苹果也不得不跟进,宣布提升iPad、Mac及家居设备的价格,以应对存储成本的快速上涨。 TrendForce分析指出,苹果全面

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波
科技数码 · 2026-07-03

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果自研C2芯片仅支持Sub-6GHz,不支持5G毫米波。因此,美版iPhone18Pro继续采用高通基带方案以支持毫米波,而其他地区版本则搭载苹果自研C2芯片。这一差异将导致在毫米波覆盖的市场中,用户峰值速率可能显著低于美版用户。

纳睿雷达推出睿宸超精细化短时临近AI气象大模型
科技数码 · 2026-07-03

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达近日释放了一项重磅成果。2026年7月1日,公司正式对外发布了两款自主研发的全新产品:一款是“WDSPT0152型”S波段全极化多功能有源相控阵雷达,另一款则是名为“睿宸”的超精细化短时临近AI气象大模型。从产品战略来看,此次发布直指气象监测与灾害预警领域的技术制高点。 先来看这款S波段雷达

南航国际创新港一期交付 四大专业园区打造空天产业强磁场
科技数码 · 2026-07-03

南航国际创新港一期交付 四大专业园区打造空天产业强磁场

近日,南京航空航天大学与六合区深度合作的标杆项目——南航国际创新港一期正式交付投用。两个地块陆续启用,成功串联起高校科研能量、地方产业载体与市场创新主体,为南京打造全国领先的航空航天产业创新中心、助力江苏布局商业航天全产业链,提供了坚实的物理支撑。 该创新港一期位于六合区雄州街道,分为3号和4号两个