月之暗面(以下简称“Kimi”)与DeepSeek,如今已成为大模型领域最受瞩目的两家企业。有趣的是,它们的发展轨迹正日益趋同。
首先关注融资层面。过去半年内,Kimi接连完成多轮融资,估值持续攀升。而另一边,长期被外界视为“资金充裕”的DeepSeek,也终于正式开启融资。放在两年前,这几乎是难以想象的格局。
彼时,这两家公司代表了截然不同的发展路径。Kimi是典型的明星创业公司,融资频繁、持续扩张;DeepSeek则显得特立独行——梁文锋几乎从未出现在融资新闻中,外界对其最深的印象始终是技术实力。
但到了今年,一个显著的变化是,两家公司同时坐上了资本市场的牌桌。
再看技术路线。过去很长一段时间,业界总爱将这两家公司放在一起比较,但实际上,它们的发力点并不完全重合。
Kimi一直更贴近产品端。从长文本、搜索,到后来的Agent、Coding,月之暗面始终致力于将模型能力转化为产品体验。而DeepSeek更像一家研究机构——无论是V2、R1还是V3,行业讨论最多的始终是模型能力本身。不过,从今年的V4开始,DeepSeek的技术布局也明显转向了长文本、Coding和Agent。
这两家公司的边界正变得模糊。Kimi开始越来越重视底层模型能力,而DeepSeek则越来越关注推理效率、工程体系以及大规模部署问题。甚至连招聘方向都开始重叠。据虎嗅了解,近期Kimi和DeepSeek都在持续招聘Harness相关岗位。Harness并非模型本身,而是模型背后的基础设施——训练、推理、调度、资源管理,全都依赖这套系统。
换句话说,当两家公司同时开始扩招Harness团队,说明它们关注的已不只是模型能力,而是模型如何被更快地训练出来、更稳定地运行,以及以更低的成本被使用。
除了融资和技术路线,创始人的风格也颇为相似。杨植麟和梁文锋都属于典型的技术型创始人,都不喜欢站在聚光灯下,也很少主动讲述商业故事。相比市场、营销或融资,他们更愿意探讨模型、算法和技术本身。过去几年,“技术理想主义”几乎成了贴在这两家公司身上最统一的标签。
但融资之后,两条线可能又会走向新的分岔。
DeepSeek的资金,打算投向哪里?
对DeepSeek来说,今年最大的变量就是融资。过去很长一段时间,外界对它的印象都是“不缺钱”。毕竟,梁文锋背后的幻方量化本身就拥有持续投入AI研发的能力,相比那些需要不断融资才能维持训练节奏的大模型公司,DeepSeek确实显得格外特殊。
这也是为什么,当融资消息传出时,除了金额、估值和投资方,大家最关心的问题是:DeepSeek为何突然开启了融资?
人才或许是原因之一。过去一年,大模型行业最激烈的竞争,已经从模型能力逐渐转向人才争夺。无论是OpenAI、Meta还是国内头部公司,都在持续争夺顶级研究员和工程人才。对DeepSeek来说,融资无疑能提供更充足的激励工具,帮助其稳住核心团队。
但如果仅仅是为了留人,或许还不足以解释DeepSeek近期的一系列动作。虎嗅注意到,DeepSeek近期正在招聘“数据中心高级交付经理”。从岗位职责来看,其负责内容包括数据中心项目从立项、建设、交付到运营的全流程管理,同时还需参与IDC自动化运维平台建设、资源管理以及运维标准体系建设。更值得关注的是,在任职要求中,DeepSeek特别提到了GPU算力相关交付运维经验,以及大型集群规划建设经验。
对普通互联网公司来说,这或许只是一个基础设施岗位。但对一家大模型公司而言,这背后对应的是另一套能力体系。过去两年,行业讨论最多的是模型能力——R1、V3、V4,每一次模型发布都会引发广泛关注。但随着模型规模不断扩大,以及Agent带来的Token消耗持续增长,模型公司面临的问题已经不再只是如何把模型训练出来。
越来越多的问题开始出现在模型之外:如何管理日益庞大的GPU集群?如何提升算力资源利用率?如何保证训练和推理任务稳定运行?以及,如何支撑下一代模型训练所需的基础设施规模?
这些恰恰是数据中心团队需要解决的核心问题。与此同时,DeepSeek也在持续扩张Harness团队。对很多模型公司来说,Harness更接近训练和推理的基础设施平台——它不直接参与模型研发,但负责让模型训练、推理以及资源调度能够更高效地运行。
从这个角度看,DeepSeek当下的关注点已不只是模型能力,还有决定模型上限的基础设施能力。这或许也是DeepSeek融资后,最值得关注的变化之一。
一个流向用户,一个流向GPU
2026年对Kimi来说是至关重要的一年,这一点从它半年融资三次、估值涨了五倍就能看出来。今年年初,OpenClaw带来了惊人的收入增长,让月之暗面第一次真正看到了商业化的希望。
与此同时,从Kimi今年发布的几款模型变化中也可以发现,技术越来越明显地服务于产品。无论是Agent、Coding还是海外市场,月之暗面都在试图证明:模型能力最终能够转化为收入和增长。
因此,对Kimi来说,既要继续突破模型能力的天花板,又要加速投身商业化。而DeepSeek的关注点并不相同。两家公司都在融资、都在扩张,但它们要解决的问题完全不同。
对Kimi来说,市场关心技术,但更关心技术和产品带来的增长——Agent能否催生新的付费场景?海外市场能否复制国内的成功经验?这些问题最终都会回到商业化本身。
但DeepSeek面临的压力不在这里。从成立至今,DeepSeek最大的竞争力始终来自模型能力——无论是V2时期的低成本训练,还是R1带来的推理模型热潮,核心优势都建立在技术领先之上。因此,对DeepSeek而言,最重要的问题不是如何获取更多用户,而是如何持续保持技术领先。
这也是为什么,融资之后外界看到的并非大规模产品扩张,而是Harness团队扩张、数据中心岗位出现,以及更多围绕基础设施建设的动作。因为对DeepSeek来说,模型能力本身仍然是最重要的资产。相比为某一个产品功能做针对性优化,DeepSeek更需要保证的是下一代模型能够继续迭代,下一次技术突破仍然发生在自己身上。
某种程度上,这也是两家公司最根本的区别。背靠量化的DeepSeek本质上不是一家创业公司。Kimi需要向市场证明“好的模型能够赚钱”;DeepSeek则需要向市场证明“模型能够继续领先”。前者的资金最终会流向技术、产品、用户和收入;后者的资金则会流向算力、集群和基础设施。
这也决定了,同样是一笔融资,两家公司最终会走向完全不同的方向。
