梁文锋创立DeepSeek的创业历程与背后故事
2025年开年,科技圈最耀眼的名字非梁文锋莫属。短短几天,他成长中的诸多细节被置于聚光灯下,甚至连那套没来得及装修、只在里面搭了帐篷睡觉的新房,都成了他独特个性的注脚。
个性固然引人谈论,但绝非成功的核心密码。过去十几年,这位一度籍籍无名的大学生所能倚仗的,唯有他的思想与能力。
一个绕不开的问题是:为什么是梁文锋做出了DeepSeek?时代机遇与他迥异于常人的经历固然重要,但若要深究,理解梁文锋其人,才是理解这一切的关键。
找人才不需要标签
帮梁文锋的公司招人,在猎头圈里是出了名的“硬骨头”。
一位从2021年就开始与幻方深度合作的猎头坦言,这个过程让人“想哭”,难度太高。“清华本博,手握六篇顶会论文,你觉得总该稳了吧?嘿,简历直接挂了。另一个清华本科、MIT博士背景的候选人,第二轮面试也没能通过。”
在他看来,如果要从大厂内部物色人选,幻方和DeepSeek的目光基本不会停留在国内公司,他们的对标对象始终是Google、Meta这类海外巨头。
另一位猎头谈到DeepSeek也忍不住头疼:“要求太挑剔了。曾经推荐过一位在字节跳动绩效非常出色的年轻中层,聊完还是没通过。我很纳闷,去问原因,得到的反馈是:‘这个人对AI缺乏真正的热情。’可人家明明做过AI Agent相关的项目啊,一般很少会得到这样的评价。”
在梁文锋这里,人才没有固定标签。不唯学历背景,不唯过往业绩,他只看重两样东西:个人能力与个人素质。
正是这种极高的人才门槛,锻造了今天的DeepSeek。在国内大模型团队中,若论人才队伍的规模厚度,DeepSeek或许不及顶尖大厂;但若论人才的密集度和精锐程度,它绝对位列第一梯队。
要留住这些顶尖人才,除了DeepSeek提供的高薪酬,还有一套充分尊重创意与想法的管理模式。所谓“无固定团队、无汇报关系、无年度计划”,与其说是一种管理制度,不如说是一种彻底的信任。《奈飞文化手册》里有一句话:“优秀的同事和艰巨的挑战,是吸引人们来公司工作的最大因素。”对于AI从业者而言,还有什么比AGI(通用人工智能)更艰巨、更迷人的挑战呢?
做最难的事,就要找到最好的人,然后给予充足的资源与信任。被信任的顶级人才所迸发的能量是惊人的,这一逻辑在抖音的崛起中早已得到验证。
2018年春节期间,抖音日新增用户突破千万量级。一位当时负责增长的产品经理后来回忆,那个增长项目完全没有设定绩效压力,而且他只是向财务发了一封邮件,账户里就多出了上亿元的投放预算。他当时就意识到:“这样的团队,做什么不能成?”
DeepSeek走的也是同样的路数。简历被筛掉,问题绝不会出在学历上;面试通不过,也肯定不是能力不行。他们对人才的核心诉求,最终可以归结为一句话:这个人,是可以被信任、能一同向AGI目标长期奋斗的伙伴吗?
这便是DeepSeek的人才观。理解了这一点,便是理解梁文锋的第一步。
极简主义的世界观
尽管深耕量化领域多年,梁文锋并不认为自己是个“搞金融的”。他对自己的定位是:“我是做AI的,只不过恰好应用在量化场景。”
几乎所有与梁文锋有过交流的人,都会提到他那种不受外界干扰的特质:“他的思维方式极其纯粹,特别注重第一性原理”,“说话语速很慢”,“但一开口就能切中要害”。
量化投资的特性,恰好契合了他这种极简主义风格——无需与复杂的上下游产业链周旋,只需专注于最纯粹的市场数据本身。
直到今天,梁文锋依然常常沉浸在自己的技术世界里,心无旁骛地解决问题。例如,对于做大模型这件事,他的看法直接而纯粹:“想清楚了就能干,只要有算力卡就行。”其他的困难,似乎都不在主要的考虑范围之内。
对待金钱,他同样秉持着这种极简逻辑。钱,就是用来投资或者做慈善的,只要花在了合适的地方,亏损本身并不值得过多计较。
2023年底,一个旨在扶助聋哑人士的手语大模型项目为寻求投资找到了梁文锋。他当时就指出,这个项目的优点是公益属性突出,缺点是市场规模有限,潜在隐患则在于:这是一个顶尖高校大学生主导的项目,团队能否长期坚持是个问号。
尽管很清楚这笔投资极有可能没有任何经济回报,他仍然表示,只要团队愿意继续推进,他就愿意投入支持。
过去,梁文锋每年会拿出约5亿元用于投资或慈善。现在,他把这笔钱花在了DeepSeek上。炒股是为了赚钱,投入大模型是为了AGI,目的清晰,仅此而已。
DeepSeek拥有近两万张算力卡,梁文锋在算力投入上显得极其慷慨。他对上述手语大模型团队承诺过,算力集群可以随时向他们开放。但另一方面,他又有点“小气”,对这近两万张卡的利用率要求极高,力求打满,避免空转浪费。
这两种看似矛盾的行为,如果用极简主义的视角来解读,就完全说得通了:算力卡的存在就是为了被使用的,物尽其用,避免浪费,这是最基本的原则。
不以商业化为限
没花一分钱投放费用,DeepSeek的App仅用7天就收获了过亿用户。对于这个增长奇迹,梁文锋怎么看?有投资人在春节期间专门问过他,但梁文锋似乎对如此巨大的流量毫不在意,他的回答是:“这距离AGI的路还很远。”
这并非故作姿态。据了解,DeepSeek只安排了两三个人负责App维护、对话网页开发以及充值后台管理。因此,它的产品体验不够“丝滑”,也就不难理解了。
相比之下,DeepSeek在B端市场的事迹流传更广。例如,此前他们私有化部署的定价仅为45万元,其中不仅包含一台H20或910b服务器的使用权,还附赠大模型服务,期限一年。而同样的价格,在某些云服务商那里,仅仅只能租到一台910b一年的使用权。这意味着,DeepSeek相当于近乎免费提供了自己的大模型能力。
私有化部署不赚钱,DeepSeek似乎也不在乎通过API赚钱。一位曾对接DeepSeek的大厂员工吐槽,它身上有种“爱用不用”的气质——服务总是很难用,也总是不怎么调整。
再大的客户、再高的调用量,似乎也得不到特殊关照。所有用户高峰期都要排队,体验不佳。大客户的反馈很多,要求DeepSeek扩容、再扩容,至少让响应流畅些,不要两次请求就有一次失败,尤其在客服这类场景中,这种失败几乎无法忍受。
外界喧闹纷纷,但梁文锋看起来并不十分在意。那位大厂员工曾私下与DeepSeek的员工交流如何改善,得到的反馈是:梁文锋认为,大厂完全有能力自己想办法解决请求失败的问题,他们应该为自己兜底,而不是过度依赖DeepSeek来保障服务稳定性。
这个回答简直让人哭笑不得:“我们可是DeepSeek的顶级客户啊。”
可以说,现阶段的梁文锋,并不在意商业化的种种可能性。
当不少团队纷纷投身于应用层开发时,梁文锋曾对一位好友说:“你不要一直盯着应用和行业落地的事情,现在去看只会把自己禁锢住,因为时机还没到。现在能想到的一切,可能都是错的。更糟糕的是,你还会在错误的道路上投入更多时间、精力和金钱。”
这既是对好友的忠告,也是他自己的行动准则。将精力分散到应用探索或商业化变&现上,对梁文锋而言,无论具体做什么,都可能是一条偏离主航道的“错误道路”。
而正确的道路,从来只有一条。他认为,自己正走在这条路上。
相关攻略
梁文锋的成功源于独特的人才观与极简主义理念。他选拔人才看重能力、素质及对AI的长期热情,并给予充分信任。其思维专注第一性原理,将资源高效投入AGI目标,而非短期变现。团队规模精炼,坚持技术优先,对商业化保持克制,始终聚焦于通用人工智能的终极挑战。
过去十五个月,DeepSeek几乎从主流视野中消失了。 在这段大模型行业每隔几个月就要通过新品发布自证一次的狂飙期里,DeepSeek显得格格不入。他们没有推出新一代模型,也没跟进频繁的功能补丁,甚至没去凑行业里任何一个热闹。 但舆论从未放过它。 质疑、猜测与传闻交织成网,如影随形。 有人判断它已掉
过去几年,梁文锋几乎拒绝了所有互联网时代熟悉的剧本。 当别人忙着融资时,他选择拒绝;当行业争抢入口时,他选择开源;当对手卷参数规模时,他卷的是效率;当多数人把AI视为一门生意时,他谈论的始终是AGI(通用人工智能)。 这使得DeepSeek看起来更像一家“研究机构”,而非典型的创业公司。 然而,20
国内人工智能公司DeepSeek被曝正在推进首轮大规模融资,预计规模高达500亿元人民币,有望创下中国AI领域单轮融资最高纪录。其中,创始人兼CEO梁文锋或将个人出资200亿元领投,占比达40%,展现了极强的信心。国家集成电路产业投资基金等机构也有望参与。融资资金将重点用于技术研发,公司计划于6月发
“确实在接触DeepSeek融资。”一位FA机构的朋友向我们透露。 过去半个月,关于DeepSeek终于开启融资的消息持续发酵。外界在分析这次“反常”举动时,几乎都绕不开一个核心推论:梁文锋需要给内部的核心团队一个明确的估值了。 这也不难理解。过去一年,大模型领域的竞争日趋白热化,关于DeepSee
热门专题
热门推荐
近日,中国汽车流通协会联合精真估发布了《2026年4月纯电动车型一年车龄保值率排行榜》。这份数据对于正在选购新能源车的消费者具有重要参考价值,能帮助大家更清晰地了解当前热门电动车的残值表现。 该榜单统计的是车龄满一年的纯电动车型。位居榜首的是问界M9,其一年保值率高达80 4%。这一夺冠成绩含金量十
科技行业近期迎来一场备受瞩目的创新盛宴。以智能清洁机器人闻名的追觅科技(Dreame),在旧金山隆重举办了“Dreame Next 2026”未来愿景发布会。活动不仅前瞻性地展示了涵盖智能手机、智能穿戴乃至概念电动车的全系列产品,更邀请到苹果联合创始人史蒂夫·沃兹尼亚克亲临助阵。这场为期四天的盛会,
SpaceX最快下周披露招股书,6月初启动全球路演,估值或达1 75万亿美元,募资规模有望创纪录。公司以垂直整合与成本控制为核心优势,布局商业航天、AI基础设施与卫星互联网,其“太空数据中心”构想融合太空太阳能与AI算力,开辟新赛道。此次IPO或引发科技板块资金结构性变动,标志资本正加速拥抱太空与AI融。
NVIDIA在SIGGRAPH上宣布扩展其微服务库,以加速人形机器人开发。其核心是将生成式AI深度集成至OpenUSD语言体系,推出相关模型与NIM微服务,从而提升数字孪生与机器人工作流效率。公司还开放了机器人技术栈,并联合合作伙伴推动OpenUSD的工业应用,为开发者提供从仿真到部署的端到端平台支持。
OKX作为全球领先的数字资产交易平台,其风险主要来源于市场波动、技术安全与合规环境。平台通过多重安全机制、资产储备证明和严格的合规流程来管理风险。用户需理解加密货币的高波动性本质,并采取自主保管资产、启用安全功能等策略,以在参与Web3生态时更好地保护自身权益。





