从四家顶尖AI实验室辞职，打造自主实验AI，助科学家实现Vibe Research_AI热点日报

从四家顶尖AI实验室辞职，打造自主实验AI，助科学家实现Vibe Research

类型：热点整理2026-06-27

四名来自Anthropic、xAI、GoogleDeepMind和OpenAI的研究人员创立Mirendil，构建能自主提出实验、编写代码、调度GPU并迭代结果的AI系统。公司完成2亿美元种子轮融资，a16z和KleinerPerkins领投，估值约10亿美元。目标是通过自动化研发平台降低AI研究门槛，让科学家实现“viberesearch”。

先说一个内部圈子颇为关注的动向：Anthropic 内部那个后来被称为 autoresearch 的平台，最初只是 Harsh Mehta 一人搭建而成。功能听起来很直接——让 AI 自主完成研发流程里的各个环节：提出实验假设、编写代码、调度算力、评估结果，然后自主决定下一步该做什么。

一个人攒出雏形后，这个平台逐步扩展为 Anthropic 内部的核心研发能力之一。到了 2025 年 12 月，Mehta 和同事 Behnam Neyshabur 一同离职，他的选择是，把之前在 Anthropic 内部打磨成形的能力独立出来，创办一家公司。

2026 年初，两人在旧金山注册了 Mirendil，目标是构建一套能自主循环处理 AI 研发问题的系统。6 月 25 日公司正式亮相，同时宣布完成 2 亿美元种子轮融资，由 a16z 和 Kleiner Perkins 联合领投，英伟达跟投，估值约 10 亿美元。

图丨Mirendil 创始团队（来源：X 平台）

你看，早在今年 3 月就有消息传出，这家公司正以 10 亿美元估值洽谈一笔 1.75 亿美元的融资。当时轮次尚未关闭，最终落地的数字比此前外界传闻还要高一些。对一家成立不到半年、团队仅有 20 人的公司而言，2 亿美元的种子轮，即便放在整个硅谷的融资史上也相当罕见。

不过话说回来，在顶尖人才身价高昂的硅谷，这个团队的履历，某种程度上确实配得上这个估值。

Neyshabur 是 SAM 优化器的共同发明者。在 Google 时，他联合领导过 Minerva 项目——这是最早能够执行复杂数学推理的大模型之一；之后又参与了 Gemini 在数学和代码方面的预训练工作。到了 Anthropic，他联合领导 Discovery 团队，目标是构建 AI Scientist，同时也参与了 Claude computer-use 功能背后的研发。

Mehta 则是 Anthropic 的高级研究科学家，除了独立搭建 autoresearch 平台的初版，他还负责把这套自动化研发能力在公司内部规模化推广。

另外两位联合创始人，补上了工程和执行力的拼图。Shayan Salehian 是 xAI 的早期工程师，从 Twitter 时代就加入公司，后来参与了 Grok 模型的后训练、推理和 Agent 基础设施，哪里最关键就出现在哪里。Tara Rezaei 今年 23 岁，MIT 毕业，奥赛奖牌得主，曾在 OpenAI 担任早期学生研究员。

目前，Mirendil 创始团队一共 20 人，分别来自 Anthropic、xAI、Google DeepMind 和 OpenAI 这四家机构。

Neyshabur 在 a16z 发布的一段访谈中，解释了 Mirendil 背后的核心思路。

科学家和工程师最核心的能力，是在某个领域持续深耕，积累出越来越精细的专业判断。但越深入，专长也会越窄，覆盖的只是所有可能研究方向中很小的一块。而几乎所有科学领域的进步，都依赖这种持续深入的能力。Mirendil 要做的，就是让一个 AI 系统也能够被指向某个特定方向，然后快速迭代、快速深入。Neyshabur 把这称为 "self-accelerating AI"。

落到产品上，Mirendil 训练的是专门擅长 AI 研发任务的前沿模型，再围绕这些模型搭建一整套系统，让它能够自主提出实验方案、调配 GPU、跑训练、比较 checkpoint、评估结果，然后进入下一轮循环。a16z 在投资博文里的形容很形象：这像一个专为 AI 研究构建的编码智能体，只不过它能够控制自己的 GPU。

这件事的逻辑起点，来自团队对当下 AI 研发现状的观察：今天，任何一个想用 AI 做药物发现或材料科学研究的实验室，首先都得把自己变成一个前沿 AI 实验室。这个门槛太高了，需要数百亿美元资金和数十万块 GPU。Mirendil 赌的是，这个门槛可以被大幅压低。如果 AI 研发本身可以被自动化、被产品化，那么掌握领域知识的科学家，就不再需要同时掌握大规模训练的全部工程能力。

a16z 在博文里把这个愿景称为 "vibe research"：让不那么技术化的用户，也能运行自己的前沿实验。

他们还用 Cursor 举了个例子，来说明为什么看好这条路径。Cursor 最初完全依赖第三方模型，后来开始基于开源模型构建自己的 Composer 模型，现在已经开始为 SpaceX 做前沿模型的预训练。产品的性能和经济性，在每个阶段都有提升；而建模工作本身，也会像大实验室的集中式研发一样不断积累和复利。并不是每个组织都需要走到预训练这一步，但大多数组织都会因为能够自主跑实验、更新模型权重而获得实际收益。

a16z 的博文里还提出了一个更大的判断框架。他们认为，AI 能力的真正民主化需要两样东西：一是可供任何人扩展的前沿开源模型，二是实验室级别的研究平台，让普通工程师也能做前沿 AI 工作。Mirendil 定位于第二个。

至于第一个，a16z 直言：“这个缺口目前由中国模型填补，但这可能不是长期解决方案。” 这句话的潜台词并不难理解。在美国头部 VC 眼中，当前开源前沿模型领域由中国公司主导，是一个结构性事实。DeepSeek、千问以及 GLM，都是绕不开的名字。但他们不认为这个格局是稳态，也不打算长期依赖它。投资 Mirendil，在某种意义上也是对这种焦虑的回应：如果不能确保开源模型的自主供给，那至少可以投资一个能降低整个 AI 研发门槛的平台层。

参考资料：

1.https://a16z.com/announcement/investing-in-mirendil/

2.https://t.co/HGdS8Gwt9W

来源：https://www.aitntnews.com/newDetail.html?newId=26585

Research

延伸阅读

补充最近整理过的热点入口。

从四家顶尖AI实验室辞职，打造自主实验AI，助科学家实现Vibe Research

相关热点

延伸阅读