游乐游手机版
首页/AI热点日报/热点详情

从四家顶尖AI实验室辞职,打造自主实验AI,助科学家实现Vibe Research

类型:热点整理2026-06-27
四名来自Anthropic、xAI、GoogleDeepMind和OpenAI的研究人员创立Mirendil,构建能自主提出实验、编写代码、调度GPU并迭代结果的AI系统。公司完成2亿美元种子轮融资,a16z和KleinerPerkins领投,估值约10亿美元。目标是通过自动化研发平台降低AI研究门槛,让科学家实现“viberesearch”。

先说一个内部圈子颇为关注的动向:Anthropic 内部那个后来被称为 autoresearch 的平台,最初只是 Harsh Mehta 一人搭建而成。功能听起来很直接——让 AI 自主完成研发流程里的各个环节:提出实验假设、编写代码、调度算力、评估结果,然后自主决定下一步该做什么。

一个人攒出雏形后,这个平台逐步扩展为 Anthropic 内部的核心研发能力之一。到了 2025 年 12 月,Mehta 和同事 Behnam Neyshabur 一同离职,他的选择是,把之前在 Anthropic 内部打磨成形的能力独立出来,创办一家公司。

2026 年初,两人在旧金山注册了 Mirendil,目标是构建一套能自主循环处理 AI 研发问题的系统。6 月 25 日公司正式亮相,同时宣布完成 2 亿美元种子轮融资,由 a16z 和 Kleiner Perkins 联合领投,英伟达跟投,估值约 10 亿美元。

图丨Mirendil 创始团队(来源:X 平台)

你看,早在今年 3 月就有消息传出,这家公司正以 10 亿美元估值洽谈一笔 1.75 亿美元的融资。当时轮次尚未关闭,最终落地的数字比此前外界传闻还要高一些。对一家成立不到半年、团队仅有 20 人的公司而言,2 亿美元的种子轮,即便放在整个硅谷的融资史上也相当罕见。

不过话说回来,在顶尖人才身价高昂的硅谷,这个团队的履历,某种程度上确实配得上这个估值。

Neyshabur 是 SAM 优化器的共同发明者。在 Google 时,他联合领导过 Minerva 项目——这是最早能够执行复杂数学推理的大模型之一;之后又参与了 Gemini 在数学和代码方面的预训练工作。到了 Anthropic,他联合领导 Discovery 团队,目标是构建 AI Scientist,同时也参与了 Claude computer-use 功能背后的研发。

Mehta 则是 Anthropic 的高级研究科学家,除了独立搭建 autoresearch 平台的初版,他还负责把这套自动化研发能力在公司内部规模化推广。

另外两位联合创始人,补上了工程和执行力的拼图。Shayan Salehian 是 xAI 的早期工程师,从 Twitter 时代就加入公司,后来参与了 Grok 模型的后训练、推理和 Agent 基础设施,哪里最关键就出现在哪里。Tara Rezaei 今年 23 岁,MIT 毕业,奥赛奖牌得主,曾在 OpenAI 担任早期学生研究员。

目前,Mirendil 创始团队一共 20 人,分别来自 Anthropic、xAI、Google DeepMind 和 OpenAI 这四家机构。

Neyshabur 在 a16z 发布的一段访谈中,解释了 Mirendil 背后的核心思路。

科学家和工程师最核心的能力,是在某个领域持续深耕,积累出越来越精细的专业判断。但越深入,专长也会越窄,覆盖的只是所有可能研究方向中很小的一块。而几乎所有科学领域的进步,都依赖这种持续深入的能力。Mirendil 要做的,就是让一个 AI 系统也能够被指向某个特定方向,然后快速迭代、快速深入。Neyshabur 把这称为 "self-accelerating AI"。

落到产品上,Mirendil 训练的是专门擅长 AI 研发任务的前沿模型,再围绕这些模型搭建一整套系统,让它能够自主提出实验方案、调配 GPU、跑训练、比较 checkpoint、评估结果,然后进入下一轮循环。a16z 在投资博文里的形容很形象:这像一个专为 AI 研究构建的编码智能体,只不过它能够控制自己的 GPU。

这件事的逻辑起点,来自团队对当下 AI 研发现状的观察:今天,任何一个想用 AI 做药物发现或材料科学研究的实验室,首先都得把自己变成一个前沿 AI 实验室。这个门槛太高了,需要数百亿美元资金和数十万块 GPU。Mirendil 赌的是,这个门槛可以被大幅压低。如果 AI 研发本身可以被自动化、被产品化,那么掌握领域知识的科学家,就不再需要同时掌握大规模训练的全部工程能力。

a16z 在博文里把这个愿景称为 "vibe research":让不那么技术化的用户,也能运行自己的前沿实验。

他们还用 Cursor 举了个例子,来说明为什么看好这条路径。Cursor 最初完全依赖第三方模型,后来开始基于开源模型构建自己的 Composer 模型,现在已经开始为 SpaceX 做前沿模型的预训练。产品的性能和经济性,在每个阶段都有提升;而建模工作本身,也会像大实验室的集中式研发一样不断积累和复利。并不是每个组织都需要走到预训练这一步,但大多数组织都会因为能够自主跑实验、更新模型权重而获得实际收益。

a16z 的博文里还提出了一个更大的判断框架。他们认为,AI 能力的真正民主化需要两样东西:一是可供任何人扩展的前沿开源模型,二是实验室级别的研究平台,让普通工程师也能做前沿 AI 工作。Mirendil 定位于第二个。

至于第一个,a16z 直言:“这个缺口目前由中国模型填补,但这可能不是长期解决方案。” 这句话的潜台词并不难理解。在美国头部 VC 眼中,当前开源前沿模型领域由中国公司主导,是一个结构性事实。DeepSeek、千问以及 GLM,都是绕不开的名字。但他们不认为这个格局是稳态,也不打算长期依赖它。投资 Mirendil,在某种意义上也是对这种焦虑的回应:如果不能确保开源模型的自主供给,那至少可以投资一个能降低整个 AI 研发门槛的平台层。

参考资料:

1.https://a16z.com/announcement/investing-in-mirendil/

2.https://t.co/HGdS8Gwt9W

来源:https://www.aitntnews.com/newDetail.html?newId=26585

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。