Inception获吴恩达Karpathy天使轮投资为何受微软SpaceX青睐

扩散模型,这个在图像和视频生成领域大杀四方的技术,如今正将战火烧到了文本生成的核心腹地。一场围绕它的争夺战,已经在科技巨头之间悄然打响。
当前AI行业看似高歌猛进,但狂热之下,一个根本性的忧虑始终存在:以大语言模型(LLM)为代表的自回归架构,是否已经触及天花板?下一代AI的王者,会不会诞生于一条全新的技术路径?
最近的一则消息,似乎正在为这个疑问添加注脚。5月13日,外媒曝出微软正在与一家名为Inception的初创公司洽谈收购。巧合的是,同一天,马斯克的SpaceX也被证实对这家公司展开了追求。
一家种子轮融资仅5000万美元、由吴恩达和安德烈·卡帕西(Andrej Karpathy)等顶尖AI人物天使投资的创业公司,如今估值被喊到超过10亿美元,溢价高达20倍。吸引两家万亿美元级巨头同时下场的,并非什么成熟的商业模式,而是一支来自斯坦福的教授团队,以及一条几乎无人涉足的技术路线。
这家与诺兰电影《盗梦空间》同名的初创公司,究竟有何非凡之处?
01 三个教授与一个“异端”想法
Inception的故事,始于其创始人之一——斯坦福大学计算机科学教授斯特凡诺·埃尔蒙(Stefano Ermon)。他更为人知的身份,是扩散模型(Diffusion Model)的共同发明人。如今风靡的Midjourney、Sora、Stable Diffusion,底层都运行着他参与开创的技术。他关于文本扩散的论文,曾荣获ICML 2024最佳论文奖。
2024年中,埃尔蒙从斯坦福休假,联合了两位合作超过十年的老搭档——加州大学洛杉矶分校教授阿迪亚·格罗弗(Aditya Grover)和康奈尔大学教授弗拉基米尔·库列绍夫(Volodymyr Kuleshov),在帕洛阿尔托共同创立了Inception Labs。
这三个人怀揣着一个在当时看来相当“离经叛道”的想法:将扩散模型从图像生成领域,彻底迁移到文本生成领域,以此替代现有的自回归架构。
这个想法很快引起了业界注意。安德烈·卡帕西在Inception发布首个模型时,就在社交平台X上表达了浓厚兴趣。他指出,当前几乎所有大语言模型在核心建模方法上都是“克隆体”,遵循从左到右逐个预测词元(token)的自回归模式。而扩散模型完全不同,它不是顺序生成,而是从噪声中逐步去噪,最终并行得到一个完整的词元序列。他认为这个模型“有潜力展现出全新且独特的能力特征”,并鼓励大家尝试。
卡帕西不只是口头支持。他与吴恩达(Andrew Ng)都以天使投资人的身份,参与了Inception的种子轮融资。
2025年11月,Inception完成了5000万美元的种子轮融资,由Menlo Ventures领投,英伟达旗下NVentures、微软旗下M12、Snowflake Ventures、Databricks的投资部门全部跟投。
当卡帕西和吴恩达同时押注一家公司,当英伟达和微软的战投基金同时出现在投资人名单上,这几乎构成了AI领域最顶级的信任背书。
02 快10倍,便宜10倍
要理解Inception为何受到如此追捧,关键在于看清其技术路线的根本差异。
如今我们使用的ChatGPT、Claude、Gemini,底层无一例外都是自回归模型。它们生成文本的方式如同串行流水线:一个词元接一个词元,从左到右,依次输出。在写下后一个字之前,必须等待前面所有的字都生成完毕。
这就像一位作家,只能逐字逐句地线性创作,绝不允许跳着写。
这种方法稳定可靠,但存在一个结构性的天花板:速度被串行生成的方式锁死了。你可以更换更强大的芯片,优化推理框架,或者压缩模型,但只要本质仍是逐词元生成,速度就存在理论上限。
Inception选择了一条截然不同的道路。它利用扩散模型进行文本生成——不是逐字书写,而是先给出一个“粗略草稿”,然后通过神经网络反复迭代精炼,同时修改多个词元,实现并行输出。
埃尔蒙对此的解释非常直白:“这是一种根本不同的方法。所有现有的大语言模型都是自回归的,一个接一个地从左到右生成文本或代码,这非常慢,因为你不能在生成前面所有内容之前生成后面的东西。”

Mercury 2 模型在每秒 token 输出上比流行的小模型更快|图片来源:Inception
实际效果如何?Inception推出的模型家族名为Mercury。根据第三方评测机构Artificial Analysis的测试,其于2026年2月发布的Mercury 2模型,输出吞吐量达到了每秒约1000个词元。作为对比,Claude 4.5 Haiku约为每秒89个词元,GPT-5 Mini约为每秒71个词元。速度优势达到了10到14倍。
在质量方面,Mercury 2在AIME 2025测试中得分91.1,GPQA得分73.6,LiveCodeBench得分67.3。这些分数与Claude 4.5 Haiku、GPT-5.2 Mini处于同一竞争区间,但吞吐量却是后者的十倍以上。
埃尔蒙对此也很坦诚——Mercury 2对标的是Haiku和Flash这个级别的模型,而非Claude Opus或GPT-4这类旗舰。第三方分析也指出,在复杂推理任务上,扩散模型的质量大约是前沿自回归模型的85%-95%,但在结构化输出和翻译等任务上已基本持平。
而这恰恰是其想象力所在。如果扩散模型在质量上的差距仅有5%-15%,而速度优势却高达10倍,那么在对延迟极度敏感的大量场景中——如实时语音交互、代码自动补全、游戏对话、智能体(Agent)循环调用——扩散模型将成为更实际、更经济的选择。

代码构建上 Mercury2 模型只用迭代 14 次,而其他模型要迭代 87 次|图片来源:Inception
此外,扩散框架还带来了几个自回归模型难以企及的结构性优势。
第一,输出可控性更强。扩散模型能更自然地遵循特定的模式(schema)和语义约束,生成符合指定格式的JSON输出,这对于企业级应用至关重要。
第二,天然支持多模态融合。扩散本就是图像和视频生成的底层范式,将其扩展到文本,意味着可以用一套统一的框架处理语言、图像、音频和视频,无需拼接不同架构。
第三,内置纠错能力。自回归模型一旦在前序生成中间出现错误,后续内容很难修正;而扩散模型在精炼过程中可以反复调整,理论上能减少“幻觉”现象。
当然,这条路线也伴随着明显的不确定性。一些AI研究者指出,扩散方法使得输出预测更加困难,其扩展定律(Scaling Law)尚未得到充分验证。自回归模型“参数越多、数据越多、效果越好”的规律花了数年才被摸清,扩散模型是遵循类似规律,还是需要完全不同的优化策略,目前尚无定论。
但或许,正是这种不确定性,才蕴藏着碘伏现有范式的可能。
03 “后OpenAI时代”的军备竞赛
理解了Inception的技术内核,再来看微软与SpaceX的争夺,逻辑就清晰了。
2026年4月27日,微软与OpenAI官宣了对合作关系的重大调整。微软对OpenAI模型的IP授权从独家变为非独家,有效期延长至2032年;微软不再向OpenAI支付收入分成;OpenAI被允许在AWS、Google Cloud等任何云平台提供服务;关于AGI(通用人工智能)的特别条款被彻底删除。
这段曾被称作“科技界最佳兄弟情”的关系,实质上已演变为“管理型竞争”。
微软在OpenAI身上投入了超过130亿美元的资金以及大量的Azure算力支持。但现在,OpenAI不再是微软的“独家武器”,而微软也在加速摆脱对OpenAI的依赖。据报道,微软正在开发自己的通用AI模型,目标是在2027年之前推出能与OpenAI、Anthropic正面竞争的前沿模型。
收购像Inception这样的AI创业公司,正是这一战略的关键组成部分。
路透社的报道披露,微软今年春天首先看中了代码生成公司Cursor,但因自身已拥有GitHub Copilot,内部担心反垄断审查难以通过,最终主动放弃。随后,SpaceX迅速与Cursor签署了一份价值高达600亿美元的收购期权协议——即便收购不成,SpaceX也需支付100亿美元的合作费用。
在放弃Cursor后,微软将目光转向了Inception。然而,SpaceX同样盯上了这家公司。目前,Inception已聘请投行操盘交易谈判,要价超过10亿美元。
SpaceX的介入让局面更加有趣。2026年2月,SpaceX以全股票交易方式收购了马斯克的xAI,合并后估值达到1.25万亿美元,成为有史以来估值最高的商业并购案之一。随后,SpaceX又启动了Terafab半导体工厂项目,与特斯拉和xAI联合建设。再加上对Cursor的收购期权和对Inception的追求,马斯克显然正以SpaceX为平台,系统性地构建一个从芯片、模型到应用的完整AI技术栈。
而微软这边,除了竞购Inception,也同时在接触多家AI创业公司。路透社引述知情人士称,当前AI研究人员轻松就能获得数千万美元的薪酬承诺,创业公司估值在投资者的疯狂追捧下水涨船高。
Menlo Ventures合伙人蒂姆·塔利(Tim Tully)在Inception融资时说过一句话,放在今天的收购大战背景下格外应景。他说,Inception的团队证明了扩散式大语言模型不只是一个研究突破,而是“一个可以构建可扩展、高性能语言模型的基础,企业今天就能部署”。
这句话道破了天机——巨头们争夺的不仅仅是一家公司,更是一个可能改写游戏规则的技术范式,以及掌握这个范式核心密码的那一小群人。
当微软与OpenAI的“婚姻”走向开放关系,当SpaceX从火箭公司转型为AI收购引擎,当一家尚在种子轮的公司被两家万亿巨头同时争抢——这场“后OpenAI时代”的AI军备竞赛,其实才刚刚拉开序幕。
而Inception的命运,无论最终花落谁家,都已经揭示了一个不变的真理:在AI的世界里,真正稀缺的从来不是海量资本,而是敢于踏上不同道路的智慧与勇气。
相关攻略
SpaceX在上市前披露激进治理方案,计划发行10倍投票权B类股确保马斯克绝对控制权,并批准总额可达万亿美元的薪酬方案,其考核直接与火星建立百万人口殖民地的目标挂钩。马斯克回应称,此举旨在确保公司专注于多行星生活愿景,而非短期财报。他承认目标实现异常艰难,但若成功,公司价值将远超地球当前经济总量。S
狗狗币最大持有者正进行战略性积累,其149个主要地址持有量已达1085 2亿枚,价值约116亿美元。过去24小时内出现739笔大额交易,同时币价在关键支撑位企稳反弹,这与2025年中期行情启动前的迹象相似。市场认为这可能是大资金为潜在上涨行情进行的布局。
五月中旬,科技圈被一则消息搅动了。多家媒体相继报道,正在紧锣密鼓推进上市的SpaceX,在其保密的招股说明书中披露了一套堪称“史无前例”的公司治理与薪酬方案。这套方案的核心,直指公司的终极愿景,也将其创始人埃隆·马斯克的个人利益与人类星际梦想深度绑定。 方案的核心设计围绕股权结构展开。SpaceX计
今天科技界迎来重磅战略调整。埃隆·马斯克在其社交平台X上正式宣布,旗下人工智能公司xAI将结束独立运营,全面整合进入SpaceX体系,并更名为SpaceXAI。这一举措标志着AI与航天技术的深度融合迈出关键一步。 此次决策源于马斯克对人工智能未来发展的核心判断。他认为,当前地面数据中心面临日益严峻的
关于xAI的最新战略调整,今日迎来关键性进展。埃隆·马斯克在其社交平台X上正式宣布,xAI将结束独立运营状态,全面整合进入SpaceX体系,成为后者旗下的核心人工智能业务部门。 实际上,此次业务合并早有信号。回溯至今年2月,SpaceX已正式完成对马斯克创立的AI公司xAI的收购。当时内部沟通曾表示
热门专题
热门推荐
《Zero Parades: For Dead Spies》的媒体评测已经解禁,结果相当亮眼。这款被许多人视为《极乐迪斯科》精神续作的作品,在OpenCritic上拿到了86分的媒体均分,在Metacritic上也有83分。游戏将于5月21日正式登陆PC平台,看来2026年的必玩叙事RPG名单上,又
目录 你是否也遇到过这些问题 处理效果 前置准备 超简单AI自动化解决方案 第1步:准备好你的原始数据 第2步:针对指定的文件下达指令 第3步:验收 还能解决这些同类问题 指令为什么这么有用? 更多场景直接抄作业 销售数据三级汇总 成本数据多级汇总 库存数据汇总 员工薪资汇总 常见问题答疑 核心价值
AI Agent 的发展,正迎来一个关键的转折点,从概念验证迈向真正的生产力交付。 想象一下,当一个 AI 智能体能够在无需人工介入的情况下,独立完成一个复杂项目的全流程,并将成功经验固化为可随时调用的“技能”——这是否标志着 AI 在职场中的角色,已经从辅助工具演变为自主的生产力单元? 随着 Op
彭博社的马克・古尔曼在最新报道中透露了一个有趣的发现:苹果为WWDC 26发布的宣传海报,其设计细节可能暗藏玄机,指向了即将在iOS 27中亮相的全新Siri交互界面。 根据古尔曼的分析,新版Siri的核心变化在于与灵动岛的深度融合。唤醒时,它将不再以传统的全屏或底部卡片形式出现,而是会以一个扩展的
GitHub 的 Star 数量还值得信赖吗?真相可能比你想象的更严峻。 开源社区中“购买 Star”的现象早已不是秘密,其便捷程度甚至超过点外卖,单价低廉且支持批量折扣。然而,卡内基梅隆大学(CMU)一项被 ICSE 2026 顶会收录的最新研究,首次系统性地揭示了这场“造假生意”的惊人规模:Gi





