Transformer作者在日创办最贵AI独角兽,现再获谷歌投资
当一家公司愿意投资自己曾经的员工创办的初创企业时,这通常说明两件事:一是前员工确实做出了值得关注的东西,二是这家公司正面临某种紧迫感。谷歌对日本人工智能初创公司 Sakana AI 的战略投资,恰好同时印证了这两点。
1 月 23 日,Sakana AI 宣布与谷歌达成战略合作伙伴关系,后者将向这家成立仅两年多的东京初创企业注入资金。具体投资金额未披露,但这笔交易发生在 Sakana AI 完成 1.35 亿美元 B 轮融资之后不久,那轮融资使其估值达到约 26 亿美元,一举成为日本估值最高的未上市 AI 初创企业之一。
Sakana AI 的两位联合创始人都与谷歌有着深厚渊源。首席执行官 David Ha 曾是谷歌大脑(Google Brain)东京团队的负责人,更早之前他是高盛日本利率交易部门的董事总经理。另一位联合创始人 Llion Jones 则是 Transformer 的八位作者之一,他在谷歌工作多年后选择离开,用他自己的话说,是因为“官僚主义已经发展到让我感觉什么都做不成的地步”。

图丨David Ha 和 Llion Jones(来源:Sakana AI)
而关于这两位前谷歌研究员创办的这家公司,其实大家已经并不陌生。2024 年 8 月,Sakana AI 曾提出了引发大量关注的“AI 科学家”,当时 Sakana AI 称其标志着“科学发现新时代的开端”。这种说法在学术界自然引发了不少争议,有批评者指出其文献综述能力薄弱,对新颖性的判断不够准确。
到了 2025 年 4 月,Sakana AI 发布了升级版“AI 科学家 v2”(The AI Scientist-v2),并取得了一项颇具象征意义的突破:他们向 ICLR(国际学习表征会议,机器学习领域的顶级会议之一)的一个研讨会提交了三篇完全由 AI 生成的论文,其中一篇的评审分数达到了 6.33 分(满分 10 分),超过了该研讨会的平均录用线,成为首篇成功通过同行评审的完全由 AI 生成的学术论文。
除了 AI 科学家之外,Sakana AI 的核心研究理念更多是“自然启发式智能”(Nature-Inspired Intelligence),即试图从集群智能、进化算法等自然界原理中汲取灵感,探索有别于当前主流 Transformer 架构的替代方案。其公司名称“Sakana”就来自日语中的“鱼”(さかな),寓意鱼群通过简单的规则汇聚成协调一致的整体,这正是其集群智能研究理念的隐喻。
Llion Jones 和 David Ha 在创办公司时曾公开批评谷歌过于执着于单一的大语言模型路线,认为这是一个“相当受限的框架”,而他们希望探索一些不同的东西。
而谷歌此次投资 Sakana AI 的战略意图,可以从两个层面来理解。
一方面,二者在技术研发上形成互补。根据 Sakana AI 的公告,此次合作将聚焦三个方向:利用谷歌的 Gemini 和 Gemma 等先进模型加速创新、提升 AI 产品质量,以及在金融机构和政府机构等对安全性和数据主权要求严格的“关键基础设施”领域部署可靠的 AI 解决方案。
Sakana AI 表示,它过去的研究成果如“AI 科学家”(AI Scientist)和“ALE-Agent”已经证明了整合利用这些先进模型的威力,而此次合作将允许它更深入地将谷歌的模型生态融入自身的研发流程,进一步拓展自动化科学发现和智能体 AI(Agentic AI)的前沿边界。对谷歌而言,这意味着它能获得来自用户服务一线的直接反馈,用于改进自身的模型生态系统。
另一方面,谷歌也能够借助这家日本本土明星企业推广 Gemini 在日本企业市场的渗透。根据彭博社的报道,谷歌希望 Sakana AI 能帮助 Gemini 在这个“现金充裕的企业市场”获得更多份额,毕竟在这里,OpenAI 的 ChatGPT 目前占据着先发优势。
日本企业界以保守著称,很多公司的业务模式几十年未曾大改,但这也意味着一旦决定采用某种 AI 方案,往往具有相当的黏性。Sakana AI 已经在日本金融界拿下了一些重要客户,包括三菱日联银行(MUFG Bank)和大和证券(Daiwa Securities),谷歌可以借助本次交易扩大其在日本企业市场的影响力。
除了投资 Sakana AI,谷歌还完成了另外两笔交易。一是收购 Common Sense Machines,这是一家总部位于马萨诸塞州、约有 12 名员工的初创公司,专注于将 2D 图像转换为 3D 物体的 AI 模型。
其联合创始人 Tejas Kulkarni 此前就在 Google DeepMind 工作过,如今整个团队将加入 DeepMind。这笔交易的价格未披露,但该公司此前的估值约为 1,500 万美元。
此外,谷歌还与 Hume AI 达成了技术许可协议,同时将其 CEO Alan Cowen 和大约 7 名核心工程师招入 DeepMind,用于提升 Gemini 的语音交互能力。Hume AI 以其能够识别语音中情绪的模型而闻名,其 2024 年推出的“共情语音接口”(Empathetic Voice Interface)能够通过分析语调、音高、节奏和语气等微妙的声音线索来推断用户的情绪状态。
这家公司已融资约 7,400 万美元(据 PitchBook 数据),预计 2026 年收入将达到 1 亿美元。在 CEO 和核心团队离开后,Hume AI 将继续独立运营,由 Andrew Ettinger 接任 CEO,并继续向其他 AI 实验室提供语音训练数据和工具。
谷歌如此密集地布局 AI 初创企业,也足以见得其不断扩张的雄心。
最近几个月以来谷歌凭借 Gemini 系列的出色表现和分发优势,已经非常迅速地提高了其在 AI 市场的占有率。
根据 Similarweb 在 2026 年 1 月发布的全球 AI 追踪数据,ChatGPT 以约 64% 至 68% 的市场份额(不同统计口径略有差异)仍是领头羊,但这一数字相比一年前近 87%的峰值已经大幅缩水。而谷歌的 Gemini 则从一年前的约 6% 飙升至目前的 18% 至 21% 左右,几乎翻了三倍。这种追赶势头在 2025 年下半年尤为明显,Gemini 的份额在六个月内从约 9%跃升至超过 18%。
然而,市场份额的增长并不能掩盖一个事实:在企业级市场的深度渗透上,谷歌依然面临挑战。ChatGPT 在消费者市场占据压倒性优势,而 Anthropic 的 Claude 则在企业客户中表现出色,其在需要高安全性、合规性和长文本处理能力的商业场景中颇具吸引力。谷歌需要的不仅仅是用户数量的增长,更需要在高价值的垂直市场站稳脚跟。
从这个角度看,投资 Sakana AI 就显得顺理成章。日本拥有世界第三大经济体,其企业市场规模庞大、资金充裕,同时对技术的接受度较高。更重要的是,日本政府对发展本土 AI 能力抱有强烈的战略意图。在一个人口老龄化、劳动力预计在未来几十年将萎缩 20%的国家,AI 被视为提升生产率、应对人口结构挑战的关键工具。
Sakana AI 堪称如今日本 AI 的一面旗帜(甚至可以说是独苗)。它不仅获得了日本政府拨付的超级计算机使用权,还在积极寻求与日本防卫省及其他政府机构更紧密的合作。能够与这样一家具有战略地位的本土冠军企业建立纽带,对谷歌而言价值不言而喻。
未来,我们或许还能看到谷歌等硅谷 AI 巨头依靠类似手段扩大其在欧洲及其他地区的影响力。
另外,借助这笔交易,谷歌也得以将 David Ha 和 Llion Jones 这对组合重新纳入自己的势力范围——一位是谷歌日本 AI 研究的开创者,一位是 Transformer 架构的缔造者之一。他们离开谷歌后创办的公司,如今又与老东家建立了新的连接。人才的流动、回归与再合作,在这个 AI 人才极度稀缺的年代,也是一种战略资源的重新配置。
参考资料:
1.https://sakana.ai/google/#en
2.https://www.bloomberg.com/news/articles/2026-01-23/google-invests-in-sakana-ai-to-boost-gemini-s-presence-in-japan
运营/排版:何晨龙
相关攻略
最近科技圈里有个事儿,闹得挺大。5月4日,一位在隐私领域颇有声望的专家——人称“隐私先生”的瑞典计算机科学家Alexander Hanff——发布了一份报告,直指谷歌Chrome浏览器存在一个相当出格的行为:在用户完全不知情、未同意的情况下,它竟然向符合条件的设备静默安装了一个体积约4GB的Gemi
5月11日,关于谷歌下一代旗舰手机Pixel 11系列的一则爆料引发热议:其内存配置可能不增反降。具体来看,标准版Pixel 11或许会从上一代的12GB起步回退至8GB;而定位更高的Pixel 11 Pro、Pro XL以及Pro Fold折叠屏机型,也可能不再延续Pro系列16GB起步的传统,转
阅读一本错综复杂的侦探小说时,人类读者能够轻松地将开篇一个不起眼的细节与最终结局联系起来。这种跨越篇幅捕捉内在关联的能力,对我们来说似乎理所当然。然而,如何让计算机拥有这种“联系上下文”的能力,曾长期困扰着科学界。过去的方法往往显得笨拙且效率低下,直到一项破局之作的出现。 2017年,由谷歌大脑团队
谷歌Pixel8Pro预计十月发布,配备6 7英寸120HzOLED屏幕,机身设计更圆润。背部摄像头模组采用新布局,延续横幅造型,辨识度高。渲染图中还出现了PixelWatch2。
谷歌早期面临系统稳定性挑战,后通过优化逐步解决。JeffDean与吴恩达共同推动大型神经网络研究,促成了GoogleBrain的成立。该团队于2011年成功训练出远超当时规模的神经网络。同期DeepMind专注于强化学习。谷歌收购DeepMind后,两大团队融合为GoogleDeepMind,并推出了多模态模型Gemini。该模型基于Transformer架
热门专题
热门推荐
2026年5月6日,存储行业迎来一个标志性节点:美光正式向市场交付其6600 ION系列固态硬盘的245TB版本。这不仅刷新了商用SSD的容量纪录,更意味着数据中心存储的密度与能效竞赛,进入了新的阶段。 这款“巨无霸”SSD的核心,是美光自研的第九代(G9)276层3D QLC NAND闪存颗粒。为
2026年5月5日,小米汽车旗下备受期待的首款增程式全尺寸SUV——内部代号“昆仑”的路试谍照正式曝光。作为一款瞄准多人口家庭用户市场的战略车型,“昆仑”采用了当前市场热门的增程式混合动力技术路线,旨在为用户提供无里程焦虑的纯电出行体验。 据悉,这款全新SUV计划于2026年下半年正式上市发布,其亮
备受期待的荣耀600系列手机国行版本,即将在本月下旬正式登陆国内市场。根据最新备案信息,该系列将提供六款独具特色的配色供消费者选择,分别为:象征喜悦的“好事橙”、寓意美好的“幸运星”、清新淡雅的“茉莉白”、活力十足的“青苹果”、深邃迷人的“光羽蓝”,以及永不过时的经典“曜石黑”。 从硬件配置来看,荣
近日,游戏界传来一则颇具讨论价值的消息。由前《巫师3》总监Konrad Tomaszkiewicz领衔的工作室Rebel Wolves,正式公布了其正在开发的黑暗奇幻角色扮演游戏《黎明行者之血》的一项激进设计:玩家在完成序章后,几乎可以跳过所有支线任务与地图探索,直接挑战位于城堡中的最终BOSS。
在王者荣耀的对抗路中,老夫子凭借其独特的机制,始终是令对手头疼的强势英雄。想要真正掌握这位“单挑王”,一套精准的攻速铭文搭配与灵活的出装思路,是奠定你线上压制力与团战影响力的关键。正确的配置,能让你从对线期开始就掌握主动权。 攻速铭文搭配:构筑前期优势的核心 铭文是英雄前期作战能力的基石。对于依赖普





