黄仁勋投资的AI独角兽再获融资,成立两年估值超180亿
据The Information今日援引知情人士报道,日本AI新锐Sakana AI即将以25亿美元(约合人民币178亿元)估值筹集1亿美元(约合人民币7亿元)。与去年9月的15亿美元(约合人民币107亿元)估值相比,短短一年间增幅高达66%。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
内部人士透露,Sakana AI正与美国和日本投资机构展开磋商。完成本轮融资后,公司估值将达到26亿美元(约合人民币185亿元)。据悉,这笔资金将用于扩大工程、销售和分销团队规模。目前公司拥有约70名员工。
Sakana AI创立于2024年7月,创始团队背景堪称豪华。David Ha曾任谷歌大脑高级科学家,还领导过知名图像生成模型独角兽Stability AI的研究部门;另一位创始人Llion Jones则是Transformer论文作者之一、前谷歌AI研究员。今年8月,David Ha更入选《时代》杂志发布的2025年度百大AI人物榜单。

Sakana AI创始人Llion Jones(左)、David Ha(右)
这家初创公司的技术路线与OpenAI、Anthropic等企业截然不同,其主张摒弃Transformer架构,以自然进化为灵感降低模型计算成本并提升性能。在产品进展方面,公司已发布三款日语模型、江户古风聊天机器人Karamaru以及开源框架ShinkaEvolve。
截至目前,Sakana AI累计融资近2.3亿美元(约合人民币16亿元)。2024年1月,公司获得45亿日元(约合人民币2亿元)融资,Lux Capital、Khosla Ventures、日本电信公司NTT以及索尼集团参与投资;去年9月,公司完成2.14亿美元(约合人民币15亿元)A轮融资,英伟达参投成为大股东,使其成立一年估值即达约15亿美元(约合人民币107亿元),迅速崛起为行业新星。
此外,The Information报道称,该公司还获得了日本政府专项拨款,用于购置AI训练所需计算资源。
Sakana AI在日语中意为“鱼”。Ha此前告诉媒体,他立志打造“日本版的DeepMind”。
Ha透露,其创新算法能帮助企业自动创建处理语言或图像的大模型。实现方法是在组合、测试和丢弃数据时模拟自然选择规律,从而大幅减少人工输入量。他指出,当前训练大模型所需的电力与资源消耗惊人,而这项技术有望将开发周期缩短至数天甚至数周。
具体而言,Sakana AI采用的算法将三种开源原生AI模型作为“父母”,通过不同方式“培育”上百名“子女”,接着筛选表现最优的模型生成下一代,如此循环往复数百代后选出佼佼者。
今年3月,Sakana AI发布三款日语模型,分别是大语言模型EvoLLM-JP、视觉语言模型EvoVLM-JP和图像生成模型EvoSDXL-JP。
时隔一月,公司推出江户古风聊天机器人Karamaru。这个机器人能运用江户时代的世界观和古代文献来回答用户问题,其训练数据来自该公司从江户时代典籍中建立的包含约2500万字符的数据集。
今年9月,Sakana AI开源了ShinkaEvolve框架。该框架将大模型与进化算法相结合,针对各类潜在问题生成解决方案,并筛选最相关的应对策略。公司宣称,与Transformer架构相比,这种方法效率更高,更能产出创造性解决方案。

ShinkaEvolve框架概览
目前,Sakana AI已与多家日本大型企业签订业务协议。
今年5月,公司宣布与三菱日联金融集团建立多年合作伙伴关系,为日本最大的银行开发定制AI模型。交易达成后,Ha向媒体表示,这将推动Sakana AI在一年内实现盈利;本月早些时候,公司宣布与日本最大券商之一大和证券集团建立类似合作关系。
Ha提到,日本每家企业都希望拥有自己的基础模型,它们可以选择与Sakana AI或类似公司合作开发专属模型。他认为日本仍具备创新发展的空间。
与此同时,Sakana AI在日本市场还需要直面诸多美国大模型开发商的竞争压力。
今年2月,OpenAI宣布与软银建立合作伙伴关系,软银同意每年为自己及其子公司花费30亿美元(约合人民币214亿元)购买OpenAI技术,双方还将成立合资企业,专门向日本公司销售OpenAI工具套件;Anthropic在今年8月任命了日本国家负责人,并筹备在东京设立办事处;本月早些时候,加拿大模型创企Cohere聘请了日本国家级经理。
结语:Sakana AI深耕日本本土大模型
Sakana AI与法国大模型创企Mistral AI、印度大模型创企Krutrim类似,希望通过开发自主大模型来更好地把握本土语言文化特性,减少对其他AI技术的依赖。Ha认为,对日本企业而言,选择拥有自己的基础模型具有战略意义,即便其并非超高性能模型。
但相较于OpenAI、Anthropic、谷歌等大模型核心厂商,Sakana AI这类创企在资金和人才实力上都相对薄弱,亟需通过算法创新实现技术突破。
热门专题
热门推荐
语言大模型 提到“语言大模型”这个词,大家可能已经不陌生了。它本质上是一类基于深度学习算法,通过海量自然语言数据“喂养”出来的超级神经网络。这些模型在理解和生乘人类语言方面,展现出了惊人的能力。那么,它的核心特征究竟有哪些呢?我们来逐一拆解。 强大的语言生成和理解能力 这无疑是其最引人瞩目的光环。一
数据挖掘的完整流程:从问题定义到价值落地 谈及数据挖掘,很多人的第一反应是复杂的算法和代码。但数据挖掘的真正魅力,远不止于此。它应该是一套严谨、系统的方法论,驱动我们从未被充分利用的数据中提取出能指导行动的真知。这个完整的过程,环环相扣,缺一不可。 第一步:定义问题——找准起点,明确方向 万事开头难
正确认识RPA技术 智能时代的浪潮已经到来,新技术的涌现和发展是不可逆转的趋势。对于财务人员而言,首先要明确一点:RPA技术本质上是一种按预设程序执行重复性业务的信息处理工具。它不具备人类的思维能力、应变能力,更谈不上预测能力和职业判断。换个角度看,这其实是个好消息——财务人员完全可以成为这项技术的
RPA如何处理文本分类任务?深度解析其优势、挑战与未来 提到RPA(机器人过程自动化),都知道它擅长处理规则明确的重复性任务。但如果任务里混入了大量非结构化的文本信息呢?这就不得不请出它的一个重要搭档——文本分类技术。作为自然语言处理的基础任务,文本分类能将这些散乱的文本数据自动归入预设的类别,为后
自动化办公软件:企业效率提升的关键引擎 在当今快节奏的商业环境中,自动化办公软件早已不再是一个可选项,而是企业提升竞争力、实现高效运营的标配工具。它的核心价值在于,能够系统性地将人力资源从大量重复、繁琐的事务中解放出来,从而聚焦于更有创造性、战略性的工作。最终,它不仅能显著降低运营成本、提升工作质量





