首页 游戏 软件 资讯 排行榜 专题
首页
AI
顶尖AI科学家李飞飞团队离职,创立AGI新公司

顶尖AI科学家李飞飞团队离职,创立AGI新公司

热心网友
69
转载
2026-01-11


新智元报道

编辑:艾伦

【新智元导读】谷歌 Gemini 数据联合负责人 Andrew Dai 联手苹果首席研究科学家 Yinfei Yang,隐身创办 AI 新秀 Elorian。首轮将融资 5000 万美元,剑指「视觉推理」这个下一代大模型的核心问题。

硅谷的 AI 创业热潮中,最昂贵的筹码永远押注在最资深的「大脑」上。

曾在谷歌 DeepMind 效力长达 14 年的资深研究员 Andrew Dai,正在筹建一家名为Elorian的 AI 初创公司。


这家尚不为人所知的公司,种子轮融资目标即高达 5000 万美元。

与 Andrew Dai 联手的,是刚于去年 12 月离职的苹果研究科学家 Yinfei Yang。


这两位分别来自谷歌和苹果的技术老兵,正在试图解决大模型领域的下一个核心问题:视觉推理(Visual Reasoning)。

领投这轮融资的,极有可能是由前 CRV 普通合伙人 Max Gazor 创立的 Striker Venture Partners。

如果交易达成,这将是硅谷近期最受瞩目的早期融资之一,也再次印证了资本市场对于「谷歌毕业生」的疯狂追捧。

14 年,从 BERT 早期到 Gemini 幕后

在 AI 研究圈,Andrew Dai 这个名字代表着一种「长期主义」。

不同于那些在 Transformer 浪潮爆发后才匆匆入局的创业者,Andrew Dai 在谷歌的工号可以追溯到 2012 年。

这意味着他完整经历了深度学习从边缘学科走向世界中心的整个周期。

在他的 LinkedIn 履历中,最引人注目的是他作为Gemini 模型预训练(Pre-training)数据工作的联合负责人。


在当前的大模型战争中,数据质量和预训练策略被认为是决定模型智商上限的关键因素。

能够在这个核心环节担任负责人,足以证明他在谷歌内部的权重。

Andrew Dai 的学术贡献不仅限于此。

他曾与谷歌首席科学家 Jeff Dean 以及 Quoc V. Le(Google Brain 的传奇人物)共同撰写过多篇论文。

早在 2015 年,他发表的一篇关于半监督序列学习(Semi-supervised Sequence Learning)的论文,就被认为对后来 OpenAI 的 GPT 系列模型产生了深远的启发。


https://proceedings.neurips.cc/paper/2015/file/7137debd45ae4d0ab9aa953017286b20-Paper.pdf

一位熟悉 Andrew Dai 的人士评价道:「他是语言模型的先驱之一,过去二十年一直专注于预训练相关的研究。他最擅长的,就是如何从海量、嘈杂的数据源中提炼出高质量的“知识”。」

如果说 Andrew Dai 代表了谷歌在大数据处理上的暴力美学,那么联合创始人 Yinfei Yang 则带来了苹果系的精致与多模态视角。

Yinfei Yang 此前在苹果机器学习团队担任首席研究科学家(Principal Research Scientist),主要参与苹果自研 AI 模型的开发。


在加入苹果之前,他也曾在 Google Research 工作过四年,专注于多模态表示学习。

他在图像-文本共嵌入(Image-text Co-embedding)领域的专长,恰好填补了单纯语言模型的感知短板。

视觉推理

不只是「看见」,更要「理解」

Elorian 究竟想做什么?

根据 Andrew Dai 的说法,Elorian 并不是要再造一个 ChatGPT,而是要构建一个能够「同时理解和处理文本、图像、视频和音频」的原生多模态模型。

目前的 AI 模型大多是基于文本训练,再通过「补丁」的方式接入视觉能力。

而 Elorian 的愿景是构建一个天生的「通感者」。

这种模型不再是将图片转化为文字标签,而是像人类一样,通过视觉直接感知物理世界的逻辑。

「视觉推理」被认为是通向 AGI 的必经之路。

Andrew Dai 提到,机器人将是 Elorian 技术的一个潜在应用场景,但他强调公司的愿景远不止于此。

在硅谷的投资人眼中,这通常意味着 Elorian 瞄准的是AI 智能体的广阔市场——一个能够像人类一样看着电脑屏幕、理解图形用户界面(GUI)、处理退货流程、审核法律文件、操作其他软件的超级助手。

它不需要你通过 API 喂给它数据,而是直接像你一样「看」着 Excel 表格、「听」着电话录音,同时「读」懂屏幕上的邮件,并实时做出决策。

这就是 Elorian 试图构建的未来。

资本的逻辑

为「血统」买单

5000 万美元的种子轮融资,在几年前听起来像是天方夜谭,但在今天的 AI 泡沫中,这似乎成了顶级团队的「入场费」。

正在与 Elorian 洽谈领投的 Striker Venture Partners,本身也是一家极具话题性的新锐基金。

其创始人 Max Gazor 曾是老牌风投 CRV 的合伙人,以眼光毒辣著称。

他在去年 10 月刚刚自立门户,Elorian 很可能是该基金成立后的首批标志性赌注之一。

对于 Max Gazor 这样的投资人来说,他们赌的不仅仅是技术路径,更是「谷歌 DeepMind + 苹果」这种稀缺的基因组合。

谷歌提供了大规模训练基础设施的经验,而苹果则有着将 AI 落地到具体产品的务实文化。

Elorian 的出现,也折射出大模型战场的转移。

第一阶段的战争是关于「文本生成」,OpenAI 凭借 ChatGPT 拔得头筹;

第二阶段的战争则是关于「多模态理解」和「物理世界交互」。

在这个新战场上,无论是 Gemini 还是 GPT,都在疯狂补课视觉能力。

Elorian 作为一个初创公司,想要在巨头的夹缝中生存,唯一的筹码就是技术上的代差,或者在垂直场景(如复杂的视觉 Agent)上做到极致。

在硅谷,每一个从巨头出走的顶级研究员,都怀揣着一个「反叛」的梦想:用更小的团队、更聚焦的资源,去颠覆老东家庞大而迟缓的官僚体系。

Andrew Dai 离开了效力 14 年的谷歌,Yinfei Yang 离开了发布 Apple 智能的苹果。

他们选择了一条最艰难的路——试图教会机器不仅「看见」世界,还要「看懂」世界。

这让人想起计算机视觉领域的一句老话:「摄像头只是眼睛,算法才是灵魂。」

而在 AI 的洪流中,真正稀缺的永远不是算力,而是那些能够透过数据的迷雾,看清未来方向的眼睛。

参考资料:

https://www.theinformation.com/articles/former-google-apple-researchers-raising-50-million-new-visual-ai-startup

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!


来源:https://www.163.com/dy/article/KJ13L6FL0511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

谷歌安卓用户赔偿申请指南 135亿美元和解金如何领取
科技数码
谷歌安卓用户赔偿申请指南 135亿美元和解金如何领取

谷歌同意支付1 35亿美元和解一桩集体诉讼。该诉讼指控安卓系统未经用户同意通过移动网络传输数据,甚至在设备闲置时仍持续收集。和解方案已获法院批准,符合条件的美国安卓用户可提交赔偿申请。赔偿总额在扣除相关费用后,将由最多约1亿名符合条件的用户分配。

热心网友
05.14
谷歌健康应用上线 Fitbit 多项功能将停用或调整
AI
谷歌健康应用上线 Fitbit 多项功能将停用或调整

谷歌健康应用将上线,整合并取代Fitbit。部分功能将移除或调整:睡眠档案、鼾声检测等将整合;有氧健身评分更名为VO2max,计算方式更新;每日目标改为个性化每周目标;勋章系统取消;社交功能简化,移除私信与群组,旧版社交将于2026年5月锁定。迁移后用户可管理好友并参与新排名。

热心网友
05.14
谷歌发布Googlebook笔记本:搭载Gemini融合安卓与ChromeOS生态
科技数码
谷歌发布Googlebook笔记本:搭载Gemini融合安卓与ChromeOS生态

谷歌推出全新笔记本电脑Googlebook,以Gemini为核心深度整合安卓与ChromeOS生态。产品与宏碁、华硕等五大厂商合作,配备标志性Glowbar发光条。其引入MagicPointer智能光标,能感知意图提升效率,并支持动态生成桌面小组件。设备可实现安卓应用在电脑端流式运行,并支持跨设备无缝访问手机文件。谷歌同时承诺现有Chromebook将继续获

热心网友
05.13
谷歌与SpaceX洽谈合作计划将数据中心送入太空
科技数码
谷歌与SpaceX洽谈合作计划将数据中心送入太空

近日,科技行业传出一则引人瞩目的动态:谷歌与SpaceX正在就一项前沿合作进行秘密磋商,计划将数据中心部署至太空轨道。 这一时机选择颇具深意。SpaceX目前正积极筹备其史上规模最大的首次公开募股,估值预计高达1 75万亿美元。为了向投资者展现更具想象力的增长前景,SpaceX将“太空数据中心”概念

热心网友
05.13
谷歌与SpaceX合作研发太空数据中心 2027年发射首颗卫星
科技数码
谷歌与SpaceX合作研发太空数据中心 2027年发射首颗卫星

当业界仍在探讨云计算的下一个十年时,硅谷的领军企业已将视野拓展至真正的“云端”——近地轨道。据《华尔街日报》最新报道,谷歌正与埃隆·马斯克创立的SpaceX展开深入磋商,计划借助后者的重型运载火箭,将其极具前瞻性的“轨道数据中心”项目从蓝图变为现实。此次合作不仅是科技巨头间的战略协同,更可能重新定义

热心网友
05.13

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

华硕ROG枪神魔霸新锐2026游戏本预约开启
科技数码
华硕ROG枪神魔霸新锐2026游戏本预约开启

华硕ROG正式发布2026款枪神、魔霸及魔霸新锐系列游戏本并开启预约。枪神系列分为标准版与超竞版,均搭载酷睿Ultra9处理器,超竞版可选RTX5090显卡并配备光显矩阵屏。魔霸系列采用AMD锐龙处理器,高配可选锐龙99955HX3D与RTX5070Ti显卡。魔霸新锐系列主打性价比,配备RTX5060显卡,面向预算有限的玩家。

热心网友
05.15
锐龙5 9600X单通道内存电竞性能实测 依然轻松胜出
科技数码
锐龙5 9600X单通道内存电竞性能实测 依然轻松胜出

内存价格高企,单通道DDR5成为高性价比装机方案,但会降低游戏性能。测试显示,锐龙59600X凭借Zen5大核架构及对内存低延迟的优化,在搭配单条DDR56000内存时,游戏性能损失较小。相比之下,酷睿Ultra200SPLUS系列更依赖高带宽,单通道下性能下滑明显。在多款热门电竞网游实测中,锐龙59600X性能领先,且整机性价比优势显著。

热心网友
05.15
神牛ML40摄影灯内置锂电池版发布 售价568元起
科技数码
神牛ML40摄影灯内置锂电池版发布 售价568元起

神牛发布ML40系列摄影灯,包含ML40Bi和ML40R两款。ML40Bi售价568元,内置锂电池,支持边充边用及NFC快速连接,侧重便携智能。ML40R售价698元,具备更广色温调节范围,侧重专业色彩控制。两者均采用磁吸设计,兼容丰富附件,满足不同布光需求。

热心网友
05.15
华硕850W氮化镓电源白金重炮手849元入手
科技数码
华硕850W氮化镓电源白金重炮手849元入手

华硕TUFGaming系列推出新款850W白金重炮手氮化镓电源,到手价849元。该电源符合ATX3 1规范,长度150mm,采用全模组设计,配备12V-2×6接口支持600W峰值功率。其获得双白金效率认证与A-噪声认证,内部使用氮化镓元件与长寿电容,搭配135mm静音风扇,并提供8年质保,主打高效、安静与持久稳定。

热心网友
05.15
Falcon USD是什么币?USDF稳定币市值排名与投资价值解析
web3.0
Falcon USD是什么币?USDF稳定币市值排名与投资价值解析

FalconUSD(USDF)是一种与美元挂钩的稳定币,旨在为Web3生态系统提供可靠的交易媒介和价值储存工具。其运作依赖于储备资产支持和透明审计机制,在DeFi、跨境支付等场景有应用潜力。了解其技术原理、市场定位及潜在风险,有助于理性评估这一新兴数字资产的价值与前景。

热心网友
05.15