北京时间5月20日凌晨,一年一度的谷歌I/O开发者大会如期而至。依托其庞大的产品生态,这场发布会依旧信息密集,令人目不暇接。在两小时的主题演讲中,谷歌高管轮番登场,一口气带来了数十项产品更新,光是围绕核心产品的官方博客就发布了14篇。
贯穿整场大会的核心主题,无疑是“智能体(Agent)时代的Gemini”。几乎所有重要发布都围绕此展开:从轻量高效的基座模型Gemini 3.5 Flash,到雄心勃勃的全模态“世界模型”Gemini Omni,再到对标OpenAI“龙虾”的个人智能体Gemini Spark。此外,AI搜索引入智能体、智能体管理平台Antigra vity 2.0的升级,以及全新的AI智能眼镜,共同勾勒出谷歌对下一代AI应用的蓝图。
然而,市场的反馈却呈现出明显的两极分化。有机构算了一笔账:新一代轻量模型在能力升级的同时,运行成本也大幅攀升,其“性价比”可能并不如宣传中美好。资本市场的反应更为直接:截至5月20日美股收盘,谷歌(GOOGL.US)股价下跌超过2%,报收于387.66美元,总市值维持在4.7万亿美元。

两大模型撑场,月活翻倍
“自去年I/O大会以来,我们见证了技术的持续突破与飞速进展。”谷歌CEO桑达尔·皮查伊在开场演讲中,首先抛出了一组关键数据。去年此时,Gemini应用的月活跃用户数为4亿,如今这一数字已突破9亿,在一年内实现了翻倍。
用户增长的背后是算力需求的激增。两年前,谷歌每月处理的token(词元)量为9.7万亿个;到去年I/O大会时,这个数字增长至约480万亿个;而今年,规模再次实现了7倍的增长,谷歌每月处理的token量已突破3200万亿个。目前,谷歌旗下拥有13款用户规模超10亿的产品,其中5款产品的用户数甚至超过了30亿。皮查伊将这一增长的核心驱动力,归功于Gemini模型。
模型本身的演进,自然是本届I/O的重头戏。谷歌正式发布了新一代轻量模型Gemini 3.5 Flash。官方将其定位为专为快速、高效任务而设计的模型,声称其每秒输出的token数量是同类模型的4倍,而价格却不到前沿模型的一半。
根据谷歌提供的数据,与Gemini 3.1 Pro相比,3.5 Flash在几乎所有基准测试中都表现更优,尤其在编程和GDPVal这类更贴近真实经济任务的评测中优势明显。皮查伊甚至算了一笔经济账:目前头部科技公司每日处理的token量大约在1万亿左右。如果他们选择将其中80%的日常工作负载从其他前沿模型迁移到Gemini 3.5 Flash上,每年将节省超过10亿美元。
但硬币的另一面是成本。根据开发者的实际测试,3.5 Flash的能力或许介于3.0 Pro和3.1 Pro之间,且输出稳定性可能更差。更重要的是,其API调用价格比上一代Gemini Flash贵了3倍,叠加更高的token使用量,实际运行成本会显著增加。海外评测机构Artificial Analysis指出,Gemini 3.5 Flash在智能指数上得分55,比前代提升了9分,主要得益于智能体性能的提升和幻觉减少。虽然token处理速度确实更快,但更高的token用量和定价,使其运行成本比3 Flash高出5倍多,比3.1 Pro也高出75%。

目前,3.5 Flash已成为Gemini网页版和App的默认模型,面向全球用户免费开放体验。皮查伊同时透露,谷歌内部正在研发的Gemini 3.5 Pro模型已投入内部使用,预计将于下个月正式发布。
另一个备受瞩目的模型是Gemini Omni系列。在发布会前,社交媒体上已有诸多猜测。谷歌对其的定义是“能够基于任意输入,生成任意输出模态的内容”。该模型融合了Gemini的推理能力、Veo的视频生成能力以及Nano Banana的图片能力,旨在构建一个接近理想状态的“世界模型”,从而在理解现实世界方面实现飞跃。

此次推出的首个模型Gemini Omni Flash仅支持视频输出能力,谷歌表示未来将逐步扩展至图片和文本。发布会后,业界评价不一。有人认为其表现未达预期,不及当前顶尖的视频生成模型,甚至批评其为“资源的浪费”;但也有人视其为未来方向,因为一旦模型能无缝处理任何模态,智能体之间的协作方式将被彻底改变。
随着生成能力的升级,内容溯源也变得至关重要。针对日益严重的深度伪造(Deepfake)问题,谷歌在三年前就推出了数字水印技术SynthID,如今又为其加入了内容凭证验证功能,以帮助用户识别内容是否为AI生成或经过AI编辑。谷歌宣布,所有由Gemini Omni生成的内容都将携带SynthID水印,可被追溯。这项核验功能也被直接嵌入到谷歌搜索和Chrome浏览器中。同时,继英伟达之后,OpenAI、Kakao和ElevenLabs也将采用SynthID技术。只有当更多公司为其AI生成内容添加水印,这项技术才能真正发挥效力。
一系列智能体来了
在底层模型之上,谷歌真正想讲述的,是一个关于“智能体”的故事,并为此推出了一系列新产品。
首先是内置在Gemini应用中的个人智能体Gemini Spark。这被视为对标OpenAI“龙虾”的产品,它与谷歌Workspace套件(如Gmail、Docs等)深度集成,运行在谷歌云的专用虚拟机上,可以7x24小时执行任务。即使用户关闭电脑,Spark仍能在云端继续工作。谷歌演示了几个典型场景:例如让Spark自动解析月度信用卡账单,标记新增或隐藏的订阅费用;或者指示它检查收件箱,查看孩子学校的最新通知,提取重要截止日期并发送每日摘要。有评论认为,凭借谷歌的生态系统和影响力,Spark很可能迅速成为一个大众可用的“龙虾”。谷歌就像一位“沉睡的巨人”,一旦模型达到实用临界点,Gemini与Gmail、文档等生态的深度结合,将改变游戏规则。
谷歌同时宣布,将在搜索中引入“信息智能体”。今年夏天起,用户可以在搜索中创建这类智能体,让其持续跟踪特定信息。例如,监控股票价格波动、长期追踪租房市场行情、关注球鞋联名款发售或商品上新等。
面向开发者,谷歌升级了其开发和管理AI智能体集群的综合平台,推出了Antigra vity 2.0。这是一款可作为智能体交互核心枢纽的独立桌面应用,谷歌在其中内置了进一步优化的Flash版本模型,声称其响应速度可达其他前沿模型的12倍。
最后,谷歌分享了其在智能硬件上的进展——AI眼镜。新产品将分为两类:一类是配备小型镜片显示的视觉眼镜,另一类是专注于音频交互的音频眼镜。两款设备都旨在让用户解放双手,通过语音即可随时向Gemini提问并获取支持。

谷歌表示,音频眼镜将率先上市,计划于今年秋季推出。硬件由三星参与构建,而眼镜的设计则交给了Warby Parker与Gentle Monster。演示中展示了一些应用场景:例如通过眼镜让Gemini导航到上周与朋友见面的地点,并中途加入一家咖啡店;或者让Gemini打开DoorDash自动下单购买咖啡。
伴随着一系列新品的发布,谷歌也调整了Gemini的订阅价格。此前,AI Ultra套餐的订阅价为每月250美元。此次,谷歌将其拆分为两档:首先推出每月100美元的新Ultra计划,面向开发人员、技术主管、知识工作者和高级创作者;同时将最高档的Ultra订阅费用降至200美元。而面向更广泛用户的Pro订阅,价格则维持在每月19.99美元不变。
回看整场发布会,为了迎接智能体时代,谷歌的更新覆盖了从底层模型、应用层智能体、硬件设备到开发平台的全链条,几乎亮出了手中所有的牌。然而,与去年Gemini 3发布带来的碘伏性冲击相比,今年的更新更像是一次稳步的迭代,而非革命性的“变革”。性价比的疑虑、业界反馈的分化……这些都提示着,当下的AI竞赛早已不仅是技术能力的比拼,更是一场关于成本控制、生态协同与商业模式创新的综合较量。而生态协同,或许正是谷歌未来最大的看点。拥有全球最大的搜索引擎,以及邮箱、文档、云服务等组成的庞大产品矩阵,这张生态网络所构筑的护城河,确实是其他对手难以在短期内复制的优势。
