谷歌Gemini 2.0三大新功能详解与体验评测

时间：2026-05-25 09:41

最近，Google的动作可谓一波接一波。给人的感觉是，趁着OpenAI的“存粮”似乎告一段落，Google正以惊人的频率向外推送更新。就在昨晚，他们又发布了一项关于Gemini的新功能——虽然这项功能实际上在周日就已上线，但官方推文直到深夜才姗姗来迟。说的就是它。这项新功能的核心在于“个性化”

最近，Google的动作可谓一波接一波。

给人的感觉是，趁着OpenAI的“存粮”似乎告一段落，Google正以惊人的频率向外推送更新。就在昨晚，他们又发布了一项关于Gemini的新功能——虽然这项功能实际上在周日就已上线，但官方推文直到深夜才姗姗来迟。

说的就是它。

这项新功能的核心在于“个性化”。它能根据你过往所有的Google搜索记录，让模型更深入地理解你的偏好，从而在搜索时提供更具针对性的答案。

这仅仅是上周更新潮中的一环。再往前看，上周五，Google升级了其“深度研究”（Deep Research）功能。这次升级的关键在于将底层模型换成了Gemini 2.0 Flash Thinking。与之前的1.5 Pro相比，新基座的能力显著提升，并且支持高达100万token的上下文长度。

时间再倒回上周四，几乎引爆全网的Gemini 2.0原生多模态功能，已经被用户们玩出了各种新花样。

更不用说同样在上周开源的Gemma 3，这个仅270亿参数的“小模型”，在多项基准测试中表现甚至超越了DeepSeek v3、o3-mini等对手。

Google这一周的动作，密集得有些超乎寻常。但每一个更新都分量十足，其内容足以让OpenAI开一场20分钟的发布会来专门介绍。

在深度体验了几天之后，一个清晰的感受是：Gemini 2.0系列可能被市场低估了。经过这轮更新，它已经成为我日常使用频率仅次于ChatGPT的AI对话产品。

原因很简单：综合体验与生态整合。

三大新功能深度解析

接下来，我们逐一拆解这三大核心更新。

1. 原生多模态：AI绘图的新范式

首先是上周四推出的“用嘴改图”功能，这堪称AI图像编辑的一种新范式。其强大之处无需过多赘述，直接看几个有趣的案例便知。

例如，通过自然语言指令一键去除图片水印。

或者，为一幅图中的人物一键更换服装。

在社交平台X上，还有一个非常有趣的案例：用户为自己拍摄的照片直接替换了背景。其指令大致是：“你已经上班迟到了，却还没离开家……于是你拍了一张健身照，然后对Gemini 2.0 Flash Experimental说：展示这位女士在N线14街站台的一张自拍照，她竖起大拇指，背景中有一群沮丧的MTA工作人员正在维修轨道。头顶的LED屏幕显示日期：2025年3月13日。”

效果看起来相当实用。这个功能目前可以在Google AI Studio体验。

2. 深度研究（Deep Research）：免费的研究利器

第二个重磅更新是“深度研究”功能。这里需要先表明一个态度：OpenAI的Deep Research和o1 pro，是我至今仍愿意为其支付每月200美元高昂订阅费的核心原因。一旦你体验过深度研究，很可能会被其产出所震撼。

以金融行业为例，与许多行业研究员和科研朋友交流后，他们普遍的反馈是：即使作为经验丰富的老手，要完成一份同等质量的研究报告，自己也至少需要投入10个小时以上。

但很多人可能不知道，“深度研究”这个功能概念，其实是Google在去年12月率先提出的。

不过，当时的底层模型是Gemini 1.5 Pro，其效果确实不尽如人意。随后，OpenAI在2月份基于o3模型微调出了自己的版本，并将效果提升到了新高度，也让“深度研究”这个概念真正进入了大众视野。后来，Perplexity和Grok 3等产品也推出了类似功能，但大多名为“深度搜索”（Deep Search），本质上是增强的AI搜索，与具备完整规划、拆解、合成能力的“深度研究”仍有区别。

深度研究本质上是一个智能体（Agent）产品。用户提出问题后，它会像真正的助手一样，先拆解目标、制定规划，然后进行搜索、信息合成，最终产出一份结构化的报告。其中最核心的一步，正是初始的目标拆解与规划，这极度考验模型的逻辑与规划能力，也直接反映了模型的智能水平。

此前，OpenAI用的是最先进的o3微调模型，而Google在去年12月却仍在使用与Sora同期的Gemini 1.5 Pro，这其中的差距不言而喻。好在，Google这次终于反应过来了，将基座模型更换为目前最新的推理模型——Gemini 2.0 Flash Thinking Experimental。

现在，你可以在Gemini官网直接使用该功能。

目前最吸引人的一点是：它免费。相比之下，OpenAI的Deep Research对使用次数限制严格：Plus会员（20美元/月）每月仅限10次，Pro会员（200美元/月）也只有150次，而未付费用户则完全无法体验。而Google这次至少做了一件非常良心的事：让免费用户也能体验到真正的深度研究，而非简单的深度搜索。

至于免费用户的具体使用次数限制，在官网上并未明确写明，只有一句模糊的提示。

但无论如何，这提供了一个宝贵的免费体验机会。

那么，实际效果如何？我们用一个具体案例来测试。最近笔者在研究电影工业化，其中漫威（Marvel）是一个重点案例。于是输入了以下提示词：“全面、系统地分析漫威（Marvel）在电影工业化进程中的布局与经验，涵盖历史背景、核心战略、制片体系、商业模式、营销策略、技术应用，以及它如何与迪士尼等合作方共同塑造全球化、跨媒体的超级英雄宇宙。通过多角度调研与论证，提炼漫威在现代电影工业发展的成功要素，并思考未来趋势与经验教训。”

与OpenAI的Deep Research不同，Gemini会先将研究框架和步骤清晰地拆解展示出来，待用户点击“开始研究”后，它才会启动全网搜索。而OpenAI的版本则会在搜索过程中动态调整目标。Gemini的方案也允许用户手动修改。

在起手式上，OpenAI通常会通过补充问题范围、激发用户思考来完善研究目标，这一点目前看来略胜一筹。

随后进入搜索阶段。

Gemini默认展示其思维过程，并用大幅UI重点呈现搜索来源，涵盖了海量网站甚至YouTube视频。经过大约10分钟的“思考”，一份报告便呈现在眼前。

坦诚地说，这份关于电影工业化的报告，在详细程度和深度上，与OpenAI产出的报告相比仍有差距。它的搜索非常精准（本次任务检索了约220个网站，相关性很高），但在最后的报告整合与深度提炼环节，表现有所欠缺。报告能解答部分疑惑，但尚未达到“直接可用”的成熟度。而OpenAI的Deep Research，在这一点上做得更好。

这很可能仍是受限于底层模型的能力。如果Google能换上Gemini 2.0 Pro Thinking，效果或许会有大幅提升，当然，那样可能就无法免费了。

不过，有从事科研的朋友反馈，在学术研究领域，得益于Google三十年的搜索积累和Google Scholar的布局，其搜索精准度往往更高，最终得到的报告在某些方面反而更优。当然，这需要更多测试来验证。

总结一下：Gemini Deep Research的模型能力稍弱，但搜索能力强，报告整合能力一般；OpenAI Deep Research搜索精准度中规中矩，但基座模型强大，报告整合与深度提炼能力出众。

必须指出的是，深度研究这类工具，将极大地、快速地提升个人获取高密度信息的上限，并可能深刻改变教育、研究等领域的工作模式。如果你之前因为费用或其他原因从未体验过Deep Research，那么强烈建议你趁Google这个版本目前免费，去亲自尝试一下。

无论是撰写行业报告、总结书籍，还是进行科学研究，先用起来。你会感受到一个全新的信息处理维度。