游乐游手机版
首页/AI教程/文章详情

谷歌Gemini 2.0三大新功能详解与体验评测

时间:2026-05-25 09:41
最近,Google的动作可谓一波接一波。 给人的感觉是,趁着OpenAI的“存粮”似乎告一段落,Google正以惊人的频率向外推送更新。就在昨晚,他们又发布了一项关于Gemini的新功能——虽然这项功能实际上在周日就已上线,但官方推文直到深夜才姗姗来迟。 说的就是它。 这项新功能的核心在于“个性化”

最近,Google的动作可谓一波接一波。

给人的感觉是,趁着OpenAI的“存粮”似乎告一段落,Google正以惊人的频率向外推送更新。就在昨晚,他们又发布了一项关于Gemini的新功能——虽然这项功能实际上在周日就已上线,但官方推文直到深夜才姗姗来迟。

说的就是它。

这项新功能的核心在于“个性化”。它能根据你过往所有的Google搜索记录,让模型更深入地理解你的偏好,从而在搜索时提供更具针对性的答案。

这仅仅是上周更新潮中的一环。再往前看,上周五,Google升级了其“深度研究”(Deep Research)功能。这次升级的关键在于将底层模型换成了Gemini 2.0 Flash Thinking。与之前的1.5 Pro相比,新基座的能力显著提升,并且支持高达100万token的上下文长度。

时间再倒回上周四,几乎引爆全网的Gemini 2.0原生多模态功能,已经被用户们玩出了各种新花样。

更不用说同样在上周开源的Gemma 3,这个仅270亿参数的“小模型”,在多项基准测试中表现甚至超越了DeepSeek v3、o3-mini等对手。

Google这一周的动作,密集得有些超乎寻常。但每一个更新都分量十足,其内容足以让OpenAI开一场20分钟的发布会来专门介绍。

在深度体验了几天之后,一个清晰的感受是:Gemini 2.0系列可能被市场低估了。经过这轮更新,它已经成为我日常使用频率仅次于ChatGPT的AI对话产品。

原因很简单:综合体验与生态整合。

三大新功能深度解析

接下来,我们逐一拆解这三大核心更新。

1. 原生多模态:AI绘图的新范式

首先是上周四推出的“用嘴改图”功能,这堪称AI图像编辑的一种新范式。其强大之处无需过多赘述,直接看几个有趣的案例便知。

例如,通过自然语言指令一键去除图片水印。

或者,为一幅图中的人物一键更换服装。

在社交平台X上,还有一个非常有趣的案例:用户为自己拍摄的照片直接替换了背景。其指令大致是:“你已经上班迟到了,却还没离开家……于是你拍了一张健身照,然后对Gemini 2.0 Flash Experimental说:展示这位女士在N线14街站台的一张自拍照,她竖起大拇指,背景中有一群沮丧的MTA工作人员正在维修轨道。头顶的LED屏幕显示日期:2025年3月13日。”

效果看起来相当实用。这个功能目前可以在Google AI Studio体验。

2. 深度研究(Deep Research):免费的研究利器

第二个重磅更新是“深度研究”功能。这里需要先表明一个态度:OpenAI的Deep Research和o1 pro,是我至今仍愿意为其支付每月200美元高昂订阅费的核心原因。一旦你体验过深度研究,很可能会被其产出所震撼。

以金融行业为例,与许多行业研究员和科研朋友交流后,他们普遍的反馈是:即使作为经验丰富的老手,要完成一份同等质量的研究报告,自己也至少需要投入10个小时以上。

但很多人可能不知道,“深度研究”这个功能概念,其实是Google在去年12月率先提出的。

不过,当时的底层模型是Gemini 1.5 Pro,其效果确实不尽如人意。随后,OpenAI在2月份基于o3模型微调出了自己的版本,并将效果提升到了新高度,也让“深度研究”这个概念真正进入了大众视野。后来,Perplexity和Grok 3等产品也推出了类似功能,但大多名为“深度搜索”(Deep Search),本质上是增强的AI搜索,与具备完整规划、拆解、合成能力的“深度研究”仍有区别。

深度研究本质上是一个智能体(Agent)产品。用户提出问题后,它会像真正的助手一样,先拆解目标、制定规划,然后进行搜索、信息合成,最终产出一份结构化的报告。其中最核心的一步,正是初始的目标拆解与规划,这极度考验模型的逻辑与规划能力,也直接反映了模型的智能水平。

此前,OpenAI用的是最先进的o3微调模型,而Google在去年12月却仍在使用与Sora同期的Gemini 1.5 Pro,这其中的差距不言而喻。好在,Google这次终于反应过来了,将基座模型更换为目前最新的推理模型——Gemini 2.0 Flash Thinking Experimental。

现在,你可以在Gemini官网直接使用该功能。

目前最吸引人的一点是:它免费。相比之下,OpenAI的Deep Research对使用次数限制严格:Plus会员(20美元/月)每月仅限10次,Pro会员(200美元/月)也只有150次,而未付费用户则完全无法体验。而Google这次至少做了一件非常良心的事:让免费用户也能体验到真正的深度研究,而非简单的深度搜索。

至于免费用户的具体使用次数限制,在官网上并未明确写明,只有一句模糊的提示。

但无论如何,这提供了一个宝贵的免费体验机会。

那么,实际效果如何?我们用一个具体案例来测试。最近笔者在研究电影工业化,其中漫威(Marvel)是一个重点案例。于是输入了以下提示词:“全面、系统地分析漫威(Marvel)在电影工业化进程中的布局与经验,涵盖历史背景、核心战略、制片体系、商业模式、营销策略、技术应用,以及它如何与迪士尼等合作方共同塑造全球化、跨媒体的超级英雄宇宙。通过多角度调研与论证,提炼漫威在现代电影工业发展的成功要素,并思考未来趋势与经验教训。”

与OpenAI的Deep Research不同,Gemini会先将研究框架和步骤清晰地拆解展示出来,待用户点击“开始研究”后,它才会启动全网搜索。而OpenAI的版本则会在搜索过程中动态调整目标。Gemini的方案也允许用户手动修改。

在起手式上,OpenAI通常会通过补充问题范围、激发用户思考来完善研究目标,这一点目前看来略胜一筹。

随后进入搜索阶段。

Gemini默认展示其思维过程,并用大幅UI重点呈现搜索来源,涵盖了海量网站甚至YouTube视频。经过大约10分钟的“思考”,一份报告便呈现在眼前。

坦诚地说,这份关于电影工业化的报告,在详细程度和深度上,与OpenAI产出的报告相比仍有差距。它的搜索非常精准(本次任务检索了约220个网站,相关性很高),但在最后的报告整合与深度提炼环节,表现有所欠缺。报告能解答部分疑惑,但尚未达到“直接可用”的成熟度。而OpenAI的Deep Research,在这一点上做得更好。

这很可能仍是受限于底层模型的能力。如果Google能换上Gemini 2.0 Pro Thinking,效果或许会有大幅提升,当然,那样可能就无法免费了。

不过,有从事科研的朋友反馈,在学术研究领域,得益于Google三十年的搜索积累和Google Scholar的布局,其搜索精准度往往更高,最终得到的报告在某些方面反而更优。当然,这需要更多测试来验证。

总结一下:Gemini Deep Research的模型能力稍弱,但搜索能力强,报告整合能力一般;OpenAI Deep Research搜索精准度中规中矩,但基座模型强大,报告整合与深度提炼能力出众。

必须指出的是,深度研究这类工具,将极大地、快速地提升个人获取高密度信息的上限,并可能深刻改变教育、研究等领域的工作模式。如果你之前因为费用或其他原因从未体验过Deep Research,那么强烈建议你趁Google这个版本目前免费,去亲自尝试一下。

无论是撰写行业报告、总结书籍,还是进行科学研究,先用起来。你会感受到一个全新的信息处理维度。

3. 个性化(Personalization):更懂你的搜索

最后,简要谈谈第三个更新:个性化功能。

首次使用时,系统会提示你是否将其与你的Google账号关联。

关联后,Gemini便能根据你过往的搜索历史,提供更具针对性、个性化的答案。你使用Google搜索越多,它就越“懂”你。当然,这意味着……你懂的。

目前发现一个小问题:当提问中包含英文字母时,回答有时会意外切换成英文。但这无碍于我们看到一个关键趋势:Google终于开始将其过去三十年的生态积累,逐步融入到Gemini之中。这种巨头基于庞大生态构建的优势,不容小觑。

结语

回顾这一周密集的更新,每一项都是扎实的功能进步,更何况Google手中还握有AI视频的王牌Veo 2尚未完全打出。综合来看,Google在AI领域的实力和布局,或许在一定程度上被市场低估了。

AI技术的发展远未触及天花板,人类也远未见识到它的全部潜力。这场竞赛,才刚刚进入精彩的中盘。

来源:https://www.uisdc.com/gemini-2
上一篇零基础AI Agent高效工作流设计指南 快速应对BOSS需求 下一篇AI提示词工程设计指南:掌握四大核心原则轻松上手
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
批处理BAT入门教程第一篇
AI教程 · 2026-07-03

批处理BAT入门教程第一篇

提供13个批处理实战技巧,覆盖全盘查找并删除文件夹或文件、拷贝移动文件、创建畸形文件夹及设置隐藏属性等场景,可一键完成系统维护与文件管理工作,极大提升自动化操作效率和便捷性。

从零开始批处理命令For循环详解与实战案例
AI教程 · 2026-07-03

从零开始批处理命令For循环详解与实战案例

批处理For命令支持 d、 l、 r、 f四个参数。 d仅列出当前目录下的目录名; r递归搜索指定路径及其子目录中的文件; l生成数值序列; f可解析文件、字符串或命令输出,通过delims、tokens、skip、eol等选项灵活处理内容。

批评你的人是你生命中的贵人
AI教程 · 2026-07-03

批评你的人是你生命中的贵人

批评你的人往往最值得珍惜,因为他们关注你、助你成长。面对批评应包容反思,用行动改进而非辩解。接受批评是自我完善的过程,能让人少走弯路,避免重复犯错。这样的人正是生命中的贵人,值得感恩与珍惜。

测试人员角色定位与职责详解
AI教程 · 2026-07-03

测试人员角色定位与职责详解

测试人员角色经历了从找问题、保证质量到分析风险的转变,最终核心职责是提供关键信息,协助团队创造优秀产品。这包括识别问题、评估风险及帮助团队了解项目状态,而非单纯把关或追求完美。

经营成功测试生涯的实用方法与策略
AI教程 · 2026-07-03

经营成功测试生涯的实用方法与策略

一、测试生涯的起点 1989年,我在田纳西大学攻读研究生时,意外地从软件开发人员转行成为一名软件测试工程师。这并非我主动选择,说起来还有些戏剧性——某个早晨,教授质问我为何缺席那么多开发会议,我解释说这些会议总是安排在周末早上,对我这个第一次离家、刚入学的学生来说实在不便。结果呢?等待我的不是解聘通