最近接了个小活,帮朋友做个小咨询。说起来,早几年我的身份是咨询顾问,说白了就是给企业做管理咨询项目的那种人。
这类项目通常是因为企业有件挺专业的事要办,但内部没这个专业的人手,所以得找外援来推一把。而且大多数情况下,这些项目都是偏内部管理的,比如设个绩效体系、搞个企业文化、或者优化客户服务流程之类的。
这类项目有个共同的标签——贵。要是换成麦肯锡、埃森哲这种国际大牌,溢价更是高到离谱。所以,能买得起这服务的,清一色都是大公司,像央国企、金融机构这类主儿。门槛高,导致普通企业和普通人很难接触到专业的咨询顾问和量身定制的方案。
不过,AI被大众接受后,很多企业管理者甚至普通用户都希望AI能帮忙解决一些棘手问题。但大家普遍有个感觉——AI被吹得太厉害了。
大部分AI能听懂你问什么,也能给个基本正确但特别浅的回答,很难戳中问题的痛点和难点,有时候还产出幻觉,答非所问。于是不少用户得出结论:AI不好用,给的价值不大,问不问差不多。
其实AI厂商也发现了这个问题。为了解决它,各家前后脚推出了“深度研究”(Deep Research)功能。你可以把它理解成一种由AI模型驱动的自动化研究工具,能根据用户的需求,自动把任务分解成多个步骤去研究和完成。目标就是让AI更深入地理解问题,再通过查资料、推理分析,给出更详细、更专业的答案。
最早得追溯到2024年11月,谷歌的Gemini面向付费用户先推了Deep Research;接着OpenAI在2025年2月基于o3模型也上线了自己的Deep Research能力;之后国内像Kimi、通义、秘塔这些也都跟进了。之前被推到风口浪尖的Manus,本质上也是走的这条路子。

早前试用过好几个Deep Research,结果堆了一大堆文字报告绕圈圈,内容虚而不实。但最近再用,发现变化挺大。正好借着帮朋友做这个小咨询的机会,拿几个深度研究功能来对比演示一下。今天主要看三个:Gemini、ChatGPT、Kimi。
Gemini
先说Gemini。这个含着谷歌金钥匙长大的产品,进步是肉眼可见的快。尤其在OpenAI后程有点后劲不足的情况下,Gemini的用户体验越来越好了。
最新的Deep Research是由2.5 Pro版本驱动的。用起来很简单,点选“Deep Research”,输入提示词就能开始。提醒一下,为了让AI更好地分析问题、给出高质量报告,建议大家尽可能详细地写清楚信息,比如现状、困境、后续的计划和想法等。

我给的提示词涉及一些敏感信息,具体就不列了。但可以透露,在做了脱敏处理后,提示词差不多也有900字。试了几次发现,要想获得高质量报告,详细的提示词几乎必不可少。

很快,Gemini就给出了针对问题的拟定方案,点击“开始研究”就进入生成阶段。得力于谷歌的老本行,Gemini深度研究扒到的国内外信息源非常广。整个分析过程,它差不多搜索了100多个资料。这确实是AI的巨大优势——能在短时间内帮你挖掘海量资料,分析、阅读、提炼,最后形成有价值的观点。

不到10分钟,一份完整的报告就到手了。看到报告那一刻,说真心话,有点感动。这是万字级别的干货,足足19页。几乎等于原来我一个人花4-5天才能完成的工作量,现在10分钟不到就搞定了。报告里面背景痛点分析、竞品调研、数据验证、案例解析、解决路线,应有尽有。越看越震撼,逻辑性、完整性、可读性都太好了。

(此处再省略1200字对Gemini Deep Research的由衷称赞)
而且Gemini还支持生成多种阅读形式,包括网页、信息图、语音等。随便截取了一张Gemini给出的团队未来五年发展路线图,内容细到几乎可以直接照着落地,其他AI工具暂时还没看到这个水平的。

下面几张是更高可读性的图文版截图,图文结合把便捷性拉满了。

小结一下:Gemini的Deep Research体验非常舒服,生成报告的质量算得上专家级。整个能力几乎可以作为AI深度研究的标杆,推荐有需要的都可以上手一试。
ChatGPT
这次用的是OpenAI刚发布的最新旗舰模型GPT-5。以前试过4o版本驱动生成的报告,说实话有点失望,所以对GPT-5抱了比较大的期待。
使用深度研究功能,需要点输入框内的“ ”并找到“深度研究”。然后和Gemini一样上传写好的提示词。ChatGPT在分析用户上传的资料后,会针对性地补充一些问题,根据提示回复说明就行。

和Gemini一样,ChatGPT在过程中也会大量收集、分析资料。但从进度条能明显感觉到,它在资料挖掘数量上比Gemini少了很多。最终生成的报告显示,参考信息源只有30个。对于一个高质量报告来说,这不太够——我自己写一个完整报告,参考的资料都不止30个。整个报告生成时间控制在10分钟以内,甚至比Gemini还快一些。
另外,ChatGPT不支持直接生成类似Gemini的可视化总结浏览方式,这点不够友好。

为了方便比较,我同样截取了和Gemini类似的报告内容部分。可以看到,ChatGPT生成的内容会粗糙一些,有些部分过于精简,像在摸鱼一样。从个人角度看,如果Gemini得90分,ChatGPT只能得70分。不管报告完整性、专业度还是可读性,ChatGPT都弱一些。
Kimi
国内AI厂商也有不少提供深度研究功能的,体验一圈下来,Kimi算相对好一些的。这里直接选它来对比。
先说结论:Kimi生成的报告质量还过得去,但和前面的Gemini、ChatGPT比,差距比较明显,特别是内容和逻辑性、专业性上。如果说Gemini是10年工作经验的资深专家,那Kimi差不多只能算工作2-3年的初级咨询师。
使用方式类似,点选“深度研究”,上传提示词,耐心等待。为什么说耐心?因为这个报告差不多要花40分钟才能完成,确实有点久。不过和算力有关,也能理解。

同样截取了对比部分,可以看到阅读性方面会差一些,内容也稍显空洞。但Kimi会同步生成一个可视化报告,稍微弥补了阅读性上的不足。

从这几款深度研究工具的使用下来,Gemini是当之无愧的王者。ChatGPT有自己的优势,但不如Gemini全面。目前看,国内产品如Kimi、秘塔等的深度研究能力和前两个还有差距,需要进一步打磨。
如果公司或个人有需要深入研究、分析的问题,可以直接上手用各种AI的深度研究功能,比普通对话模式效果好很多。在AI加持下,越来越觉得大家在知识获取和学习上会趋于平等,这恰恰是技术向善的最好证明。AI的理想意义,大概就在这里。
