游乐游手机版
首页/AI教程/文章详情

谷歌开源深度研究Agent性能达SOTA 价格比GPT-5 Pro低90%

时间:2026-06-19 13:50
谷歌开源深度研究Agent,HLE测试达46 4%,优于GPT-5Pro的38 9%,成本仅十分之一。同时发布DeepSearchQA基准及InteractionsAPI,简化开发,提升金融科研自动化效率。

01 Deep Research Agent:更新网页搜索、低成本生成研究报告功能

谷歌在博客里提到,Gemini 3 Pro是迄今为止最“真实”的模型,这很大程度上归功于Deep Research Agent的迭代式流程。它会主动提问、阅读结果、识别知识空白,然后继续搜索。新版本的这项能力被大大强化,能够深入网站内部查找特定数据,而不是只在表面扫荡。 更重要的是,谷歌对这个Agent进行了专门优化,让它能以一个非常低的成本,生成高质量的深度研究报告。这从根本上改变了前期调研的成本结构。 对于金融、生物技术和市场调研这类行业,Deep Research Agent的价值在于它能提供快速、准确的初步调研,并基于早期反馈进行测试和修正。它不只是一个搜索引擎,而是一个可以分析复杂信息并输出结构化报告的系统。 * **统一信息综合**:能分析你的文档,也能搜索公开网络数据。最重要的是,它强大的长上下文处理能力,让你可以直接在提示中塞入大量背景信息。 * **报告可控性**:你可以通过提示词定义报告的结构、标题,甚至指定数据表的生成格式。 * **详细引用**:它会提供非常细粒度的来源链接,让你可以随时回去验证数据的真伪。 * **结构化输出**:支持JSON模式,下游应用可以直接解析、使用研究成果,非常方便集成。

02 DeepSearchQA:新Agent基础,涵盖17大领域、900条任务

这才是真正的“幕后功臣”。DeepSearchQA不是一个普通的测试题集,它是谷歌专门为评估像Deep Research这样的Agent在真实、复杂的网页研究任务中的表现而设计的。它弥补了现有基准测试与现实世界之间巨大的鸿沟。 这个基准有多硬核?它包含了900个由专家手工设计的“因果链”任务,覆盖了从分子生物学到宏观经济学的17个领域。这些任务一环扣一环,下一步的答案完全依赖于对上一步的分析。传统的测试只关心答案对不对,但DeepSearchQA评估的是“全面性”——你的Agent能不能生成一个详尽的答案集,覆盖问题的所有方面。这既是检验研究准确性,也是在考察Agent的“记忆力”。 另一个有趣的点是,DeepSearchQA还能衡量Agent的“思考时长”效率。谷歌内部评估后发现,允许Agent执行更多的搜索和推理步骤,其性能会显著提升。换句话说,这个基准可以帮你找到Agent的“思考效率”与“思考时长”之间的最佳平衡点。

03 交互API:集成专为Agent应用开发设计的接口

如果说Deep Research Agent和DeepSearchQA是“发动机”和“测试跑道”,那么Interactions API就是那个“驾驶座舱”。它不是一个简单的API,而是一套专门为Agent应用开发场景设计的交互界面。 开发Agent应用最大的痛点之一,就是处理那些交错出现的消息、思维链、工具调用和状态信息。Interactions API原生集成了处理这种复杂上下文的能力。目前,它除了提供Gemini模型套件,还直接内置了Deep Research Agent。 这意味着什么?你只需要一个API端点,就能同时连接Gemini模型、谷歌内置的Agent,以及未来你自己定制的Agent。这极大地简化了开发流程。 它的设计思路非常务实,主要解决了几个核心问题: * **可选的服务器端状态管理**:把历史记录管理的负担从客户端甩给服务器。这不仅简化了你的代码,减少了上下文管理的错误,还能通过提高缓存命中率来降低成本。 * **可解释和可组合的数据模型**:为复杂的Agent历史记录提供了一套干净的数据架构。开发者可以方便地对交错的信息、思维过程、工具调用及其结果进行调试、流式分析和推理。 * **背景执行**:可以把那些需要长时间运行的推理任务交给服务器,不需要一直保持客户端连接。这对后台任务或自动化流程非常有用。 * **远程MCP工具支持**:模型可以直接调用模型上下文协议(MCP)服务器作为工具。这为Agent连接外部数据源提供了标准化的方式。

04 结语:Gemini生态再扩容,谷歌简化Agent开发模式

总的来说,谷歌这次的动作,不只是更新了一个Agent,更是在围绕Gemini构建一个更完整的开发生态。Deep Research Agent证明了其自身在金融、科研等领域的巨大潜力。而Interactions API的发布,则是这把火的关键助燃剂,它试图把从模型能力到Agent应用之间的开发门槛降到最低。 未来,谷歌还会继续给这个生态添砖加瓦,比如让Deep Research Agent原生生成图表来做可视化分析,通过模型上下文协议(MCP)来连接更丰富的数据源,以及把它接入面向企业的Vertex AI平台。可以预见,在谷歌的规划里,Agent将不再是实验室里的新奇玩意,而是能立刻上手、马上创造价值的标准生产力工具。
来源:https://www.aiagiai.com/15621.html
上一篇奥特曼只是表象 揭秘ChatGPT30岁真正定海神针 下一篇Meta创始人扎克伯格忍痛亲口宣告元宇宙死亡
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Stable Diffusion WebUI本地模型下载配置与性能优化指南
AI教程 · 2026-07-04

Stable Diffusion WebUI本地模型下载配置与性能优化指南

StableDiffusionWebUI适合在个人电脑上运行本地绘图模型,关键在于准备显卡环境、正确下载模型、放入对应目录,并通过分辨率、采样器、显存参数等设置提升生成效率与稳定性。

Stable Diffusion WebUI插件安装配置教程:浏览器、编辑器或扩展市场
AI教程 · 2026-07-04

Stable Diffusion WebUI插件安装配置教程:浏览器、编辑器或扩展市场

StableDiffusionWebUI插件可增强模型管理、提示词、图像处理与工作流效率。安装前需确认版本、环境和来源,按内置扩展页、网址安装或本地导入完成配置,并做好备份与兼容性检查。

Stable Diffusion WebUI Docker一键部署:镜像拉取端口映射数据目录配置
AI教程 · 2026-07-04

Stable Diffusion WebUI Docker一键部署:镜像拉取端口映射数据目录配置

使用Docker部署StableDiffusionWebUI可降低环境配置难度,重点在于选择镜像、映射7860端口、挂载模型与输出目录,并提前确认显卡驱动、存储空间和访问权限。

Stable Diffusion WebUI API Key 获取与配置教程:账号注册与国内网络设置
AI教程 · 2026-07-04

Stable Diffusion WebUI API Key 获取与配置教程:账号注册与国内网络设置

围绕StableDiffusionWebUI的APIKey配置,说明账号注册、密钥获取、本地接口认证、国内网络访问设置、验证方法与安全注意事项,适合AI绘画工具初次部署和团队接入使用。

Stable Diffusion WebUI Linux服务器部署完整教程:从环境准备到后台运行
AI教程 · 2026-07-04

Stable Diffusion WebUI Linux服务器部署完整教程:从环境准备到后台运行

StableDiffusionWebUI在Linux服务器部署需先确认GPU、驱动、Python与依赖环境,再拉取项目、配置模型和启动参数。后台运行建议使用tmux、nohup或systemd,并做好访问鉴权、端口限制、资源监控与模型来源校验。