百度千帆Agent在权威评测DeepResearch+Bench中夺冠
2月4日消息,领先的智能体权威测评榜单DeepResearch+Bench公布了最新评测结果。百度千帆深度研究Agent(Qianfan-DeepResearch+Pro)凭借其端到端研究能力的突出表现以及研究报告的卓越生成质量,在该榜单中位列首位。
在衡量研究报告含金量的四个核心维度——全面性、洞察力、指令遵循度和可读性方面,千帆深度研究Agent均展现出行业领先优势。

当前,深度研究正成为人工智能发展的关键分水岭。不同于传统的文本生成,深度研究任务要求系统能够像人类专家一样,自主执行多步骤、可迭代的认知任务。这一过程涵盖了从复杂需求理解、广泛信息获取,到深度洞察产出的完整链条。
深度研究Agent目前已被广泛应用于学术综述、金融投研、商业分析等领域。它能够将传统上需要数日的手动研究工作,压缩至分钟级别完成,显著提升了研究与决策的效率。
作为评价这一前沿能力的“金标准”,DeepResearch+Bench填补了通用AI评测在端到端深度研究任务上的空白。
现有基准测试多聚焦于单一能力,难以覆盖长程推理与检索合成的复杂性。该榜单由领域专家设计了100个博士级别的研究任务,涵盖22个学科,并引入了RACE报告质量评价框架与引文准确性评估,是目前全球范围内衡量DeepResearch Agent生产力水平最硬核、最真实的评价体系。
千帆深度研究Agent能够在此次评测中脱颖而出,得益于其优异的技术设计。它采用Agentic架构,通过“任务理解-规划-执行”的循环机制实现端到端的研究交付,并依托百度搜索与RAG技术来保障信息获取的广度、可信度与相关性。
两大重要设计确保了任务执行的准确性:首先,采用“由粗到细”的研究路径展开方式,以应对任务的不确定性;其次,通过深度执行路径规划与实时反思机制,系统能在每个研究节点动态评估进展、调整策略,从而有效避免幻觉与路径偏差,确保复杂研究任务的高质量完成。
此外,在报告生成阶段,千帆深度研究Agent采用了独特的两阶段报告渲染机制:首先产出pivot报告,通过优化相关推理能力,来保证逻辑一致性和内容全面性;之后使用不同的渲染工具,基于pivot报告渲染出最终的markdown、html、ppt等多形态报告,从而实现“一次研究,多形态报告”的交付。
目前,该深度研究Agent已在百度千帆平台上线。用户只需输入复杂的调研需求,系统即可在十几分钟内生成带有引用的专业级研究报告,真正实现“分钟级”的深度洞察交付。
此次登榜是百度千帆 Agent Infra强大支撑能力的集中体现。千帆Agent Infra提供模型、工具、Agent开发、数据以及Agent运行环境等一站式开发服务。平台已累计开发超过130万个Agents,以百度独家能力“百度AI搜索”为代表的工具日均调用量已突破数千万次。
相关攻略
长征八号圆满发射千帆星座组网卫星,高密度发射序幕拉开 2024年4月7日晚间,海南商业航天发射场再传捷报。21时32分,伴随着巨大的轰鸣与耀眼的尾焰,长征八号运载火箭拔地而起,稳稳将千帆星座第七批组网卫星送入预定轨道。又一次,发射任务取得圆满成功。 火箭升空 话说回来,这次担纲主力的长征八号运载火箭
你好我是柴差(chaichai),一个野生的媒体人、段子手、残忍的社会观察者。无数的你我汇聚在这里,或许,我们能让这个世界变得更好。愿你们历经千帆,归来仍是少年。 “正文”《逐玉》这部剧一出来,想不
这项由百度千帆团队主导的研究发表于2026年3月17日的arXiv预印本平台(论文编号:arXiv:2603 13398v1),该研究推出了一个名为Qianfan-OCR的革命性文档智能模型,这个拥
智东西作者|三北编辑|漠影过去两个月,科技圈突然被一件事刷屏——“养虾”。从开发者社区到普通用户,从GitHub教程到线下装机摊位,一个名叫OpenClaw(昵称:龙虾)的AI Agent项目突然爆
定焦One(dingjiaoone)原创作者 | 陈颐编辑 | 阮梅春节刚结束的AI入口之争还没退潮,新的技术变量智能体(Agent)又把大厂重新拉回同一张牌桌。最近迅速走红的OpenClaw,也就
热门专题
热门推荐
分析数字货币基本面需从项目愿景、技术架构、经济模型及团队背景等多维度入手。核心在于评估其解决实际问题的能力、技术实现的可靠性以及代币经济的可持续性。这要求投资者深入研究白皮书、代码进展、社区生态和治理机制,而非仅关注价格波动。基本面分析是理解项目长期价值、识别潜在风险的关键方法。
虚拟币基本面分析需关注项目技术架构、代币经济模型、团队背景与社区生态。技术层面评估共识机制、可扩展性与安全性;经济模型分析代币分配、通胀机制与实际效用;团队与社区则考察开发能力、治理透明度及用户活跃度。综合这些维度,可更客观判断项目的长期价值与风险。
Tokens:数字世界的“多功能凭证” 简单来说,Tokens是一种基于现有区块链技术发行的数字凭证。你可以把它想象成数字世界里的“积分”或者“股票”,它代表着某种权利、价值或功能。 2025年虚拟货币主流交易所: 币安: 欧易: 火币: Tokens到底是什么? 从技术层面看,Tokens并非独立
加密货币基本面分析着眼于评估数字资产的长期价值,而非短期价格波动。它主要考察项目愿景、技术架构、代币经济模型、团队背景及社区生态等核心要素。通过分析这些内在因素,投资者可以更理性地判断一个项目是否具备可持续的竞争力与发展潜力,从而做出更明智的投资决策。
周一清晨,一家拥有110名员工的农业科技公司,全体员工突然发现自己的Claude账户无法登录。这并非个别现象,而是全员遭遇。从Slack运维频道出现第一张截图开始,短短十分钟内,整个公司都在询问同一个问题:我的Claude出什么问题了? 答案很快揭晓——问题不在用户,而是Anthropic对所有账号





