Fractal AI实验室新突破:深度侦测技术实现复杂信息挖掘
当市面上多数AI助手还在提供基础信息服务时,名为Fathom-DeepResearch的新型AI系统已展现出深度调查能力。这项由研究团队开发的技术突破,使AI能够像专业侦探般进行多轮信息挖掘,最终形成结构化的深度研究报告。该系统通过两个协同工作的模型,解决了传统AI处理复杂问题时的三大痛点:浅尝辄止的搜索、重复无效的提问以及缺乏深度的分析。
研究团队设计的Fathom-Search-4B模型,专门负责网络世界的深度探索。与传统AI不同,它不会在找到几条表面信息后就停止搜索,而是能进行20多轮的持续调查。这个模型通过特殊训练方法,学会了何时深入挖掘、何时转换角度、何时交叉验证信息。研究显示,在WebWalker测试中,该模型达到50%的准确率,远超大多数现有系统20%以下的水平。
要训练出具备深度调查能力的AI,研究团队开发了创新的技术方案。他们创建了包含约5000个问题的DUETQA数据集,每个问题都需要通过实时网络搜索才能解答。更巧妙的是,研究团队采用多智能体自我对弈的方法生成训练数据:一个模型负责设计复杂问题,另一个模型尝试解决这些问题。这种方法确保每个训练案例都必须依赖最新网络信息,无法通过AI的固有知识解决。
在训练过程中,研究团队设置了三重保险机制来保证数据质量。两个具备搜索能力的AI模型都必须通过网络找到正确答案,而第三个没有搜索能力的模型则必须失败。这种验证方式就像让不同侦探独立调查同一个案件,只有当有搜索能力的侦探都能破案,而没有搜索能力的侦探无法破案时,这个案例才会被纳入训练集。
针对多轮对话训练的技术难题,研究团队开发了RAPO训练方法。这种方法通过三重安全网机制稳定训练过程:课程剪枝机制让AI在掌握某些问题后暂时移除这类问题,专注于更困难的任务;优势缩放机制自动放大有效学习信号的重要性,确保AI能从稀少反馈中学习;回放缓冲机制保存成功解答案例,在AI完全失败时提供安全路线图。这些创新解决了传统强化学习在处理长序列任务时的“梯度崩溃”问题。
在frameS测试中,系统达到64.8%的准确率,显著超越其他开源竞争者。更令人惊喜的是,这种深度搜索能力的训练不仅提升了搜索任务表现,还增强了AI在其他类型推理任务上的能力。在数学推理、科学问答和医学知识测试中,系统都展现出令人满意的水平,证明了深度搜索训练对整体智能水平的提升作用。
研究团队开发的认知行为分类系统,能够实时分析AI的每个搜索动作属于哪种认知行为。这个奖励机制就像经验丰富的导师,当AI进行有价值探索时给予积极奖励,当AI陷入重复劳动时给予负面反馈,当AI找到正确答案但过程冗余时,则在奖励正确性的同时惩罚低效行为。研究人员可以通过调整参数控制AI的行为倾向,使其适应不同类型的调查任务。
在实际应用中,这套系统展现出广泛潜力。商业领域可用其进行市场研究和竞争分析,学术研究可借助其快速收集整理文献,新闻媒体可依赖其高效收集验证信息,法律行业可利用其进行案例研究和法条分析。对于普通用户,这意味着将拥有一个真正智能的个人研究助理,在购买决策、学习新知识或了解复杂议题时,都能获得深入全面的信息支持。
尽管取得显著成果,研究团队也指出系统存在的局限性。在面对超出训练范围的极端复杂问题时,系统性能提升有限。目前的训练方法依赖同步训练流程,大规模应用时可能面临效率瓶颈。系统的安全性和可控性仍需改进,特别是在面对恶意使用或极端情况时,如何确保系统安全运行是需要持续关注的问题。
这个能够进行深度网络搜索和信息综合的AI系统,代表了AI助手发展的重要方向。它不再满足于提供简单问答服务,而是成为真正的智能研究伙伴。通过解决训练数据生成、多轮对话稳定和精确行为控制等技术难题,这项研究为AI的全面发展贡献了有价值的方法和工具,展示了AI作为知识探索者和创造者的新可能性。
热门专题
热门推荐
《Zero Parades: For Dead Spies》的媒体评测已经解禁,结果相当亮眼。这款被许多人视为《极乐迪斯科》精神续作的作品,在OpenCritic上拿到了86分的媒体均分,在Metacritic上也有83分。游戏将于5月21日正式登陆PC平台,看来2026年的必玩叙事RPG名单上,又
目录 你是否也遇到过这些问题 处理效果 前置准备 超简单AI自动化解决方案 第1步:准备好你的原始数据 第2步:针对指定的文件下达指令 第3步:验收 还能解决这些同类问题 指令为什么这么有用? 更多场景直接抄作业 销售数据三级汇总 成本数据多级汇总 库存数据汇总 员工薪资汇总 常见问题答疑 核心价值
AI Agent 的发展,正迎来一个关键的转折点,从概念验证迈向真正的生产力交付。 想象一下,当一个 AI 智能体能够在无需人工介入的情况下,独立完成一个复杂项目的全流程,并将成功经验固化为可随时调用的“技能”——这是否标志着 AI 在职场中的角色,已经从辅助工具演变为自主的生产力单元? 随着 Op
彭博社的马克・古尔曼在最新报道中透露了一个有趣的发现:苹果为WWDC 26发布的宣传海报,其设计细节可能暗藏玄机,指向了即将在iOS 27中亮相的全新Siri交互界面。 根据古尔曼的分析,新版Siri的核心变化在于与灵动岛的深度融合。唤醒时,它将不再以传统的全屏或底部卡片形式出现,而是会以一个扩展的
GitHub 的 Star 数量还值得信赖吗?真相可能比你想象的更严峻。 开源社区中“购买 Star”的现象早已不是秘密,其便捷程度甚至超过点外卖,单价低廉且支持批量折扣。然而,卡内基梅隆大学(CMU)一项被 ICSE 2026 顶会收录的最新研究,首次系统性地揭示了这场“造假生意”的惊人规模:Gi





