游乐游手机版
首页/科技数码/文章详情

FlowSearch智能体:上海AI实验室推出深度科研自动化方案

时间:2025-10-14 18:09
将复杂科研过程自动化落地,上海人工智能实验室推出FlowSearch! 在GAIA、HLE、GPQA以及TRQA等科研基准上,FlowSearch不仅实现了性能全面领先,还展示了AI在复杂科研任务

将复杂科研过程自动化落地,上海人工智能实验室推出FlowSearch!

在GAIA、HLE、GPQA以及TRQA等科研基准上,FlowSearch不仅实现了性能全面领先,还展示了AI在复杂科研任务中的动态协作与深度推理能力。

展开来说,当AI在问答基准和标准化测试中表现卓越之时,其进行科学研究的能力也在被更多关注。

科学研究不同于解题或信息检索,它是一个开放性、长期且复杂的认知过程——研究者需要提出原创问题、设计实验方案、收集并整合多源证据,并在不断迭代中形成系统结论。

这样的过程远超计算能力本身,它要求的是创新思维、动态推理能力以及对复杂知识关系的精准掌控。

而FlowSearch,正是一个由动态结构化知识流驱动的深度科研智能体。

它通过动态结构化知识流构建科研任务的多层依赖图,并在多智能体框架下实现任务的并行探索、知识的递归整合和流程的自适应优化。

与传统“输入—计算—输出”的封闭式AI不同,FlowSearch更像一个理解你研究思路的伙伴——当发现新信息,它会主动调整计划;当证据链不完整,它会引导进一步探索;当推理偏离目标,它会进行自我修正。

研究团队表示,它标志着科研智能体从“被动工具”迈向主动探索伙伴的新阶段,让科学发现不再只是等待AI输出结果,而是与AI一起探索、不断前进。

FlowSearch:让AI成为你的科研探索伙伴

FlowSearch由三大核心模块组成,每个模块都像科研团队中的“关键成员”,协同完成复杂任务:

1、Knowledge Flow Planner:规划研究路线,像科学家一样拆解问题、逐层细化制定任务;

2、Knowledge Collector:执行任务、收集信息,就像勤奋的实验助理一样整理数据;

3、Knowledge Flow Refiner:反思和优化整个研究流程,确保科研思路清晰、连贯、可持续。

当你提出研究问题时,FlowSearch先由Planner构建初步的知识流——每个节点代表一个子问题或关键概念,节点之间的连接描绘了知识依赖关系。

随后,多名“智能体”同时开始执行任务,Collector不断填充节点内容,而Refiner会根据中间结果动态调整流程——增删任务、优化依赖,让科研路径像有生命一样逐步演化。

动态结构化知识流:科研的逻辑网络

FlowSearch使用有向无环图把科研任务和知识关系可视化。每个节点都携带任务类型(检索、求解、回答)、描述和知识上下文,而节点间的边定义了信息流向。

这种设计让科研推理不再依赖线性顺序,而能同时展开多条探索路径,每一步都可追踪和验证。

换句话说,它不仅让 AI 能“想清楚每一步”,也让你能随时理解科研过程的脉络。

递归式知识流规划:逐层拆解科研问题

高质量的科研规划源于逐层细化的专家式思维。Planner模块采用递归扩展策略——从总问题出发,识别每一层需要细化的子任务,生成新的节点和依赖关系。

这一过程持续进行,直到形成完整的初始知识流。FlowSearch中的InternPlanner模型经过结构化科研任务数据微调,能够学习专家的拆解方式,让AI的规划既逻辑清晰,又稳健可靠。

知识采集与动态反思:让科研像“活”起来

Knowledge Collector执行任务、收集信息,并把结果整理成节点知识,为后续推理提供输入。

任务执行完成后,Knowledge Flow Refiner会启动反思机制:它能根据新信息调整节点和依赖关系,优化任务顺序,确保知识流持续进化。

这意味着FlowSearch不只是一个执行工具,它具备自组织、自纠错、自优化能力,可以在复杂科研任务中保持全局一致性,同时灵活应对局部变化。

以上设计让FlowSearch同时具备:

层次化分解能力:仿佛每个科研问题都能被拆解到最合适的颗粒度; 多路并行探索能力:智能体可以同时处理多个任务,提高效率; 全局收敛能力:动态调整确保最终知识流完整、逻辑自洽。

无论是复杂跨学科研究,还是大规模数据分析,FlowSearch都能让科研不再只是“等待AI输出”,而是真正的与AI共同探索。

实验结果与分析

1、综合性能突破

FlowSearch在三大权威基准GAIA、GPQA-diamond、HLE上,全面超越现有方法。

在生物领域的专业基准TRQA上,FlowSearch依托通用工具链超越了多个领域专用模型,显示出强大的专业问题解决能力。

2、模块有效性验证

去除动态知识流建模或反思模块均导致显著性能下降,验证了结构化规划与动态调整机制在提升推理深度与系统稳定性方面的关键价值。

3、Internplanner模型训练效果

经过微调的Internplanner-32B相比基础模型Qwen-3-32B在GAIA上提升约6个百分点,表明结构化知识训练能够显著增强模型的规划能力与任务一致性。

4、案例分析

通过FlowSearch与OWL的对比案例可以看出,FlowSearch通过显式依赖建模与中间结果整合,有效避免了证据丢失与逻辑链断裂,展现出更高的推理透明度与可解释性。

同时,FlowSearch不仅能够高质量地完成科研问答任务,还能直接适配于科学调研与报告生成任务,产出完整、全面且逻辑清晰的科学调研成果。

应用前景与科研影响

团队表示,FlowSearch的提出标志着科研智能体从“任务执行”向“知识驱动推理”的关键转变。

对于科研新人,它能够构建完整的知识探索路径,降低进入新领域的学习门槛;

对跨学科研究者,它提供了知识流整合与多模态信息融合能力;

对资深学者,它可作为智能研究助手,在假设生成、证据聚合和报告撰写阶段显著提升效率。

更重要的是,FlowSearch的动态结构化框架为未来可解释科研智能体与自演化科学发现系统奠定了通用基础——使智能体具备类研究者的思考、探索与自我反思能力,推动人工智能从工具向真正的科研伙伴演进。

论文链接:https://arxiv.org/abs/2510.08521

GitHub仓库:https://github.com/Alpha-Innovator/InternAgent

来源:https://36kr.com/p/3508669072759937
上一篇Sora2上线或重塑抖音生态,万亿市场赛道正在开启 下一篇2025年11月实施新车牌网办,全流程线上办理更便捷
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
最新消息称国行苹果iPhone 18 Pro Max电池容量达到了5391mAh增幅11.78%
科技数码 · 2026-07-05

最新消息称国行苹果iPhone 18 Pro Max电池容量达到了5391mAh增幅11.78%

国行iPhone18ProMax电池容量达5391mAh,较前代增幅11 78%,增量近568mAh;Pro机型仅小幅提升68mAh。爆料称最终数据待验证,若属实则续航将显著增强。

HMD发布四款诺基亚功能手机 配备AI按键与可拆卸电池
科技数码 · 2026-07-05

HMD发布四款诺基亚功能手机 配备AI按键与可拆卸电池

HMDGlobal推出4款诺基亚功能手机,均配1450mAh可拆卸电池及独立AI按键,支持语音控制,免费180天后付费。部分机型带摄像头,支持microSD卡扩展至32GB,具双SIM卡、3 5mm接口及蓝牙5 0。

云南以旧换新补贴扩围 新增智能影音与无人机
科技数码 · 2026-07-05

云南以旧换新补贴扩围 新增智能影音与无人机

云南省自2026年7月起扩大消费品以旧换新补贴范围,新增智能门锁、智能影音、无人机、数码相机等数码智能产品及吸油烟机、燃气灶、洗碗机、净水器等家电。按最终售价15%补贴,每类每件最高1500元,商户报名无限制。

小米Redmi 7英寸高性能手机传闻即将发布
科技数码 · 2026-07-05

小米Redmi 7英寸高性能手机传闻即将发布

最近圈内又有新动静了。据博主 @数码闲聊站 今天爆料,某家厂商的子系列下一代打算推出两款屏幕尺寸差异明显的机型:一块是 6 59 英寸的中屏 Pro,另一块则是 7 英寸的巨屏性能机。从该博主以往的爆料习惯来看,基本可以锁定是小米 REDMI 品牌的产品线布局。 有意思的是,早在今年 2 月,这位博

深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售
科技数码 · 2026-07-05

深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售

深光影像AF35mmF2 2CE全画幅镜头开售,提供E卡口和L卡口,标准版七百三十九元,套装版七百八十九元。全金属机身,重约一百七十五克,高三十六毫米,滤镜口径五十二毫米,光学结构五组七片,九片光圈叶片,最近对焦零点三五米,支持自动对焦。