首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
韩家炜教授谈下一代Agentic AI:如何实现智能适配?

韩家炜教授谈下一代Agentic AI:如何实现智能适配?

热心网友
41
转载
2025-12-18

着基础模型,尤其是大语言模型(LLM)的快速发展,Agentic AI 迅速兴起,并广泛应用于在科研、软件开发、药物研发、临床研究等广泛领域。

然而,工具使用不稳定、长程任务规划能力有限、特定领域的推理能力不足、真实环境中的鲁棒性较弱以及在未知环境中泛化能力有限等问题,限制了 Agentic AI 系统在真实场景中的有效部署。

当前的一个热门研究方向是:Agentic AI 系统通过适配(adaptation)机制对自身进行调整,从而提升其自身性能、可靠性和泛化能力,从而更好地适应特定任务需求和现实世界环境。

基于此,数据挖掘专家、伊利诺伊大学厄巴纳-香槟分校教授韩家炜团队,联合斯坦福大学、普林斯顿大学等多所高校的研究人员提出了一个系统性框架,旨在厘清 Agentic AI 适配策略的设计空间,使各方案之间的权衡更加清晰,为系统设计过程中策略的选择或切换提供实践指导。



论文链接:

https://github.com/pat-jj/Awesome-Adaptation-of-Agentic-AI/blob/main/paper.pdf

具体而言,研究团队将 Agentic AI 中的适配机制划分为“智能体适配”(Agent Adaptation)与“工具适配”(Tool Adaptation)两个维度,并归纳出四种适配策略。随后,他们综述了各类别中的代表性方法,并分析了它们的优缺点,指出了当前面临的核心挑战与未来的发展机遇。

研究团队认为,未来 Agentic AI 的进步取决于上述范式的策略性整合,而非孤立发展。“最终,下一代智能系统将不再是一个庞大的单体模型,而是由稳定的推理核心与一系列专业化、可自适应工具的有机协同所构成的体系。”


两个维度


“适配”是 Agentic AI 系统中的关键要素。通过这一机制,Agentic AI 可以调整自身的行为方式、决策策略以及内部表征,从而更好地契合特定领域、任务或运行环境的需求。如果缺乏此类自适应能力,Agentic AI 将难以超越最初的系统设计,在动态、真实世界环境中表现受限。

研究人员依据被优化的系统组件,将 Agentic AI 的适配策略划分为两个维度。

第一维度为智能体适配(Agent Adaptation),主要通过调整 Agent 的内部参数、表征形式或行为策略,使其更好地契合任务需求。这一维度既涵盖传统的模型微调方法,也包括利用环境反馈的现代强化学习方法。

第二维度为工具适配(Tool Adaptation),其优化目标从 Agent 本身转移至其外部工具,如检索器、规划器、记忆模块以及各类专用模型,使得在 Agent 参数保持冻结的情况下,系统仍能从一个可适配的运行环境中获益。



图|Agentic AI 适配机制的概览


四种适配范式


在这两个维度内,研究人员进一步确定了四种不同的适配范式。

在智能体适配这个维度上,Agentic AI 可以根据其与工具、环境或自身输出的交互反馈,不断修正其行为与决策能力的机制。这一过程对于提升智能体在多样化任务中的自主性、推理能力与泛化能力具有关键作用。这一维度可归纳为两个适配范式:

A1:工具执行信号驱动的智能体适应



A1 关注的是智能体自身的适配,其学习信号直接来源于工具的执行结果。在这种设置下,外部工具会返回明确、可验证的反馈,例如代码是否成功运行、检索结果是否匹配目标文档,或某次 API 调用是否返回正确结果。

智能体并不依赖主观评价,而是根据这些由工具执行直接产生的“对或错”信号来调整其决策与行为方式。

这一机制常见于程序合成、信息检索和自动化推理等任务中,其核心特征在于反馈信号具有高度确定性和可验证性。



A2:智能体输出信号驱动的智能体适应



A2 同样以智能体的更新为目标,但其学习信号来自对智能体自身输出结果的评估。在该策略中,智能体的最终答案、规划方案或推理过程会被整体评判,其评价标准可以是答案是否正确、人类或模型给出的偏好评分,或对推理质量的综合判断。

与前一类不同,这里的反馈并不一定直接来自工具执行,而是基于对输出结果的整体评价,因此更适用于开放性任务、主观性较强的问题,或缺乏明确可执行验证机制的场景。

在工具适配这个维度,Agentic AI 将优化目标指向外部组件,即在感知、计算与交互过程中起中介作用的“工具”。这些工具包括预训练模型、检索模块、规划器或执行器等,并可由智能体通过自然语言或代码进行调用。

因此,工具适配关注的并非智能体的内部认知结构,而是其运行环境的整体能力提升。这一维度可归纳为两个适配范式:



T1:智能体无关的工具适应



在 T1 中,智能体保持参数冻结,不参与学习,而各类工具则在系统部署前通过独立训练获得能力。这些工具可以是检索器、领域专用模型或其他预训练组件,智能体只负责在推理过程中调度和组合它们。

这种做法强调模块化和可复用性,使得同一个智能体能够在不改变自身结构的情况下,灵活接入不同能力的工具。

T2:智能体监督的工具适应



在 T2 中,智能体依然保持固定,但工具会根据智能体的输出表现或使用效果进行更新。例如,检索器可以依据智能体最终任务是否成功来调整检索策略,重排序模块可以学习为智能体提供更有用的信息排序,记忆模块也可以根据智能体的使用习惯不断优化存储内容。

这一机制的关键在于,工具的训练目标不再是独立性能最优,而是更好地支持特定智能体的决策与推理过程。




四个研究机遇


基于以上分析,研究团队提出了四个潜在的研究机遇,为开发更高效、可扩展的 Agentic AI 指明了方向。通过整合参数高效微调、量化及端侧适配,未来的智能体将能持续进化,准确契合用户需求与环境限制。

协同适配

在协同适配框架下,智能体的决策与工具的内部机制同步调整,彼此构成动态的学习环境,从而形成更紧密、也更灵活的协作关系。这一设想突破了当前通过固定其中一方来维持训练稳定性的主流做法,使系统优化目标从单点性能提升转向整体协同效果。

与此同时,协同适配也带来了新的挑战,包括复杂任务中的责任归因问题,以及双方同时学习所引发的稳定性风险。未来研究需要在联合训练机制与学习节奏控制方面取得进展,才能推动协同适配走向可扩展、可靠的 Agentic AI 系统。



图|协同适配示例。

持续适配

现有的适配方法预设任务环境是稳定的,通常一次只针对单一任务进行优化。但在真实应用中,任务类型、可用工具和用户需求都会不断变化。为此,Agentic AI 需要具备持续适配的能力,能够在动态环境中不断更新自身行为、工具和记忆。

持续适配的核心是在学习新任务的同时尽量保留已有能力。一方面,通过持续更新模型参数来实现适配,通过限制对关键参数的改动或采用参数高效的更新方式,减轻遗忘问题;另一方面,依赖外部记忆,将经验、工具调用和用户反馈存储并逐步整理,使核心模型保持稳定。



图|持续适配示例。

安全适配

当 AI 从“静态模型”升级为能够不断学习和调整的智能体系统,安全问题也随之发生变化。传统方法主要关注固定模型是否对齐,而一旦系统具备持续适配能力,新的风险就会来自自主试错和持续优化本身。

因此,安全适配的关键不在于彻底限制学习能力,而是在学习过程中引入约束和校验机制,例如在工具调用前进行安全检查,用更可验证的标准评估行为结果,以及防止智能体和工具在适配中相互“迎合”。只有这样,Agentic AI 才能在持续进化的同时保持可控和可靠。



图|安全适配示例。

高效适配

目前,Agentic AI 的学习和适配往往依赖大量算力,这使得它们难以在个人设备上运行,也限制了个性化能力。高效适配的核心目标,是让智能体在更少计算资源下完成学习,从而走向手机、边缘设备等真实使用场景。

一条思路是只对模型进行极小幅度的更新,用很少的参数完成新任务的学习,降低计算和存储成本;另一条思路是通过降低计算精度来提升效率,让学习过程更快、更省能耗,而不会明显影响最终效果。

高效适配意味着把学习过程搬到用户设备本身。智能体可以在本地根据用户的使用习惯不断调整行为,既提升个性化体验,也减少数据外传带来的隐私风险。



图|高效适配示例。

展望未来,Agentic AI 的发展将取决于对上述适配范式的策略性融合,通过采用混合式架构,在保持以智能体适配所带来的深层推理能力的同时,结合以工具适配的模块化效率,实现更好的鲁棒性与可扩展性。

来源:https://www.163.com/dy/article/KH282AVT0531E3NX.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

阿里云团队版Token Plan正式上线
科技数码
阿里云团队版Token Plan正式上线

5月11日,阿里云正式发布团队版Token Plan服务,为企业AI规模化应用带来全新解决方案。该服务整合了通义千问Qwen3 6、智谱GLM-5 1、月之暗面Kimi-K2 6、万知Wan2 7等十余款主流多模态大模型,旨在通过标准、高级、尊享三档灵活套餐与多坐席管理功能,一站式解决企业在AI订阅

热心网友
05.17
webshell中上传asp文件调用服务器ActiveX控件溢出获取shell
网络安全
webshell中上传asp文件调用服务器ActiveX控件溢出获取shell

角色与核心任务 你是一位顶级的文章润色专家,擅长将AI生成的文本转化为具有个人风格的专业文章。现在,请对用户提供的文章进行“人性化重写”。 你的核心目标是: 在不改动原文任何事实信息、核心观点、逻辑结构、章节标题和所有图片的前提下,彻底改变原文的AI表达腔调,使其读起来像是一位资深人类专家的作品。

热心网友
04.28
从“摸黑探索”到“撞开大门”,OpenClaw引爆的产业技术路线演变
科技数码
从“摸黑探索”到“撞开大门”,OpenClaw引爆的产业技术路线演变

从“动口”到“动手”:OpenClaw如何将AI推入“执行时代”? 文|洞见新研社 3月的最后一周,OpenClaw的GitHub社区上演了一出反转剧。往日里忙着报错的开发者们这次成了观众,主角换成了来自蚂蚁、天融信、360等机构的安全研究员,他们密集披露了数十个涉及远程接管、信息泄露的高风险漏洞。

热心网友
04.22
程序员惊喜,每月100美元!OpenAI上线全新Pro方案:Codex限时额度翻倍
业界动态
程序员惊喜,每月100美元!OpenAI上线全新Pro方案:Codex限时额度翻倍

程序员惊喜,每月100美元!OpenAI上线全新Pro方案:Codex限时10倍额度 北京时间4月10日凌晨,OpenAI终于落下了重度用户期盼已久的那只靴子:正式推出每月100美元的全新订阅方案。 至此,OpenAI的商业化版图已经清晰地划分为四个核心层级: ·免费版(接入广告) ·每月8美元的G

热心网友
04.22
国内首款“养虾本”来了
科技数码
国内首款“养虾本”来了

2026 04 14 一个核心趋势是:未来的商业竞争,本质上是用户注意力资源的争夺战。谁能更精准、高效地连接信息与用户需求,谁就能在市场中赢得关键优势。 本文配图深刻揭示了这种高效连接的底层逻辑与完整工作流。它系统展示了从数据采集到价值交付的闭环链路,每个环节都紧密耦合。实践证明,其中任一节点的效率

热心网友
04.14

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

斯柯达晶锐Fabia Motorsport特别版车型正式发布
业界动态
斯柯达晶锐Fabia Motorsport特别版车型正式发布

为庆祝品牌投身赛车运动整整125年,斯柯达正式推出了晶锐Fabia Motorsport Edition特别版。这款车基于Fabia 130打造,设计灵感直接来源于征战赛场的Fabia RS Rally2拉力赛车,整体风格充满了对赛事历史的致敬意味。不过,得先说明白,它的升级重点主要落在了外观和底盘

热心网友
05.18
灰度以太坊质押ETF持仓超10万枚ETH 价值2.37亿美元
web3.0
灰度以太坊质押ETF持仓超10万枚ETH 价值2.37亿美元

Grayscale 通过其以太坊质押 ETF 质押了 102,400 个 ETH,价值 2 37 亿美元 先来看一组数据:资产管理巨头 Grayscale 最近通过其以太坊质押 ETF,一口气质押了超过10万个 ETH,价值约2 37亿美元。这个动作本身不小,但更有意思的是市场的后续反应——或者说,

热心网友
05.18
劳斯莱斯库里南防弹版发布 Inkas打造隐形防护座驾
业界动态
劳斯莱斯库里南防弹版发布 Inkas打造隐形防护座驾

劳斯莱斯库里南自问世以来,始终是超豪华全尺寸SUV领域的标杆。对于追求极致安全又不愿牺牲低调气质的高净值人士而言,如何实现“隐形”的顶级防护,一直是核心诉求。如今,加拿大专业防弹车制造商Inkas,以一款近乎“零痕迹”改装的库里南,给出了完美解决方案——一座移动的“隐形堡垒”。 区别于常见的外露装甲

热心网友
05.18
GTA5与荒野大镖客2高清复刻版或将登陆Switch平台
游戏资讯
GTA5与荒野大镖客2高清复刻版或将登陆Switch平台

新加坡维塔士工作室正考虑将《侠盗猎车手V》与《荒野大镖客:救赎2》移植至任天堂Switch平台。该团队拥有丰富的移植经验,曾成功负责多款游戏的跨平台适配。这两款作品全球销量巨大,若能登陆Switch,其便携特性可能成为新的市场增长点。

热心网友
05.18
大众ID. Polo GTI全球首发亮相 高尔夫GTI刷新纽北赛道纪录
业界动态
大众ID. Polo GTI全球首发亮相 高尔夫GTI刷新纽北赛道纪录

当高尔夫GTI迎来五十周年里程碑,传奇的纽博格林北环赛道成为其致敬历史与展望未来的最佳舞台。这里不仅铭刻了燃油性能图腾的巅峰时刻,也正式开启了电动GTI的新纪元。近日,大众汽车正式宣布,高尔夫GTI 50周年版在纽北创下全新纪录,荣膺最快前驱量产车称号;与此同时,品牌首款纯电动GTI车型——ID

热心网友
05.18