首页 游戏 软件 资讯 排行榜 专题
首页
AI
百度与中国人大联合研发AI智能体,实现精准控制工具使用成本

百度与中国人大联合研发AI智能体,实现精准控制工具使用成本

热心网友
69
转载
2026-05-14

这项由中国人民大学高瓴人工智能学院、上海财经大学与百度公司联合开展的前沿研究,已于2026年2月正式发布,相关论文预印本编号为arXiv:2602.11541v1。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

中国人大&百度:AI智能体学会

当我们谈论AI智能体时,脑海中浮现的往往是能够自主处理复杂任务的“数字助手”。然而,一个现实且关键的问题随之而来:如果让AI助手协助工作,但每次调用外部工具(如API)都需要支付费用,它是否会因缺乏成本意识而迅速耗尽预算,成为一个“预算杀手”?

这绝非危言耸听。随着AI智能体能力的不断增强,其通过调用外部工具(如计算器、搜索引擎、专业数据库API)来完成任务已成为标准操作。核心挑战在于,现实世界中的这些服务大多并非免费——获取实时金融数据、调用高精度地图API、查询专业文献库,往往都伴随着实际的经济成本。

研究团队观察到一个普遍存在的痛点:即便为AI设定了明确的预算上限,许多模型仍像对“金钱”没有概念一样频繁超支。这好比给孩子50元午餐费,他却花了61元,理由是“看到了更想吃的”。有趣的是,一些更复杂的模型虽然超支较少,却又走向另一个极端:变得过分保守,手握充足预算却不敢合理支出,导致任务完成度大打折扣。

针对这一核心痛点,团队创新性地开发了一套名为“INTENT”的智能预算控制系统。您可以将其理解为AI的专属“财务规划师”。其核心理念在于“全局规划与前瞻性预测”——让AI在执行每一步操作前,都能预先评估后续可能产生的连锁成本,从而确保整个任务流程在既定预算内高效、完整地执行。

INTENT如何工作:像资深主厨规划宴席

理解INTENT系统的工作原理,可以借助一个生动的比喻。假设您需要操办一桌宴席,但预算有限。缺乏经验者可能会先购买最昂贵的几道主菜食材,结果导致预算提前耗尽,无法购置必要的配菜和调料。而INTENT则像一位经验丰富的行政总厨,在采购前就进行通盘筹划:需要哪些食材、各自价格如何、按什么顺序采购最经济、哪些高价食材存在性价比更高的替代方案。

具体而言,INTENT系统整合了三个核心组件,共同构成一个高效的“智能财务决策团队”:

意图预测器:负责评估AI计划执行的每个操作是否必要,以及其成功的可能性有多大。这好比一位精明的投资顾问,在每笔支出前进行严谨的风险与收益评估。

条件生成器:负责模拟在理想资源条件下,任务应如何最优推进,相当于制定一份最高效的行动蓝图。

几何成本校准器:它会将现实执行中的各种不确定性(如工具调用失败、网络延迟等)纳入考量,对总体成本进行更为审慎和保守的估算,为决策提供安全边际。

实战表现:从“超支王”蜕变为“精算师”

研究团队在广泛使用的AI工具调用测试平台StableToolBench上验证了该方法的有效性。他们为任务设定固定预算,并为不同工具分配差异化的模拟使用成本,以高度还原真实的商业付费环境。

实验结果极具说服力。在未施加任何预算控制的情况下,AI助手的任务超支率超过65%。而引入INTENT系统后,不仅超支现象被完全杜绝,任务的整体完成率和质量反而得到了显著提升。

系统的环境适应性同样出色。当工具价格动态波动时,传统基于静态提示词的方法表现极不稳定,如同只会照固定菜谱做菜的厨师,一旦食材市场价格变动便束手无策。相比之下,INTENT能够灵活调整策略,主动搜寻并选择性价比更高的替代工具或方案,展现出类似专业采购经理的成本敏锐度。

进一步测试表明,INTENT在不同预算水平下均能游刃有余。预算充足时,它能智能分配资源以达成最优结果;预算紧张时,又能通过精明的资源调度和方案取舍,实现超出预期的效果。这种强大的弹性对于实际商业应用至关重要,因为不同用户和业务场景的预算约束千差万别。

技术巧思:无需重训模型的“智能导航仪”

从技术实现角度看,INTENT最巧妙的设计在于其“即插即用”的特性——它无需重新训练底层的大语言模型。这好比给现有的汽车加装一套先进的智能导航与油耗管理系统,而非重新制造一辆新车。这种设计极大地降低了部署门槛,使得现有的各类AI智能体系统能够快速、低成本地获得强大的成本管控能力。

系统还集成了一系列实用的优化机制。例如“轨迹缓存”功能:一旦AI通过规划找到了一条可行的低成本任务路径,系统便会记住后续步骤,避免重复进行耗时的规划计算。“黑名单机制”则能自动识别并标记那些历史成功率极低或成本过高的工具,防止AI在注定失败的操作上浪费宝贵的尝试次数和预算,如同精明的消费者会主动避开评价糟糕的商家。

案例透视:一次经典的“预算突围战”

为了更直观地展示INTENT的效果,研究团队提供了一个详尽的对比案例。任务目标是:在50个信用点的预算限制内,收集谷歌(Alphabet)公司的关键财务数据,包括季度现金流、资产负债表、损益表等。

无INTENT指导时:AI助手采取了简单直接的策略——首先调用最昂贵的“季度现金流查询”工具(花费38点),随后调用“资产负债表查询”工具(花费23点)。此时总花费已达61点,超出预算11点,任务宣告失败。颇具讽刺意味的是,AI在最终回答中“诚实”地报告了自己已超支。

有INTENT系统指导时:当AI最初同样打算调用昂贵工具时,INTENT及时介入,分析了整体任务链的成本结构并预警了超支风险。系统向AI反馈了包含各工具调用成功概率与预期成本的详细风险评估。基于此,AI智能调整了策略,选择了一套更便宜但同样有效的替代数据源和查询组合,最终仅消耗43个信用点就完成了所有必要数据的收集,并且输出了更全面、结构更清晰的分析报告。

这个案例清晰地揭示了INTENT的核心价值:它并非进行粗暴的消费限制,而是通过智能引导,帮助AI在复杂的约束条件下做出更明智、更具全局观的决策,从而追求任务的最优解。

深远意义:迈向高效且负责任的人工智能

这项研究解决的远不止一个技术优化问题。随着AI智能体在金融分析、法律尽职调查、云计算运维诊断等高价值专业领域加速渗透,成本控制已成为无法回避的商业现实和核心竞争力。一个无法有效管理预算的AI,无论其单项能力多么突出,都难以获得商业信任并实现大规模应用。

研究揭示了一个关键的人工智能系统设计原则:我们不能想当然地认为AI会自发地习得人类社会的经济价值观与资源约束意识。正如教育孩子需要明确的规则与引导,AI系统也需要专门设计的机制来确保其在复杂、多约束的现实环境中做出负责任、可预测、符合经济效益的决策。

INTENT的设计哲学体现了“最小干预”与“最大赋能”的结合。它不改变AI核心的推理与生成能力,仅在关键的成本决策点提供前瞻性指导和硬性约束,从而在最大限度保持AI原有灵活性与创造力的同时,确保了其行为的经济可控性。

从行业趋势来看,这项工作标志着AI智能体正朝着更加“成熟”和“负责任”的方向演进。未来的AI助手不仅要能高效完成任务,更要懂得在多重约束(如成本、时间、法规)下进行智能权衡与全局优化,其角色将越来越接近于一位真正的专业顾问。

归根结底,这项研究的核心贡献在于为AI赋予了“经济理性”与“成本意识”。正如培养一个优秀人才,不仅要传授知识与技能,还需教导其如何高效管理与配置资源;AI智能体也需要学会在有限的资源条件下做出最优选择。INTENT系统就是这样一位“AI财务教练”,它正在助力AI从只知执行的“工具”,成长为懂得权衡与规划的“智能伙伴”。

这种能力的重要性将与日俱增。当AI开始深度参与并处理具有真实经济后果的商业决策时,其成本控制意识与风险管理能力,将成为区分卓越系统与平庸系统的关键标尺。此项工作无疑为这一重要研究方向奠定了坚实的基础,并开辟了广阔的探索空间。

Q&A

Q1:INTENT系统是如何帮助AI智能体控制工具使用成本的?

INTENT系统通过扮演内置“财务规划师”的角色,由三大组件协同工作来实现成本控制:意图预测器评估每个操作的必要性与成功概率,避免无效支出;条件生成器规划全局最优的行动路径;几何成本校准器进行包含不确定性的保守成本估算。系统会在AI执行每个付费操作前进行全链条成本模拟,确保整个任务流程严格控制在预算之内。

Q2:为什么传统的AI智能体容易在使用付费工具时超支?

传统AI智能体通常缺乏内置的成本管控逻辑和全局规划能力。即便在提示词中被告知预算限制,它们也常采用简单的贪心或顺序执行策略(例如优先调用最强大或最熟悉的昂贵工具),导致预算被提前耗尽。另一方面,一些经过简单训练的模型虽然能减少超支,却又容易因过度规避风险而变得过于保守,因不敢进行必要支出而无法充分完成任务目标。

Q3:INTENT系统在动态工具市场中表现如何?

INTENT系统在面对动态变化的工具市场时,表现出卓越的适应性与决策灵活性。当工具价格发生波动,或有新的高性价比工具出现时,它能基于实时成本信息动态调整策略,主动寻找并切换到更经济的替代方案。无论是在预算充裕还是极度紧张的场景下,系统都能通过智能的资源分配与方案优化,实现当前约束条件下的效果最大化,展现出强大的鲁棒性。

来源:https://www.techwalker.com/2026/0312/3180937.shtml
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

AI智能体未来趋势与企业文化核心作用解析
AI
AI智能体未来趋势与企业文化核心作用解析

人工智能,尤其是智能体AI,能带来的生产力提升是实实在在的——投入产出比有望达到1:10,这个数字足以让任何企业决策者心动。但先别急着兴奋,要实现这份回报,企业要下的功夫可不少,关键就在于能否把AI真正“揉”进组织的文化血液里。 这个观点,是IT服务商Node4近期在其用户日活动上分享的核心洞察。作

热心网友
05.13
Ace Hardware推出AI助手实时提升门店员工服务效率
AI
Ace Hardware推出AI助手实时提升门店员工服务效率

近日,零售行业智能化应用迎来新突破。4月28日,全球知名家居建材零售商Ace Hardware正式推出名为“Hey ARMA”的AI智能助手,旨在为门店一线员工提供实时、精准的业务支持,优化顾客服务流程。 这款AI工具功能设计极具实用性:能够协助员工完成产品对比分析、提供家居项目解决方案、进行个性化

热心网友
05.13
陆奇商汤投资AI智能戒指四家初创公司一年内接连融资
业界动态
陆奇商汤投资AI智能戒指四家初创公司一年内接连融资

2026年春天的消费科技圈,智能戒指这个品类,又悄然回到了舞台中央。 一个颇有意思的信号是,高端酸奶品牌Blueglass在今年1月发布了一款智能戒指AI Alpha Ring。明眼人都能看出,这大概率并非自研,更像是与成熟供应链品牌的一次联名或定制试水。消费品牌跨界入局,往往是一个品类开始渗透大众

热心网友
05.13
普林斯顿研究揭示认知科学如何优化AI智能体设计
AI
普林斯顿研究揭示认知科学如何优化AI智能体设计

这项由普林斯顿大学、麻省理工学院、哥伦比亚大学和卡内基梅隆大学联合开展的研究,为我们打开了一扇新的大门。它发表于2026年,研究编号为arXiv:2602 22523v1,有兴趣深入探究的读者可以按图索骥,查阅完整的论文。 如今一提到人工智能,多数人脑海中浮现的,恐怕是ChatGPT这类能说会道的聊

热心网友
05.13
Netskope发布AI智能体实现SOC与NOC自动化运营
AI
Netskope发布AI智能体实现SOC与NOC自动化运营

告警风暴、基础设施日益复杂、专业人手持续短缺——这三大挑战正持续困扰着全球的安全运营中心(SOC)与网络运营中心(NOC)团队。近日,Netskope正式发布了一套由人工智能驱动的平台级解决方案,旨在精准应对这些核心痛点,为SOC与NOC团队的日常运营工作带来革命性的“效率解放”。 这套名为Nets

热心网友
05.13

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

马中新能源论坛探讨产业合作与人才培养新路径
科技数码
马中新能源论坛探讨产业合作与人才培养新路径

5月12日,马来西亚吉隆坡成功举办了一场具有前瞻性的行业盛会——中国-马来西亚电动汽车、电池技术与新能源人才创新发展论坛。来自两国政府部门、领军企业、顶尖高校及国际组织的代表共聚一堂,深入交流了在未来产业协同、清洁能源技术创新及高端人才培养等核心领域的合作路径与机遇。 马来西亚第一副总理兼乡村及区域

热心网友
05.14
智元APC香港观察:具身智能如何成为先进生产力单元
科技数码
智元APC香港观察:具身智能如何成为先进生产力单元

具身智能要迈过的第一道硬门槛,从来都是量产。 过去几年,全球人形机器人行业反复印证了这一点:舞台演示可以很快,工程验证可以很快,视频传播也可以很快。但当一台机器人要从实验室走向产线,再走向客户现场,问题的复杂度会呈指数级上升。 特斯拉的Optimus就是一个典型的参照系。马斯克多次表达过对Optim

热心网友
05.14
AI回答第一个字就暴露真假?识别AI胡说八道的关键信号
科技数码
AI回答第一个字就暴露真假?识别AI胡说八道的关键信号

向朋友问路时,如果对方清楚路线,通常会立刻回答“直走然后左转”。但如果对方并不确定,往往会先停顿一下,犹豫地说“呃……好像是……往那边?”。这个开口前的短暂迟疑,往往比最终给出的答案更能说明问题——对方是否真的知道答案。 近期,美国天普大学计算机与信息科学系的一项研究,正是捕捉到了AI回答问题时类似

热心网友
05.14
浙江大学万能分割学习器技术原理与应用场景详解
科技数码
浙江大学万能分割学习器技术原理与应用场景详解

这项由浙江大学、华南理工大学、南京大学和北京大学联合开展的前沿研究,于2026年4月正式发布,其论文预印本编号为arXiv:2604 24575。 图像分割技术听起来或许有些专业,但它早已深度融入我们的日常生活。无论是智能手机拍摄的背景虚化人像、AI系统在CT影像中精准勾勒病灶轮廓,还是自动驾驶汽车

热心网友
05.14
比亚迪大汉纯电续航1000公里对标56E车型参数曝光
科技数码
比亚迪大汉纯电续航1000公里对标56E车型参数曝光

“大唐”预售热潮尚未平息,“大汉”已蓄势待发,比亚迪王朝系列正以前所未有的攻势,叩响高端市场的大门。 在北京车展引发轰动的比亚迪大唐,预售订单已迅速突破10万台大关,彰显了市场对比亚迪高端产品的强烈期待。而最新信息显示,汉家族即将迎来一位重磅新成员——“大汉”,这款定位D级旗舰的轿车,目标直指20-

热心网友
05.14