游乐游手机版
首页/科技数码/文章详情

Hermes Agent正式加入Tool Search,AI养马应用Token节省效率显著提升

时间:2026-05-31 08:01
AI智能体工具增多引发“MCP工具税”,工具定义占用近50%上下文tokens。HermesAgent的ToolSearch按需加载,通过搜索-描述-调用流程,使ClaudeOpus4准确率从49%升至74%,降低上下文开销与误选概率。

2025年,AI智能体的发展进入快车道,但一个棘手的问题也随之浮现:当智能体需要接入的工具越来越多,模型上下文窗口里的那点空间,到底还够不够用?这背后隐藏着一个被称为“MCP工具税”的现象——工具本身的定义说明,正在悄悄吃掉宝贵的上下文资源,导致智能体处理能力大幅受限。

先看一组数据。Anthropic在2025年11月发布的一份报告揭示,在一个包含5台MCP服务器、共34个工具的Hermes部署场景中,平均每回合的提示符消耗达到45000个tokens。令人吃惊的是,其中大约22000个tokens——也就是将近50%——仅仅是为了描述工具本身。换句话说,智能体有一半的“脑力”是在理解自己有哪些工具可用,而不是真正用来处理用户问题,这种上下文浪费直接拉低了智能体的实际效率。

这种成本在典型的多服务器部署环境下更为显著。根据Anthropic今年4月发表的论文,工具定义部分最高时可消耗134000个tokens,而每回合的实际消耗也在15000到60000个tokens之间游走,进一步加剧了AI智能体在复杂场景下的性能瓶颈。


这带来的后果相当直接:成本飙升和准确率下降。会话启动时,由于缓存未命中,每次生成可能要花费0.07至0.10美元。更糟糕的是,当模型面对数百个与当前任务无关的工具选项时,反而会陷入“决策瘫痪”——本来要用工具解决问题,结果先在选择工具上绕了一大圈,严重拖慢智能体响应速度。

现在,Nous Research的开源项目Hermes Agent给出了一个巧妙的解法:Tool Search(工具搜索)。这个功能的思路很简单——不要再把所有工具的定义一股脑塞进上下文,而是让模型按需查找、按需加载,从而彻底消除MCP工具税带来的冗余开销。

实现上,Tool Search是一个可选的渐进式披露层。一旦开启,模型看到的工具数组里,原本的MCP工具和插件工具被替换成了三个核心“桥接工具”:

tool_search(query, limit?)——搜索延迟加载的工具目录
tool_describe(name)——加载某个工具的完整模式定义
tool_call(name, arguments)——调用延迟加载的工具

整个工作流程就像是一个三段式:模型先通过搜索找到可能合适的工具,然后查看这个工具的详细参数说明,最后再发起真正的调用。典型的交互过程如下:

Model: tool_search("create a github issue")
→ {matches: [{name: "mcp_github_create_issue", ...}]}
Model: tool_describe("mcp_github_create_issue")
→ {parameters: {type: "object", properties: {...}}}
Model: tool_call("mcp_github_create_issue", {title: "...", body: "..."})
→ {ok: true, issue_number: 42}

这就像先查目录、再读说明、最后动手操作,每一步的上下文开销都精确可控,让模型把有限的计算资源聚焦在核心任务上。

效果如何?Anthropic的内部MCP评测给出了非常有说服力的数字:Claude Opus 4在启用Tool Search后,准确率从49%直接跃升至74%;Claude Opus 4.5也从79.5%提升到了88.1%。无关工具的减少,明显降低了误选概率,同时大幅提升了AI智能体的实际推理表现。

搜索层本身的设计也值得关注。系统采用了经典的BM25文本检索算法,匹配工具名称、描述和参数名。如果BM25没有返回正分结果,系统会回退到工具名的字面子串匹配,避免所有工具名都含有相同词时出现零分问题。这套兜底机制,保证了搜索的鲁棒性,即使在工具命名不规范的情况下也能稳定工作。

配置参考

如果要在实际项目中启用Tool Search,只需在hermes.yaml文件中添加以下配置:

tools:
tool_search:
enabled: auto # auto(默认)、on 或 off
threshold_pct: 10 # 自动模式启用的上下文百分比阈值
search_default_limit: 5
max_search_limit: 20

从目前的发展趋势来看,如何高效管理工具集的上下文消耗,正在成为AI智能体落地的关键瓶颈。Tool Search这种“按需加载”的思路,也许就是下一个阶段的标配方案。毕竟,让模型把宝贵的注意力花在解决问题上,而不是纠结于用哪个工具——这才是正确的方向,也是下一代智能体架构的核心竞争力。

来源:https://www.163.com/dy/article/KU6CRUCO0511B8LM.html
上一篇智租换电冲刺港股,年利润816万,钱江摩托蜂巢新能源持股 下一篇四川眉山举办顶级无人机赛事 五千余名青少年空中博弈
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Redmi K90激活量破200万台,超两竞品销量之和
科技数码 · 2026-05-31

Redmi K90激活量破200万台,超两竞品销量之和

RedmiK90单品激活量突破200万台,接近同期两家同档竞品销量总和。消费者更青睐中屏全能机型,下一代K100系列将延续双尺寸策略。K90配备6 59英寸屏幕、骁龙8至尊处理器、7100mAh电池及100W快充,起售价2599元。

2026年最强拍照手机推荐 荣耀600 Pro火爆解析
科技数码 · 2026-05-31

2026年最强拍照手机推荐 荣耀600 Pro火爆解析

2026年手机影像竞争焦点从像素转向质感与瞬间捕捉,荣耀600Pro以精准定位在4000元档位脱颖而出。其不依靠堆砌参数,而是深度围绕用户日常拍摄痛点进行优化,从而成为备受市场关注的高性价比拍照手机选择。

3000元预算手机推荐,影像性能优先选这款
科技数码 · 2026-05-31

3000元预算手机推荐,影像性能优先选这款

预算3000元手机中,荣耀600标准版凭借全焦段4KLive直出与2亿像素大底主摄,影像实力突出,综合体验领先,且性价比高,是该价位最稳妥的推荐选择。

2026年颜值手机推荐 荣耀600把星空握在掌心
科技数码 · 2026-05-31

2026年颜值手机推荐 荣耀600把星空握在掌心

荣耀600于2026年5月发布,国补后2804元起,以幸运星三重星光幻彩、0 98mm全球最窄四等边及四款治愈系配色打造美学,搭配全维防护与出色人像拍摄,在2000-3000元价位独树一帜。

2026年最好玩手机推荐 荣耀600 Pro与众不同
科技数码 · 2026-05-31

2026年最好玩手机推荐 荣耀600 Pro与众不同

荣耀600Pro凭借扎实性能影像、AI玩法、Live影像及系统交互升级,成为2026年最具辨识度的手机之一,精准契合年轻人对互动感与新鲜感的需求,适合日常娱乐与社交分享。