游乐游手机版
首页/科技数码/文章详情

Hermes Agent正式加入Tool Search,AI养马应用Token节省效率显著提升

时间:2026-05-31 08:01
AI智能体工具增多引发“MCP工具税”,工具定义占用近50%上下文tokens。HermesAgent的ToolSearch按需加载,通过搜索-描述-调用流程,使ClaudeOpus4准确率从49%升至74%,降低上下文开销与误选概率。

2025年,AI智能体的发展进入快车道,但一个棘手的问题也随之浮现:当智能体需要接入的工具越来越多,模型上下文窗口里的那点空间,到底还够不够用?这背后隐藏着一个被称为“MCP工具税”的现象——工具本身的定义说明,正在悄悄吃掉宝贵的上下文资源,导致智能体处理能力大幅受限。

先看一组数据。Anthropic在2025年11月发布的一份报告揭示,在一个包含5台MCP服务器、共34个工具的Hermes部署场景中,平均每回合的提示符消耗达到45000个tokens。令人吃惊的是,其中大约22000个tokens——也就是将近50%——仅仅是为了描述工具本身。换句话说,智能体有一半的“脑力”是在理解自己有哪些工具可用,而不是真正用来处理用户问题,这种上下文浪费直接拉低了智能体的实际效率。

这种成本在典型的多服务器部署环境下更为显著。根据Anthropic今年4月发表的论文,工具定义部分最高时可消耗134000个tokens,而每回合的实际消耗也在15000到60000个tokens之间游走,进一步加剧了AI智能体在复杂场景下的性能瓶颈。


这带来的后果相当直接:成本飙升和准确率下降。会话启动时,由于缓存未命中,每次生成可能要花费0.07至0.10美元。更糟糕的是,当模型面对数百个与当前任务无关的工具选项时,反而会陷入“决策瘫痪”——本来要用工具解决问题,结果先在选择工具上绕了一大圈,严重拖慢智能体响应速度。

现在,Nous Research的开源项目Hermes Agent给出了一个巧妙的解法:Tool Search(工具搜索)。这个功能的思路很简单——不要再把所有工具的定义一股脑塞进上下文,而是让模型按需查找、按需加载,从而彻底消除MCP工具税带来的冗余开销。

实现上,Tool Search是一个可选的渐进式披露层。一旦开启,模型看到的工具数组里,原本的MCP工具和插件工具被替换成了三个核心“桥接工具”:

tool_search(query, limit?)——搜索延迟加载的工具目录
tool_describe(name)——加载某个工具的完整模式定义
tool_call(name, arguments)——调用延迟加载的工具

整个工作流程就像是一个三段式:模型先通过搜索找到可能合适的工具,然后查看这个工具的详细参数说明,最后再发起真正的调用。典型的交互过程如下:

Model: tool_search("create a github issue")
→ {matches: [{name: "mcp_github_create_issue", ...}]}
Model: tool_describe("mcp_github_create_issue")
→ {parameters: {type: "object", properties: {...}}}
Model: tool_call("mcp_github_create_issue", {title: "...", body: "..."})
→ {ok: true, issue_number: 42}

这就像先查目录、再读说明、最后动手操作,每一步的上下文开销都精确可控,让模型把有限的计算资源聚焦在核心任务上。

效果如何?Anthropic的内部MCP评测给出了非常有说服力的数字:Claude Opus 4在启用Tool Search后,准确率从49%直接跃升至74%;Claude Opus 4.5也从79.5%提升到了88.1%。无关工具的减少,明显降低了误选概率,同时大幅提升了AI智能体的实际推理表现。

搜索层本身的设计也值得关注。系统采用了经典的BM25文本检索算法,匹配工具名称、描述和参数名。如果BM25没有返回正分结果,系统会回退到工具名的字面子串匹配,避免所有工具名都含有相同词时出现零分问题。这套兜底机制,保证了搜索的鲁棒性,即使在工具命名不规范的情况下也能稳定工作。

配置参考

如果要在实际项目中启用Tool Search,只需在hermes.yaml文件中添加以下配置:

tools:
tool_search:
enabled: auto # auto(默认)、on 或 off
threshold_pct: 10 # 自动模式启用的上下文百分比阈值
search_default_limit: 5
max_search_limit: 20

从目前的发展趋势来看,如何高效管理工具集的上下文消耗,正在成为AI智能体落地的关键瓶颈。Tool Search这种“按需加载”的思路,也许就是下一个阶段的标配方案。毕竟,让模型把宝贵的注意力花在解决问题上,而不是纠结于用哪个工具——这才是正确的方向,也是下一代智能体架构的核心竞争力。

来源:https://www.163.com/dy/article/KU6CRUCO0511B8LM.html
上一篇智租换电冲刺港股,年利润816万,钱江摩托蜂巢新能源持股 下一篇四川眉山举办顶级无人机赛事 五千余名青少年空中博弈
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。