智能体成本高企 ANOLISA助你精准追踪每一笔Token消耗_AI热点日报

智能体成本高企 ANOLISA助你精准追踪每一笔Token消耗

类型：热点整理2026-05-27

ANOLISA的AgentSight组件提供可视化面板，能实时监控Agent运行状态并逐笔追踪Token消耗明细。它通过会话级和对话级分析，帮助用户精准定位成本异常与浪费环节，例如无效的历史记录重复读取，从而实现有针对性的成本优化。

还在为Agent的Token消耗感到困惑吗？每月面对高昂的账单却无从分析，是许多运维开发者面临的共同挑战。现在，有了ANOLISA的AgentSight组件，这一切将变得清晰透明。它如同为Agent的财务装上了“高清透视镜”，能够逐笔解析Token开销明细，让成本管控与优化从此有据可查、有的放矢。

Agent 烧钱如流水？Agentic OS (ANOLISA) 帮你逐笔看清 Token 账单

自阿里云推出业界首个面向智能体的操作系统——Agentic OS（ANOLISA）以来，如何极致降低Token消耗便成为核心议题。这背后关联着一系列具体问题：惊人的账单数字究竟由哪个Agent产生？消耗集中在任务执行的哪个阶段？是否存在大量可避免的无效开销？

优化Token成本的前提，是必须首先看清它们的流向。过去，Token消耗如同一个黑箱，用户只能在月底获知一个总额，对明细构成一无所知。这就像收到一张仅显示“总计”的信用卡账单，即便想节省，也无从判断该从何处着手。

近期，Agentic OS（ANOLISA）发布的多项新功能中，AgentSight组件表现尤为突出。它提供了一个强大的可视化监控面板，不仅能全局掌握Agent运行状态，更能深入追踪每一笔Token的详细消耗路径。

简而言之，AgentSight是ANOLISA专为可观测性设计的核心组件，旨在解决Agent运行时Token消耗失控、难以感知和追溯的痛点。其强大之处在于，无需侵入业务代码，即可实现对Agent全链路运行的细粒度数据采集与智能关联分析。

一屏尽览：告别盲猜，实时掌控Agent健康与成本

让Agent 7×24小时处理工单、执行巡检任务时，运维人员不可能同样不眠不休地紧盯。这种“不可见”的状态，构成了Agent运维管理的基础矛盾。

你是否经历过这些场景？Agent在后台悄然卡死，直到下次登录才发现；关键任务意外中断，却未触发任何告警；Token在不知不觉中消耗数十万，月底账单才揭示成本已失控。看不见，就意味着无法有效管理。

AgentSight的可视化面板，正是为了将“不可见”转化为“一屏尽览”。打开面板，所有在ANOLISA上运行的Agent状态一目了然：在线、离线或处于卡死状态。数据实时刷新，从全局概览到单个对话的详细链路，层级清晰，呈现直观。

（图/AgentSight组件可视化面板）

当Agent离线或卡死时，AgentSight不仅会及时告警，更支持一键重启功能，助力Agent快速恢复服务——从发现问题到解决问题，极大减少了人工干预的时间和成本。Agent的每一次“心跳”，你都能实时感知。出现问题，再也无需等到次日才后知后觉。

Token逐笔溯源：消耗多少、流向何处、因何产生

管理学经典原则指出：“无法度量，就无法优化。”Token消耗的管理同样遵循这一法则。

一个令人警醒的案例——查询天气

让我们审视一个看似简单的任务——查询天气。

用户提问：“杭州今天的天气”。这仅是一个单轮查询，预期的Token消耗理应很低：用户输入约20个Token，系统提示词在数百Token量级，加上一次工具调用和响应，总计可能仅数千Token。

但实际消耗是多少？高达14万Token。在传统的黑箱模式下，你只知总数惊人，却无法分辨哪些属于无效消耗，更谈不上针对性优化。

通过AgentSight的可视化面板，我们可以清晰观测Token消耗数据。下图展示了一个典型分析案例。需要说明的是，根据所选大模型的不同，具体花费可能存在差异，但通常输入Token数会远大于输出Token数。通过深入分析，我们发现绝大部分算力竟浪费在重复读取旧的历史对话记录上。

（图/AgentSight的可视化面板观察到的Token消耗数据）

为何会产生如此巨大的消耗？

借助AgentSight的事件详情界面，真相水落石出。从下图中可见，当用户询问“杭州今日天气”后，Agent实际上发起了两次大模型调用，每次调用的Token用量与耗时都清晰可查。关键在于，每增加一次工具调用，完整的历史消息就被“重新回放”一次，导致Token成本呈线性甚至指数级增长。图中显示，两次调用分别触发了天气技能（skill）查询并根据技能结果获取具体天气，输入Token数因此如滚雪球般累积。

（图/调用过程）

（图/Agent输出结果）

AgentSight组件将Token消耗从两个核心维度进行拆解分析：会话级和对话级。通过这种精细的粒度，用户可以精准定位问题根源：是某个Agent整体消耗过高，还是某次单对话使用异常，亦或是某个Skill在反复调用中产生了冗余浪费。

会话级分析：展示每个Agent在单次会话中的总Token消耗，通过图表直观呈现全局分布。你能迅速定位“最烧钱”的Agent，或发现某次异常会话的消耗远超常态水平。
对话级追踪：深入到单条对话链路中，追踪Token的变化趋势与构成。是System Prompt占用了大头，还是History上下文窗口过度膨胀，又或是某个Skill调用的输入特别冗长？每一笔开销都有明确的去向和原因。

（图/会话级与对话级示例图）

此外，你还可以按时间段、按Agent维度进行多维度趋势对比。上周花了多少，这周花了多少，哪一天出现了异常波动——所有的消耗模式都变得清清楚楚。

（图/通过时间、Agent、模型等多维度查询示例图）

看清了“花了多少”和“花在哪”之后，自然要追问“为什么花在这里”。据悉，AgentSight组件后续还将提供强大的轨迹分析能力——从任务接收、工具调用、决策分支到最终输出，进行全链路行为回放。你可以清晰看到Agent在什么节点调用了什么Skill、选择了哪条分支、在哪个环节“吞噬”了最多的上下文窗口。定位到冗余路径后，就能有针对性地优化Agent的行为逻辑与技能设计，省下的每一分Token都是实打实的成本节约。

至此，Token从一个月底的模糊“总额”，变成了一本随时可查、可追溯、可深度优化的“透明明细账”。

Agentic OS（ANOLISA）新功能全景速览

除了核心的AgentSight，4月15日发布的Agentic OS v0.2版本还带来了多项核心组件的重要更新：

性能显著提升：小规格实例（2C2G）初始可用内存提升20%~30%，OpenClaw并发会话数量提升200%以上，Agent冷启动时间大幅降低。
认证体验升级：Copilot Shell认证界面全面焕新，内置多种主流模型提供商快捷配置，Aliyun认证支持RAM角色一键授权，简化流程。
可观测性增强：AgentSight新增可视化监控面板，提供Agent实时健康监控、离线告警、卡死进程一键重启能力，支持会话、对话级的Token消耗深度分析与Agent全链路轨迹分析。
安全性加固：AgentSecCore支持Skill完整性自动化校验（签名校验），保障组件安全。
内置诊断能力：OS Skills内置“sysom-diagnosis”技能，提供完整的系统诊断能力。
成本优化工具：新增Tokenless优化工具包，通过模式压缩、响应压缩及命令重写三大核心策略，有效降低上下文窗口的Token消耗并提升运行效率。

实战指南：使用AgentSight，查看你的第一份Token明细账

有两种主要方式可以体验AgentSight的强大功能：在阿里云上直接安装使用，或在本地部署开源版本。

方式一、在阿里云ECS上安装并使用AgentSight

第一步：创建ECS实例

前往阿里云ECS实例创建页面。为获得最佳体验，建议选择内存大于2 GiB的实例规格。在系统镜像选择中，请务必选择“Alibaba Cloud Linux 4 LTS 64位 Agentic 版”。同时，记得勾选绑定公网IP（EIP或分配公网带宽）。其余参数可按实际需求配置或使用默认值。

第二步：首次登录与配置

登录实例后，系统将自动进入Copilot Shell环境。首次使用时需完成模型授权配置。推荐使用Aliyun Authentication方式，以获得快速、免繁琐配置的体验。不同授权方式的区别与详细使用方法，请参阅相关管理配置文档。

第三步：通过多种途径查看Token消耗

配置完成后，你可以通过以下三种灵活方式查看和分析Token消耗：

1. 自然语言对话交互
在Copilot Shell中，直接使用自然语言与系统交互。例如： - 查看Token消耗：输入“今天Token用了多少？” - 查询审计日志：输入“帮我查一下今天的LLM调用记录”

2. CLI命令行工具
使用专用的命令行工具进行高效查询： - agentsight token：查询Token用量汇总与明细数据。 - agentsight audit：查询审计事件（如LLM调用、进程操作记录）。 - agentsight discover：扫描发现当前系统上运行的所有AI Agent。

3. Web可视化面板
启动内嵌的Web可视化面板服务（默认相关服务已运行，或可通过特定命令启动）。通过浏览器访问服务器公网IP的7396端口，即可打开功能丰富的Dashboard。在这里，你可以： - 查看Token消耗总览与多维度趋势图表。 - 监控所有Agent的实时状态（在线/离线/健康度），并对卡死进程进行一键重启。 - 进行会话中断诊断，快速定位LLM错误或进程崩溃的根本原因。 - 深入查看每个Session和Trace的详细Token使用构成。 - 分析模型提示词与思考过程，定位主要消耗环节。 - 查看Token节省成果报告，并直观对比优化前后的内容差异。

方式二、本地部署ANOLISA并查看Token消耗

ANOLISA已在GitHub上开源，你可以从源码构建并运行各个组件。

第一步：安装系统依赖

需要安装Node.js（版本>=20）、Rust（版本>=1.91.0）以及AgentSight所需的系统依赖（如clang、libbpf等）。请根据你的操作系统（如Alinux、Ubuntu等）执行相应的安装命令，并确保Linux内核版本>=5.10且已启用BTF支持。

第二步：构建Copilot Shell组件

进入项目目录，使用make命令完成依赖安装和组件构建。构建完成后，可以直接运行或将其安装到系统PATH中以方便全局调用。

第三步：构建AgentSight组件

同样进入对应目录，使用make进行构建。安装成功后，即可使用agentsight系列命令来启动追踪、查询用量和审计事件。

第四步：查看Token消耗

此步骤的查看方式与上述“方式一”中的三种方法完全一致，你可以通过自然语言对话、CLI命令或Web可视化面板，全方位洞察你的Token明细账本。

来源：https://www.53ai.com/news/LargeLanguageModel/2026051190617.html

ai 人工智能

延伸阅读

补充最近整理过的热点入口。