引言
先下一个判断:如果你还受得了 Agent 那套“问一句、调一次工具、等半天结果”的龟速循环,那这篇可能跟你关系不大。但如果你已经受够了这种低效,那么今天要聊的这个项目——白龙马(BaiLongma),或许会让你对 Agent 的能力上限有一个全新的认识。

它不是一个简单的聊天机器人。它的核心思想,说白了就是:别再让模型像个木头人一样等着你发指令了。白龙马受自动驾驶和数字意识理论启发,提出了一套名为 ACI(Anticipatory Context Injection,预判注入)的理念,试图给 LLM 装上“主动意识”。听起来有点玄乎,但底层逻辑其实很硬核——一个由 TICK 驱动的、具备主动性的 Agent 框架。
你将学到什么
- 什么是 ACI(预判注入)?它凭什么能解决 Agent 的延迟叠加问题?
- 核心架构:TICK 驱动的主循环与“意识流”到底怎么跑?
- 焦点栈(Focus Stack):Agent 如何像人类一样管理注意力,随时切入切出?
- 快速上手:从安装到把 Agent 接入你的微信 / Discord / 飞书。
项目背景:为什么需要“白龙马”?
传统的 LLM Agent,打个比方,就像一个被动的接线员:电话不来,它就发呆。获取信息的时候,需要模型先思考、再调工具、等着返回、然后再思考。这一套串行流程走下来,延迟是成倍叠加的,资源利用率也低得可怜。
白龙马的设计哲学是:系统没必要等着模型开口去问。既然已经知道一些信息——历史习惯、当前时间、任务模式——那为什么不提前预判模型需要什么,直接塞进它的 System Prompt 里?这样模型一“睁眼”,东西已经摆好,直接进入逻辑处理阶段。这才是真正的效率革命。
核心技术特色
1. ACI(预判注入)—— 从“猎人”到“厨师”
这是白龙马的灵魂。它通过语义记忆预判和上下文充分性检查,直接把 LLM 从一个需要主动搜寻信息的“猎人”,变成了一个直接处理现成信息的“厨师”。
- 预判:不等模型问,先推断你的意图。
- 并行执行:在 LLM 推理的同时,后台已经查好了相关的 SQLite 记忆或文件内容。
- 直接注入:信息已经在 System Prompt 里等着模型,大幅降低交互成本。
2. TICK 驱动的数字意识主循环
白龙马后台有一个持续运行的 TICK,你可以把它理解成系统的心跳。
- 消息抢占:就像操作系统的进程调度一样,高优先级消息(比如用户新输入的内容)可以随时打断当前的后台思考。
- 空闲自主思考:没人说话的时候,它会根据记忆和焦点任务进行“白日梦”般的自主探索,而不是傻等着。
- 看门狗机制:防止 LLM 陷入无限递归或卡死,确保系统不会崩溃。
3. 焦点栈(Focus Stack)记忆管理
Agent 经常“走神”怎么办?白龙马模拟了人类的注意力机制:
- 接收到新主题时,
push一个新帧。 - 完成任务后,
pop掉当前帧,同时把结论压缩回旧帧。 - 这种机制让它在处理长达数天的复杂任务时,依然记得“我们刚才聊到哪了”。
4. 全能的社交平台分发
白龙马原生支持通过 Brain UI 扫码连接个人微信(无需第三方中转)、公众号、Discord、飞书、企业微信。你可以直接在这些平台上像跟朋友聊天一样指挥你的 Agent,门槛极低。
快速开始使用指南
1. 安装要求
- Node.js: 18.0+
- SQLite: 项目内置,无需额外配置
- 操作系统: Windows / Mac / Linux(建议开启 Python 环境以支持本地语音 ASR)
2. 部署步骤
# 克隆仓库
git clone https://github.com/xiaoyuanda666-ship-it/BaiLongma.git
cd BaiLongma
# 安装依赖
pnpm install
# 启动程序
pnpm dev
3. 配置与启动
- 激活页面:初次启动后,访问浏览器弹出的桌面窗口(或直接访问
https://localhost:3000)。 - API 探测:点击“Auto Detect”,白龙马会自动探测你环境变量中或粘贴的 Key 属于哪个 Provider(支持 DeepSeek、MiniMax、OpenAI 等)。
- 连接社交平台:在 Brain UI 的设置页,点击“Connect WeChat”,扫码即可将 Agent 接入你的微信。
总结
白龙马不是改改 Agent 的外表,而是重构了 Agent 的内核。它通过 ACI 理念把 AI 的交互效率拉到了一个新的量级。如果你想要一个真正像“人”一样有主观能动性、能管理长期注意力、还能无缝融入日常办公软件的 Agent,那么白龙马,可能是目前开源界最激进也最成熟的尝试。
