智语项目经历了一段完整的开发周期后,终于正式发布了。这是一款AI Agent个人助手,在架构上参考了OpenClaw的思路,但做了不少本土化的调整和扩展。核心功能涵盖了tools、skills、memory、hook、subagent以及MCP-server等Agent体系的关键模块。
简单来说,你可以把它当作一个能聊天的私人助理,也可以给它分配具体任务,比如让它去操作文件、搜索信息,或者完成一些自动化的工作流程。
安装流程
本地环境需要Nodejs版本不低于22。安装命令很简单:用管理员身份打开命令行(Windows用户注意这一点),然后执行:
npm i zhitalk -g
安装完成之后,通过版本检查确认一下是否成功:
zhitalk --version
如果之前已经装过,升级到最新版也很简单:
npm update zhitalk -g
初始化配置
安装成功后,运行 zhitalk 命令初始化项目。这个过程会做三件事:初始化SQLite数据库、下载内置的skills、生成配置文件。
网络环境比较通畅的情况下,系统会自动从GitHub下载所有内置的skills。这些skills覆盖了不少实际场景:canvas-design可以设计海报,docx/png/pptx/xlsx分别对应Office文档的操作,frontend-design负责网页设计,webapp-testing可以做网页测试,还有skill-creator允许你自己创建自定义skill,以及find-skills能通过关键字搜索第三方开发的skills。
如果网络环境不太好,访问GitHub比较慢,初始化过程会跳过这些skills的下载,并给出手动安装的提示。不影响基本功能的使用,后续可以单独补充。
配置大模型 API
初始化完成后,系统会提示修改配置文件,填入API密钥。核心需要编辑的是 zhitalk.json 这个文件。
至少需要配置两项内容:
- model:大模型的名称、API key和baseURL。下面是用kimi的示例配置,其他模型格式类似。
- TA VILY_API_KEY:ta vily search API的密钥,用于Agent联网搜索。
{
"model": {
"model": "kimi-k2.6",
"apiKey": "sk-xxx",
"baseURL": "https://api.moonshot.cn/v1"
},
"env": {
"TA VILY_API_KEY": "tvly-dev-xxx"
}
}
除了kimi,智语也支持Deepseek、MiniMax、GLM、QWEN、小米等多家大模型,只要是符合OpenAI接口格式的都可以接入。
比如通义千问的配置方式:
{
"model": {
"model": "qwen-plus",
"apiKey": "sk-ws-xxx",
"baseURL": "https://dashscope.aliyuncs.com/compatible-mode/v1"
}
}
配置修改完成后,再次执行 zhitalk 就可以开始对话了。如果后续需要调整配置,通过 zhitalk config 命令可以快速定位配置文件的位置。
Agent 架构设计
智语的定位是AI Agent,而不是简单的AI Chat。这不仅仅是语义上的区别,而是功能维度的根本差异。Agent体系中几个关键模块各自承担着不同的职责:
- tools:赋予Agent操作外部系统的能力,比如文件处理、网络搜索、执行命令。
- skills:为Agent扩展专业知识库,可以自建,也可以安装第三方skills。
- Memory:包括短期记忆、长期记忆和用户个人信息管理,让Agent具备上下文连续性。
- Context:上下文管理机制,当LLM的Context window超出限制时会自动压缩。
- Permission:对tools的权限控制,防止危险操作,保障系统安全。
- Subagent:启动独立的子Agent执行任务,上下文环境完全隔离。
- Hook:自定义配置校验规则,属于harness工程范畴。
实战:自动发布微信公众号
这个项目不是demo,也不是玩具。从设计之初就朝着真实可用的方向去的,日常我自己也在用它。下面用自动发布微信公众号文章来演示实际效果。
先安装baoyu-skills:
npx skills add jimliu/baoyu-skills
然后新建配置文件 ~/.baoyu-skills/.env,填入微信开发者平台的AppID和AppSecret,以及阿里百炼平台的API key(用于AI生成图片):
WECHAT_APP_ID=xxx
WECHAT_APP_SECRET=xxx
DASHSCOPE_API_KEY=xxx
接着启动zhitalk,输入prompt:
我想写一篇文章发布到微信公众号,主题是“AI Agent 未来将改变哪些行业”,2000字左右。找出 4-5 个行业,并要给出充分的理由。文章内插入2-3个相关图片,图文并茂,易读。你来生成封面图片。文章样式主题要现代化,不俗套。作者:双越
zhitalk会依次执行:撰写文章、生成配图、发布到公众号。整个过程完全自动化。最终在公众号草稿箱里可以看到完整的文章,图文排版都在预期之内,内容质量也相当不错。
最后
智语Zhitalk是一个完整的AI Agent助手,从安装配置到实际使用都经过了反复打磨。如果你对AI Agent的实现细节有兴趣,不妨下载下来亲自体验一下。
