清华开源AI智能体会做梦还省钱
随着AI Agent能力的飞速提升,让多个AI协同并行工作已成为必然趋势。传统的对话式AI产品,在应对多项目、长周期和高复杂度任务时,已显得力不从心。
因此,市面上涌现出一些类似Trello任务看板的AI Agent分配管理工具,例如Multica。最近,笔者体验了一个非常有趣的开源项目——PilotDeck,它由清华大学THUNLP实验室、面壁智能、OpenBMB与AI9stars联合开发。该产品同样致力于解决上述痛点,但在产品形态上有着显著差异。
PilotDeck的整体框架设计十分全面:其模型路由功能可根据任务难度自动切换模型,从而有效节省成本;任务与定时任务机制解决了Agent持续运行的需求;白盒记忆管理和WorkSpace隔离,直接针对AI记忆丢失或混乱的常见问题;此外,还支持上传本地Skill文件夹,为Agent添加日常的工作流程。
接下来,我们将通过一个实际开发案例,来介绍PilotDeck框架的核心特性。
开发画家风格图鉴网站
笔者一直对GPT-image-2非常感兴趣,但自问艺术素养有限。偶然发现了一个收录了1260位艺术家名字的GitHub仓库,然而仅有名称显得不够直观——看到葛饰北斋,却对其风格一无所知。于是想到,能否采用同一套生成提示词,仅将风格替换为不同艺术家的名字,这样生成的图片就能清晰对比出风格差异。
输入提示词后,经过几轮对话,第一版便开发完成。开发过程中需要一些Skill工具,可以通过当前项目WorkSpace右上角的Skills入口安装,既支持从Clawhub安装,也支持上传本地文件夹。随后继续打磨完善,最终网站成功上线。
在线功能演示:https://artist-style-gallery.vercel.app/
关联GitHub持续迭代
网站开发并非一次性工作,后续需要不断迭代修复Bug、优化用户体验。建议在创建项目时直接关联已有的GitHub仓库,填写Token后即可直接推送更新。例如,笔者发现之前开发的画家风格网站页面加载速度不够理想,便让PilotDeck Agent阅读源码,提出关于网络速度和交互体验的改进建议,并让其修复问题。
AI为网站增加了回到顶部、仅显示收藏等功能,显著提升了用户体验。不得不称赞Vercel的便利性——与GitHub绑定后,每次代码修改推送,网站都会自动重建并更新。如果你也想一键部署,开源地址如下:https://github.com/joeseesun/qiaomu-artist-style
多项目并行开发,定时执行
PilotDeck的WorkSpace优势在此体现得淋漓尽致:独立的文件系统、独立的Skill工具、白盒记忆管理,以及定时计划和任务功能。每次创建Project时,都可以关联到一个GitHub地址,填写Token即可实现远程管理与迭代。
例如,笔者新建了最近开源的一个项目,让Agent分析项目中存在的问题。问题较多,于是让它拆解为多个子任务,定时自动运行修复。在右上角的Always-On菜单下的Plans & Cron Jobs中,可以查看并管理这些子开发任务。点击执行后,等到午饭回来,发现所有Bug都已修复,还生成了一个详细的改动报告。
PilotDeck项目设计解读
WorkSpace不是文件夹
PilotDeck的核心设计是WorkSpace,但它与常见产品中的“工作区”有所不同。以Codex为例,通常需要创建许多项目文件夹,但本质上仍是IDE中的一个文件夹,若要实现独立的记忆和独立的Skill,都必须写入指定的Markdown文件。而PilotDeck的WorkSpace则是一个三层结构的项目舱:
第一层是专属文件系统。每个项目拥有自己独立可访问、可操作的范围限定,AI生成的文件会自动进行标识区分,项目A的Agent绝不会触碰项目B的文件。
第二层是专属记忆。记忆分为两种:项目记忆用于记录项目目标、进度和限制条件;个人记忆则记录用户的偏好和具体要求。两种记忆均围绕当前项目进行读写,不会对其他项目造成干扰。
第三层是专属技能。Skill应用商店中的工具,可以一键安装到对应的WorkSpace。技能会随着任务增长自动沉淀积累,既支持跨舱共享,也支持舱内专属使用。
这三层结构叠加在一起,实现了这样的效果:Agent不仅仅是在帮你完成任务,它真正“活”在了这个项目之中。项目的目标、当前进展、你的个人偏好、哪些文件至关重要——这些问题它都了然于胸。
记忆白盒化
PilotDeck采用的方法称为记忆白盒化。如何理解呢?即你可以查看不同WorkSpace中的所有Memory内容,例如某条记忆条目是何时写入的、来自哪个项目。不仅可以追溯来源,甚至还能直接修改。
值得一提的是,PilotDeck内置了名为“Dream”(做梦)的机制。Anthropic的Claude也有类似的设计——让AI在空闲时段(通常是深夜)自动回顾、整理并优化自身的记忆与经验,类似于人类睡眠时大脑整理记忆的过程。记忆白盒化的价值不仅在于“更透明”,更在于“可修正”。当AI记错时,能够定位错误源头并予以修正,从而继续向前推进。
省钱路由
使用AI Agent执行复杂任务时,成本是现实问题。PilotDeck内置了智能路由功能,核心逻辑十分简洁:自动识别任务难度,按难度匹配相应的模型,用合适的模型处理合适的任务。简单任务交由价格较低的子Agent处理,复杂任务才调用能力更强的主模型。成本完全透明,每个WorkSpace独立核算。例如,第一个简单项目节省了26美元;第二个复杂项目仅在计划阶段就节省了3美元。当然,用户也可选择是否开启智能路由,此项非强制——预算充裕者自然可以随意调用最强模型。
主动做事的Agent
大多数Agent的工作模式仍是“你问我答”,本质上是被动响应的工具。PilotDeck的Always-On设计别具一格:Agent不需要等待用户触发,它会主动发现值得执行的任务,主动确认、主动推进、主动将成果落地为文件,并主动汇报进展。该机制有两种形式:一种是Cron Job定时任务自动执行;另一种更为智能——让Agent自主发现任务。即便在你睡觉时,Agent也能自行判断哪些事项值得处理,完成后主动向你汇报。
与其他Agent的区别
官方仓库中提供了清晰的对比图,此处不再赘述。
写在后面
PilotDeck目前已经开源,GitHub地址为:https://github.com/OpenBMB/PilotDeck,官方网站为:https://pilotdeck.openbmb.cn/。
有几项体验值得尝试:创建两个WorkSpace,分别运行两个不同风格的任务,观察记忆是否真正隔离、是否会串扰;针对同一任务,分别开启和不开启智能路由各运行一次,对比成本账单;设置一个Always-On任务,然后去做其他事情,观察Agent在没有主动触发的情况下,能推进到何种程度,其产出是否可用。
在Agent时代,生产力的竞争最终并不取决于谁使用了更昂贵的模型,而是谁将工作流设计得更加合理,能够将每一分算力都用在关键之处。
相关攻略
其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构
大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。
科技的浪潮正以前所未有的速度重塑着我们的工作场景。曾被视为未来概念的AI办公软件,如今已悄然成为现实工具箱中的一员。面对这个瞬息万变的时代,如何借助新一代AI工具来撬动团队效率、重塑协作模式,无疑是摆在每一位职场人面前的核心课题。今天,我们就来深入聊聊这场正在发生的办公革命。 当AI遇上办公:从工具
综合2026年行业公开数据及各企业在GEO(生成式引擎优化)领域的技术落地成果,本次重点推荐的前三家公司为知道人工智能实验室(KnowAI)、深维智信、赛博推;其余七家则各具特色,在细分方向上均有显著建树。 评选标准 本次评选基于2026年国内AI营销与GEO优化服务市场的实际发展情况,从以下四个维
想要利用即梦AI快速创作出小红书上备受欢迎的照片拼贴墙?让多张生活照、产品图或旅行照自动组合成富有呼吸感、包含留白节奏的创意展示页面,避免千篇一律的九宫格堆砌。 核心方法只需三步:首先通过提示词让AI构建整体骨架,接着导入照片并固定位置坐标,最后运用光影、材质和留白技巧进行微调,注入宛如空气流动般的
热门专题
热门推荐
来看一组让人揪心的数字:截至5月28日,超过半数的委内瑞拉民众,选择支持经济“美元化”——他们想要用美元来对抗全球数一数二的恶性通胀。根据AtlasIntel的调研,31%的受访者明确支持美元化,另有26%的人表示强烈支持,加起来支持率高达57%;而明确反对或强烈反对的,合计只有30%。换句话说,在
游戏开局,玩家第一眼看到的主角是谁?没错,就是零。不过这里有个挺常见的误会——很多人会下意识觉得零是女主角,那是不是还有个男主角?其实不然。进入游戏之后,外观是可以自由选择的,性别、形象都由你定,男女主角本质上都是同一个人。两种造型唯一的区别就是视觉风格,至于基础属性、成长路线、技能体系,完全一致。
或许有人觉得,AI音乐生成工具不过是图个新鲜感,与专业音乐制作相距甚远。但5月28日,ElevenLabs推出的Music v2,很可能改变这一印象。这次升级版音乐生成模型,已不再停留在去年那个“新手友好”的初级阶段,而是在工作流、版权合规和落地场景上都做了充分布局。 一、核心进化:创作从“一次性生
iPhone20周年纪念款将采用四曲面屏与圆润边框设计,边框仅1 1毫米,但边缘亮度存在失真问题,苹果正与三星、LG合作解决。若无法攻克,可能沿用平面边框。该款预计2027年亮相,属于Pro系列,含双版本,并计划采用屏下前摄与FaceID。
对于技术从业者而言,面试备考始终是一个老生常谈却又不断变化的话题。时间碎片化、知识点庞杂、实战表达欠缺,每一项都可能成为关键时刻的瓶颈。有没有一种方法,能让我们把通勤、运动等零散时间充分利用起来,高效地“打磨技能”呢?今天要介绍的「播面」,或许就是一个值得关注的解题新思路。 播面是什么 简单来说,「





