近日,钉钉与飞书在开源社区相继发布了两个备受关注的新工具:钉钉的 dingtalk-workspace-cli 与飞书的 lark-cli。它们究竟是什么?
用一句话概括其核心:这两款工具本质上都是“让AI智能体操控办公软件的远程控制器”。
以往,若要让一个AI助手帮你发送飞书消息或查询钉钉日程,它要么需要费力地拼接API请求,要么得借助MCP等协议进行中转。如今,飞书和钉钉各自将旗下产品的核心功能,封装成了一套可直接调用的命令行(CLI)指令集。这意味着,AI智能体现在只需像人类一样“输入命令”即可完成任务。
具体而言,飞书 lark-cli 覆盖了日历、即时消息、云文档、多维表格、邮箱、视频会议等11个核心业务领域,提供了超过200条命令及19个专为AI智能体设计的Skills技能。安装极为简便,通过 npm install 即可完成,并采用宽松的MIT开源协议。
钉钉的 dws 则涵盖了日程、待办任务、企业通讯录、消息通知等核心模块,同样配备了专为智能体优化的Agent Skills,并提供一键Shell脚本安装方式。它是一个由Go语言编写的独立二进制文件,不过目前仍处于灰度共创阶段,如需使用需加入官方群组并申请白名单权限。
在技术实现上,两者均采用Go语言开发,都提供了结构化的JSON输出以便AI智能体解析,并贴心地支持 –dry-run 参数,允许用户预先模拟操作结果再实际执行。
架构设计上的“默契共识”
有趣的是,两家公司在架构设计上展现出高度一致的思路,均采用了三层结构:
第一层:Shortcuts(快捷命令)。 飞书使用“+”前缀(例如 +agenda 查看日程),钉钉也提供了类似的语义化命令。这一层设计兼顾人类与AI的易用性——参数精简、默认值智能、输出结果可读性强。
第二层:API Commands(平台命令)。 此层与开放平台的API接口一一对应,适用于需要精确控制与细致参数调整的场景。
第三层:Raw API(原始接口)。 可直接调用任意开放平台端点,覆盖全部API能力。飞书宣称其CLI可支持超过2500个接口调用。
这种分层设计本身便值得产品经理深入思考。它巧妙地解答了一个现实问题:同一款工具,如何既能满足人类用户快速上手的需求,又能适应AI智能体精准调用的要求?
答案正是分层。在日常多数场景中,无论是人类用户还是AI智能体,使用第一层命令就已足够高效且不易出错。当遇到复杂或特殊需求时,再向下深入调用第二层或第三层。这比试图用“一套API适配所有场景”的设计思路更为明智与实用。
核心差异:截然不同的开放策略
尽管架构相似,但两家在开放策略上却选择了不同的路径。
飞书采取了更为激进的开放姿态。 仅需一行 npm install 命令即可完成安装,项目README文档以英文优先、中文为辅,明显面向全球开发者生态,采用高度开放的MIT协议,并直接发布了v1.0.0的GitHub Release版本。这背后体现的是“先扩大生态规模,再考虑商业转化”的策略——目标是吸引尽可能多的AI智能体生态率先接入。
钉钉则显得更为审慎。 虽然代码也已开源,但实际使用需经过完整的灰度共创流程:加入官方钉钉群 → 提交企业应用的Client ID → 管理员审核 → 官方配置白名单。这一节奏清晰地体现了“企业级管控优先”的核心理念。
这种差异源于两家公司不同的产品基因。飞书(及其海外品牌Lark)自诞生起就更注重开发者生态的培育;而钉钉的核心基本盘是中国广大的企业客户,安全与合规是其生命线。两种策略并无绝对优劣,但对于希望快速尝鲜的个人开发者或小型团队而言,飞书的接入门槛显然更低。
此外值得一提的是,钉钉还做了一项飞书目前尚未提供的工作:官方推出了名为 OpenClaw(龙虾)的连接器插件,支持将钉钉机器人直接接入龙虾网关,并包含了AI Card流式响应等高级功能。这对于龙虾生态的用户而言,是一个切实的增量价值。
这对普通用户意味着什么?
首先需要明确的是:目前这两款工具主要面向的是“AI智能体开发者”,而非普通的飞书或钉钉终端用户。你不会在飞书或钉钉的客户端设置中找到“启用Agent CLI”的开关。
然而,它们释放出的信号至关重要——
办公软件正在从“人类直接操作”向“人类指挥、AI代为执行”演进。 过去是我们亲自打开应用撰写文档、查询日程。如今,办公平台开始主动将自身能力模块化、积木化,静待AI智能体来组合调用。
这印证了一个持续发展的趋势:AI智能体要真正发挥实用价值,仅凭一个聪明的大脑(大语言模型)是远远不够的,还必须拥有灵巧的“手”和“脚”(即工具调用能力)。飞书和钉钉当前所做的,正是在为AI智能体“安装手脚”。
而且,它们不约而同地选择了同一种“安装”方式:CLI + Skills。不是MCP协议,也不是复杂的自定义插件,而是最经典、最朴素的命令行界面。原因何在?因为命令行是所有AI编程类智能体(如Claude Code、Cursor、Antigravity等)最成熟、最自然的交互方式。这些智能体天生就“懂得”如何执行命令。
当主流办公平台开始主动“解构”自身能力,以适配AI调用范式时,一场变革的序幕已然拉开。对于终端用户,这意味着未来的办公体验将发生根本性变化;对于开发者,这或许正是那个期待已久的、“移动互联网”级别的生态信号。
项目地址:
钉钉CLI:https://github.com/DingTalk-Real-AI/dingtalk-workspace-cli
飞书CLI:https://github.com/larksuite/cli
