如何写出可执行的数据分析提示词
先分享一个实战案例。许多团队在使用LiblibAI撰写数据分析提示词时,反馈最多的问题是:结果颗粒度太粗。它不像那种能直接用来安排人员、排定日程的待办清单,反而更像一份“报告框架”——告诉你该分析什么、用什么方法、借助哪些工具,可仔细一看,没有一条是能真正点击执行的。

问题根源在哪?核心就一句话:提示词里缺少对分析动作的物理可操作性、数据来源路径、输出格式以及验证手段的硬性约束。
具体怎么解决?往下看。
用五字段锁死分析任务粒度
编写提示词时,开头必须明确声明:需包含五个字段——分析目标、数据源路径、处理动作、输出格式、验证方式。这五个字段就是锚点,不加的话,AI会默认按照报告大纲的逻辑生成内容,根本无法形成可执行的清单。
接下来是重点:对“处理动作”追加限制。所有动作必须能被单人两小时内完成,禁止使用“梳理”“研究”“分析趋势”这类听起来高大上、实则无法量化时间的动词。只允许采用这样的写法:“导出2024Q1销售明细表(CSV)”“用Power Query合并3张Sheet”“在DAX中新建[复购率]度量值”。
注意:如果动作里不包含工具名、文件名和操作动词,AI就会输出一堆纯文字的步骤描述,而不是能直接拖入BI工具执行的指令。
第三步,也是很多人容易忽略的:给出一个与当前业务完全一致的样例。比如你正在做电商复购分析,那就写:“分析目标:识别高流失风险用户;数据源路径:/data/ods/user_beha vior_202406.csv;处理动作:用Python pandas筛选近30天无下单行为且历史订单≥5笔的用户ID;输出格式:Excel表格,含UserID、LastOrderDate、TotalOrders三列;验证方式:人工抽检前10条,确认LastOrderDate均早于2024-05-12。”
样例里必须包含真实路径、真实字段名和真实日期,否则AI只会把它们当成占位符来填充。
用角色+资源倒逼可派发性
两种方法都非常有效。
方法一:让AI扮演数据执行工程师,而不是分析师。提示词开头就写:“你现在是本项目的数据执行工程师,手头只有本地安装的Power BI Desktop V2.14和已授权访问/data目录的权限,无Python环境,无数据库DDL权限。请拆解出今天必须完成的全部可立即执行的数据处理任务。”
这样一来,AI的思维模式就会切换到“能干什么”而非“建议怎么干”。
方法二:叠加交付验收权设定。“所有输出必须能被业务方在3分钟内确认是否合格——即每项任务必须明确写出输入文件的完整路径(如/data/raw/crm_export_20240610.xlsx)、输出文件保存位置(如/data/staging/churn_risk_list.xlsx)、检查方式(如‘打开Excel→筛选[Score]列>85的行数应为127’)。”
这相当于给每项任务安装了一个“验收开关”,业务方打开文件后发现数据不对,当场就能判定问题。
禁用抽象词,替换为带三要素的动作
在提示词末尾直接列出一串禁用词:提升、加强、完善、深化、推动、落实、构建、打造、夯实、加快、着力、持续。这串词不能缩写,不能换顺序,原样粘贴。
紧接着写替换规则:“把‘提升用户画像准确率’改为‘在Power BI中用DAX新增[AgeGroup]列,公式为SWITCH(TRUE(), [Age]<18,"Under18", [Age]<35,"18-34", "35+"),并用测试数据集验证100条记录输出无空值’。”
替换后的句子必须包含三个要素:工具名(Power BI)、函数名(SWITCH)、验证动作(100条记录验证)。缺一不可。
最后补一句:“所有任务不得跨日,起止时间精确到小时,例如‘2024-06-12 10:00至2024-06-12 12:00’。”
