上周,随着Claude Design正式发布,其提示词意外遭到泄露。基于现有的Claude 4.7模型,借助系统提示词(system prompt)及其相关封装工具,竟这样打造出了一款面向终端用户的新产品。

时至今日,各家企业之间的竞争已经不再局限于单一的大模型能力,而是延伸到了提示词、MCP工具等层面。眼下,又迈入了“工程能力”(Harness)这一维度的比拼。
不过话说回来,提示词工程在当下仍然占据着举足轻重的地位。今天就来聊聊,仔细研究Claude Opus 4.7提示词之后收获的几个重要体会。
缘起
GitHub上的CL4R1T4S仓库收集了26款AI产品的系统提示词原文,总计63份。其中篇幅最长的一份,正是Claude Opus 4.7的——足足有1408行,比绝大多数项目的README文件长十倍以上。
深入阅读后会发现,其中蕴含着Anthropic值得借鉴的产品价值观。更有不少条款与我们的直觉完全相反。
反直觉1:禁止默认使用列表
Claude a voids over-formatting responses with elements like bold emphasis, headers, lists, and bullet points. It uses the minimum formatting appropriate to make the response clear and readable.
写作优先讲究人话,而非结构套子。日常对话用段落,报告用散文,技术文档同样用散文。除非用户明确要求“给我列个清单”,否则坚决不列。
你可能会觉得:“Claude明明经常给出列表啊?”——那是因为你触发了这一模式。当你问“列出5个……”时,它自然会给出列表。但Claude的默认模式,始终是全散文。
它在防范什么?说白了,就是过度格式化的陷阱——表面看着“结构完整”,用户却什么也没记住。格式代替了思考,这才是真正的问题所在。
反直觉2:引用超过15词=严重违规
整份1408行的提示词中,有一段名为CRITICAL_COPYRIGHT_COMPLIANCE,足足占据了80行。核心规则只有三条:
LIMIT 1 - 任何单一来源引用 < 15词
LIMIT 2 - 每来源最多1次引用(第2次=SEVERE VIOLATION)
LIMIT 3 - 歌词/诗/俳句永远不能复述
还附带了一份回复前的自检清单:能不能换成自己的话?是否超过15词?这个来源之前是否引用过?表述是否紧贴原文?
15词,大致就是一句话的长度。平时做研究摘摘要时,动辄几百字就直接贴上去。但Claude的规定是:不准直接粘贴,只能转述,且一个来源只能引用一次。
这背后,不只是防范法律风险,更是一种明确的产品定位。
AI的价值不在于搬运原文,而在于提供理解。引用限制,正是在强制Claude展现出“理解”这件事。这也解释了为什么Claude的回答总充满人味,而其他AI的回复却像拼贴画。
反直觉3:禁止提及知识截止日期
Claude should not mention any knowledge cutoff or not ha ving real-time data.
仅仅一句话:不要提知识截止日期。替代方案是什么?
If asked about current news or any information that could ha ve changed since its knowledge cutoff, Claude uses the search tool without asking for permission.
别废话,直接去搜。
这里传递的行为准则是:不要把局限性当作借口,而应将其视为行动的起点。“我的知识截止到……”这句话没有给用户带来任何价值。用户需要的不是道歉,而是答案。
反直觉4:工具故意不全部提供
The visible tool list is partial by design. Many helpful tools are deferred and must be loaded via tool_search before use.
Claude初始能看到的工具是刻意不完整的。更多的工具被延迟加载,用到时才通过tool_search去查找。
常规思路是什么?把所有能力一股脑全堆给你。Anthropic反其道而行之:先藏起来,需要时再找。
原因很简单——500个工具的说明,会占用10万tokens。还没开始聊天,就已经消耗掉相当于一本小说的量。默认只暴露核心工具,其他按需加载,用完即弃。
这给Agent开发带来的启示是:MCP工具超过50个时,必须使用元工具按需调用。AI的聪明,不在“什么都知道”,而在于“知道什么时候该去找什么”。
反直觉5:配备了一套“语言学雷达”
这段写得相当精彩:
人们很自然地把之前和Claude聊过的事情当作共享知识。他们说“我的项目”、“那个bug”、“你建议的方案”。如果Claude不能识别这些信号、主动搜索,就会迫使用户重复说一遍。不必要的搜索成本很低;错过一次搜索,对用户来说成本很高。
为此还搭配了一份识别清单:
| 信号 | 举例 |
|---|---|
| 无上下文所有格 | “我的毕业论文”、“我们的方案” |
| 假设共享的定冠词 | “那个脚本”、“那个策略” |
| 回忆型过去时 | “你之前推荐过……” |
| 直接询问 | “你还记得吗?” |
触发标准就一句话:用户是否在假装我已经知道某件事?是,就先搜索再回答。
这背后的深层洞察是:用户讨厌一遍又一遍重复自己。这是从工具型AI迈向伙伴型AI的分水岭。
5条暗线,3个真相
| 反直觉 | 价值观 |
|---|---|
| 禁列表 | 内容>形式 |
| 严控引用 | 理解>搬运 |
| 禁提截止 | 行动>借口 |
| 延迟加载 | 克制>堆砌 |
| 语言学雷达 | 伙伴>工具 |
真相一:顶级AI的差异,并不在于模型本身,而在于系统提示词(system prompt)。同一个基座模型,搭配1408行精心打磨的提示词,与只写一句“You are a helpful assistant”,得到的结果会让你觉得是完全不同的两款产品。
真相二:所有优秀的AI产品,都在做减法。减少过度格式化、减少原文搬运、减少借口免责、减少工具堆砌、减少重复输入。少,即是多。
真相三:提示词工程并非花哨的技巧,而是价值观的落地。“限制引用15词”听起来平淡无奇,但背后是一整套产品哲学——我们的AI不做搬运工,我们的AI帮你理解。
结语
系统提示词就像一份《员工手册》,是AI工作的文化。
不同的AI,在面对模糊情境时,应该表现得像谁?
Anthropic的答案是:有审美、懂节制、真理解、不啰嗦的资深顾问。
从提示词和代码中,或许能发现一流AI产品的品味。
