DeepSeek API自定义停止词设置指南:巧用stop参数
要使用 API 请求体中的 stop 参数来配置停止词,从而实现文本生成的终止。该参数支持字符串数组形式,要求每个字符串的长度在 1 到 16 个字符之间,不能包含控制符,且必须完全匹配。最终,需要验证返回的 finish_reason 字段为 “stop”。

如果您在调用 DeepSeek API 时,希望模型在生成文本过程中遇到特定字符串就立刻停止输出,那么就需要通过请求体中的 stop 参数进行配置。以下是实现该功能的具体步骤:
一、确认 API 版本与模型兼容性
DeepSeek-VL 和 DeepSeek-Coder 系列模型均支持 stop 参数,但 DeepSeek-MoE 等稀疏架构模型可能会限制该字段的使用。您需要查阅所用模型的最新文档,以确认是否启用了停止词功能。
1、访问 DeepSeek 最新的 API 文档页面,定位到 “Request Parameters” 章节。
2、查找 stop 字段的说明,核对支持的模型列表及最大停止词数量(通常为 4 个)。
3、确认当前调用的 model 名称与文档中标注的支持状态一致。
二、构造包含 stop 数组的 JSON 请求体
stop 参数必须为字符串数组,每个元素是长度不小于 1、不大于 16 个 Unicode 字符的非空字符串,且不能包含控制字符或换行符。
1、在请求体 JSON 中添加 "stop" 键,其值为方括号包裹的字符串列表。
2、将目标停止词逐个写入数组。例如,若需要在遇到 “答:” 或 “###” 时截断,应写作 ["答:", "###"]。
3、确保整个 JSON 结构语法合法,逗号后无多余空格,引号为英文双引号。
三、处理多字节与标点敏感场景
中文标点、全角符号及 emoji 均被视为独立 token。若停止词包含此类字符,必须严格匹配原始编码形态,否则无法触发截断。
1、使用 Python 的 json.dumps() 序列化请求体,设置 ensure_ascii=False 以保留中文字符原貌。
2、对停止词执行 .strip() 操作,移除首尾不可见空白符(如 U+200B 零宽空格)。
3、若需匹配句号结尾,应同时提供 “。” 和 “.” 两个版本,因为模型分词器可能将其切分为不同 token。
四、验证停止行为是否生效
服务端仅在生成 token 流中检测到完全相同的字符串序列时才会终止,不会进行子串匹配或模糊匹配。
1、发起一次测试请求,将 stop 设为 ["
"],观察返回文本是否在首个连续两个换行处结束。
2、检查响应中 choices[0].finish_reason 字段值是否为 "stop",而非 "length" 或 "null"。
3、对比未设 stop 时的输出长度与设值后的输出,确认截断位置精确对应数组中任一字符串的末尾字符。
五、规避常见配置错误
非法的 stop 值将导致 API 返回 HTTP 400 错误,错误信息中 message 字段会明确提示具体违规项。
1、删除数组中重复出现的字符串,如 ["。", "。"] 会被拒绝。
2、避免使用空字符串 "" 或仅含空格的字符串,如 " "(全角空格)。
3、当需停止于数字序号后,应写为 ["1.", "2.", "3."],而非正则表达式形式 "d+."——API 不支持正则语法。
热门专题
热门推荐
MiniCPM-o 4 5是什么 在探索更自然、更智能的人机交互道路上,我们始终在期待一个“全能型选手”的到来。如今,这个角色或许已经登场。面壁智能最新开源的MiniCPM-o 4 5,一个仅拥有90亿参数的全模态大模型,正致力于重新划定“智能对话”的边界。 它彻底颠覆了传统一问一答的“对讲机”式交
Binance币安 欧易OKX ️ Huobi火币️ 想在2025年安全获取欧易OKX的正版APP?其实秘诀就一个:认准官方网站,避开所有仿冒和可疑的下载渠道。要知道,欧易现已统一更名为欧易OKX,其核心业务始终围绕数字资产交易及相关服务展开。 确认官方网站地址 第一步,打开浏览器,手动输入欧易OK
SecondMe Book是什么 在AI社交这一前沿赛道,一款国产平台正带来独特的解决方案。SecondMe Book,本质上是一个能够让你构建个人AI数字分身的创新平台。它允许用户创建一个能够代表真实自我风格与思维的AI数字身份,并让这个“第二自我”在一个专属的AI社交网络中自主运行——包括主动发
在AI大模型技术快速发展的今天,如何在卓越性能与高效推理成本之间取得最佳平衡,已成为行业关注的核心焦点。近期,由阶跃星辰推出的开源模型Step 3 5 Flash引发了广泛热议。该模型专为智能体(AI Agent)应用场景深度优化,旨在顶尖能力与亲民部署成本之间,构建一个极具竞争力的技术支点。 简而
LongCat-Flash-Lite是什么 在探索大语言模型性能与效率的最佳平衡点时,美团近期推出的LongCat-Flash-Lite提供了一个极具创新性的解决方案。作为新一代高效大语言模型,它凭借其突破性的架构设计,在人工智能领域获得了广泛关注。 简而言之,该模型创新性地融合了“混合专家系统(M





