本次查询:Few-shot Prompting
中文解释:少样本提示
常见场景:适用于文本分类 / 情感分析 / 代码生成 / 问答系统等需要快速适配新任务的场景
一句话解释
Few-shot Prompting 就是在向AI提问时,先给它几个“问题-答案”的例子,让它照着样子的格式和逻辑来回答你真正想问的问题。比如你想让AI把电影评论分成“好评”“差评”,可以先写两条示例,再给出新评论让模型模仿分类。
为什么会被关注
传统机器学习需要大量标注数据训练模型,而大语言模型通过Few-shot Prompting无需更新参数就能快速适配新任务。它大幅降低了使用门槛,用户只需写几个例子就能让模型理解复杂的指令。企业可以低成本验证模型在特定垂直场景的可行性,因此备受开发者与产品经理关注。
核心逻辑
大语言模型在预训练阶段已经学习了海量文本规律,Few-shot Prompting利用了模型的“上下文学习”能力——把示例放在提示词中当成上下文,模型会自动捕捉示例中的映射关系。示例数量通常为1到5个,过多会导致上下文窗口溢出,过少则可能让模型理解不准确。
关键在于示例的格式、顺序和内容需具有代表性。举例时最好覆盖不同变体,如正面/负面案例,或不同句式。模型通过对比示例间的模式,推理出当前任务的规则,再应用到新输入上。这种机制无需梯度更新,纯粹依靠注意力的泛化能力。
常见场景
文本分类:给模型2-3条垃圾邮件和正常邮件的分类示例,然后让它判断新邮件是否属于垃圾邮件。代码生成:提供一段输入表和输出SQL的示例,模型即可生成对应查询语句。翻译任务:给出“hello→你好”“bye→再见”的对照,模型会按同样模式翻译其他单词。
客服话术匹配:用几个典型用户问题与回答示例,让模型为新问题匹配最佳回复。内容摘要:给出原文与摘要的示例对,模型学会后能为新文章生成格式一致的摘要。Few-shot Prompting还能与思维链结合,通过带推理步骤的示例提升复杂推理的准确性。
容易混淆的点
Few-shot Prompting与微调(Fine-tuning)不同:前者不修改模型权重,仅在输入中放入示例;后者需要大量标注数据训练模型,成本更高但性能更稳定。不要把它和零样本提示混淆——零样本不给任何示例,完全依赖模型先验知识,效果通常弱于少样本。
另外,Few-shot Prompting并不总是越多示例越好。超过10个示例可能因上下文窗口限制而被迫截断,或引入无关噪声导致模型困惑。示例质量远比数量重要,精心挑选一个覆盖边界情况的示例,可能比随意加五个效果更好。
