各位AI小伙伴们好呀!今天咱们来聊聊如何让大模型按我们的要求"工作"——没错,就是传说中的Prompt Engineering(提示词工程)!

为什么我拒绝了同事的"偷懒"请求?

前两天发生了一件有趣的事:同事跑来跟我说:"咱们有些客服数据需要分类,直接用DeepSeek分得不太准,能不能用提示词工程让分类更精确啊?"

我的反应是:"咱们自己调个模型不香吗?"

他还不死心:"就...不能用提示词解决吗?"

我:"同学,你该补补课了!"

于是乎,就有了今天这篇科普文~

什么是Prompt Engineering?

简单来说,Prompt Engineering就是通过精心设计输入提示词,来引导大模型给出我们想要的输出,而不需要改变模型本身的参数

就像跟人聊天一样:问得好,答得妙;问得模糊,答得跑偏!

为什么有时候Prompt Engineering不好使?

  1. 模型参数纹丝不动:Prompt Engineering只是改变了输入,模型本身的知识和能力并没有提升。就像让小学生做微积分,再怎么引导也白搭!

  2. 知识盲区无解:如果模型压根没学过相关知识,再好的提示词也像对牛弹琴~

  3. 数据多样性陷阱:当任务太复杂或情况太多变时,提示词的效果就会大打折扣。

  4. 长度限制:提示词太长?抱歉,超出模型处理能力就直接GG了!

基础Prompt技巧大公开

1. 零样本学习(Zero-shot)

直接给任务描述,不提供任何例子,全凭模型自由发挥!

"判断这句话的情感倾向:'这家餐厅的服务太棒了!'"

✅ 优点:简单直接 ❌ 缺点:准确率看运气

2. 小样本学习(Few-shot)

先给几个示范例子,再让模型照猫画虎:

"输入:'这电影太精彩了!' → 情感:正面
输入:'服务差到令人发指' → 情感:负面
输入:'产品一般般吧' → 情感:中性
现在请判断:'这家新开的咖啡馆环境不错' → 情感:"

✅ 优点:准确率更高 ❌ 缺点:消耗更多token,可能超出长度限制

高级玩法:让提示词更聪明

示例选择的艺术

随便选几个例子?Too young!

  • KNN聚类法:选与当前任务最相似的例子

  • 图算法:确保例子既相关又多样(技术细节见原文)

示例排序的玄学

顺序很重要!随机排序可以避免:

  • 多数标签偏差(模型总选最常见的)

  • 最近标签偏差(模型偏爱最后一个例子)

指令提示(Instruction Prompting)

与其费劲展示例子,不如直接告诉模型该怎么做!

"你是一个专业的情感分析工具。请严格从[正面/负面/中性]中选择最匹配的情感标签,不要添加任何解释。
待分析文本:'这个APP简直改变了我的人生'"

输出:正面

✅ 省token! ✅ 输出更规范!

思维链(Chain-of-Thought)推理

让模型"展示解题过程",适合复杂问题:

零样本版

"小明有5个苹果,吃了2个,又买了4个。他现在有多少苹果?请逐步计算。"

小样本版

"问题:花园有12朵玫瑰,摘了3朵,又种了5朵。现在有多少朵?
解答:
1. 初始:12朵
2. 摘除后:12-3=9朵
3. 新种后:9+5=14朵
答案:14朵
​
问题:书架20本书,借出6本,归还4本。还剩多少本?
解答:"

进阶CoT技巧

  1. 复杂度越高越好:步骤越多,效果越好(用换行符分隔步骤)

  2. 自洽推理(STaR):只保留能得出正确答案的推理过程

  3. 自问自答(Self-Ask):让模型自己拆分问题,逐步解决

  4. 思维树(Tree of Thoughts):像下棋一样考虑多种推理路径

总结

Prompt Engineering就像是与大模型沟通的"魔法咒语":

  • 从基础的Zero-shot/Few-shot

  • 到高效的Instruction Prompting

  • 再到复杂的CoT推理

记住:没有万能提示词!不同任务、不同模型都需要定制化设计。希望这篇指南能帮你更好地驾驭大模型~

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐