吴恩达公开课笔记 prompt engineering
ch1 引言
预期学习的内容:
- 软件开发提示词的最佳实践及用例
- 构建一个聊天机器人
llm介绍:
- 两种类型的LLM:base LLM / instruction tuned llm
- base LLM:预测下一个词语
- instruction tuned llm:遵循指令 & RLHF训练
- 本课程主要教学instruction tuned llm
- 一个“聪明的人”由于缺乏有效的指引将难以施展其能力:
- clear and specific /
- give time
ch2 guidelines
两个写提示词的核心原则和策略:
- 1、编写明确且具体的指令:清晰 不等于 简短
2、给模型思考的时间
使用openai api实现的示例
原则1: 编写明确且具体的指令
策略1: 正确使用分隔符 有效避免提示注入prompt injection
策略2:要求结构化输出(html / json)
策略3:要求模型校验条件是否满足,避免异常边界
策略4:few-shot prompts少量训练提示:在模型执行任务之前给一些正确的回复样例
原则2: 给模型以思考的时间
如果给模型太少的提示词,他会倾向于猜答案而非严格的推理逻辑,因此需要给模型以思考的时间。
策略1:明确完成某个任务需要的步骤
策略2:引导模型形成自己的解决方案,最后再得到结论
错误示例:
正确示例:
LLM模型的局限性:
- 模型虚构、模型幻觉(hallucination):编造合理但不正确的内容(虚构)
- 避免策略:要求模型列出引用的文献来源,便于溯源
ch3 迭代提示工程开发
ch4 实践1: 摘要
模版prompt:
多条记录的摘要:
ch5 实践2: 推理
提取标签、提前名称、理解文本情感
情感分类prompts:
信息提取prompts:
主题归纳prompts:
ch6 实践3: 转换
语言翻译、语法修正、格式转换
- 翻译任务、分辨语种
Translate the following text to French
通用的翻译工具:将所有文本翻译成统一的语言
正式场合、非正式场合
- 语气转换: slang to business
- 格式转换:json, html ...
- 语法检查
ch7 实践4: 扩展
- 参数调整: temperature: 模型的探索程度和随机性(多样性),0更加稳定(每次结果都一致)、1更加多样化(每次结论更倾向于不同)。
ch8 实践5: 自定义聊天机器人
通过传入消息列表进行初始化
提供足够的上下文