你是不是也遇到过这样的问题:好不容易接入了大模型,却发现它像个“金鱼脑”,每次对话都从头开始,完全记不住之前说了啥?或者每次提问都得写死代码,想换个语言、改个问题都得重新改程序?

别急,今天我们就来解决这两个让人头疼的问题——让提示词灵活可变,并且让AI记住对话上下文。我们会基于 LangChain 框架,一步一步带你实现一个更智能、更灵活的客服系统。

一、我们先来看看现在系统有哪些问题

目前的系统虽然能调用大模型,但有两个明显的短板:

  1. 提示词是写死的:比如你想让AI帮你翻译一句话,目标语言和内容都固定在代码里,用户没法自己决定。
  2. 没有上下文记忆:每次对话都是独立的,AI 不记得之前聊过什么,导致多轮对话体验很差。

举个例子: 假如你说“帮我翻译成英文:你好吗?”,AI 回复“How are you?”。

接着你说“那换成法语呢?”,如果没有上下文,AI 根本不知道“那”指的是什么。

这就好像两个人在聊天,对方却得了健忘症,每说一句都要重新介绍自己——体验非常糟糕。

二、怎么让提示词“活”起来?

我们要引入一个叫做提示词模板(Prompt Template) 的东西。简单来说,就是一个带有“占位符”的模板,在实际运行时再填入具体内容。

具体怎么做?

我们使用 LangChain 提供的 ChatPromptTemplate 类来构建模板。原先我们是这样写死提示词的:

messages = [
("system", "你是一个翻译助手,请将用户输入的内容翻译成英文"),
("human", "你好吗?")
]

现在我们可以改造成:

from langchain.prompts import ChatPromptTemplate
template = ChatPromptTemplate.from_messages([
("system", "你是一个翻译助手,请将用户输入的内容翻译成{language}"),
("human", "{text}")
])

注意看,{language}{text} 就是两个占位符,我们可以在调用时动态传入值。

如何调用?
prompt = template.invoke({
"language": "意大利语",
"text": "今天天气真好"
})

这样,我们就可以根据用户输入灵活生成提示词,再也不用每次修改代码了!

三、别忘了:对话要有记忆才自然

现在提示词灵活了,但如果我们每次调用模型都是独立请求,AI 还是记不住上下文。

回想一下真实对话:我们经常会用“他”、“那个东西”、“上次说的”这类代词,如果对方没有上下文,根本没法理解。

所以我们要让 AI 具备“记忆能力”,也就是在多次调用之间保留对话历史。

如何实现?

LangChain 提供了多种记忆机制,比如 ConversationBufferMemory,它可以保存之前的对话记录,并在每次请求时自动附加到提示词中。

from langchain.memory import ConversationBufferMemory
memory = ConversationBufferMemory()
然后在构建链(Chain)时传入 memory 参数:
chain = LLMChain(
llm=llm,
prompt=template,
memory=memory
)

这样,每次用户提问时,系统都会自动带上之前的对话历史,AI 就能实现连贯的多轮对话了。

四、把它们组合起来:一个完整的示例

下面是一个支持多语言翻译且具备记忆功能的完整代码示例:

from langchain.prompts import ChatPromptTemplate
from langchain.memory import ConversationBufferMemory
from langchain.chains import LLMChain
from langchain_openai import ChatOpenAI
# 初始化大模型
llm = ChatOpenAI(model="gpt-3.5-turbo")
# 构建提示词模板
template = ChatPromptTemplate.from_messages([
("system", "你是一个翻译助手,请将用户输入的内容翻译成{language}"),
("human", "{text}")
])
# 初始化记忆模块
memory = ConversationBufferMemory()
# 构建链
chain = LLMChain(
llm=llm,
prompt=template,
memory=memory
)
# 第一次提问:翻译成英文
response1 = chain.invoke({
"language": "英文",
"text": "你好吗?"
})
print(response1["text"])  # 输出:How are you?
# 第二次提问:换成法语(AI 知道“换成法语”指的是上一句)
response2 = chain.invoke({
"language": "法语",
"text": "换成法语"
})
print(response2["text"])  # 输出:Comment çava ?

你看,第二次我们只说“换成法语”,AI 也知道我们是在说上一句的“你好吗?”,这就是上下文在起作用。

五、总结一下今天学了什么

  • 提示词模板:让提问方式灵活可变,支持运行时动态传入参数。
  • 记忆机制:
  • 通过 ConversationBufferMemory 让AI记住对话历史,实现多轮对话。
  • 链(Chain)的扩展:将模板、记忆、模型组合成一个完整的流程。

这样一来,你的智能客服就不再是那个“金鱼脑”了,而是能听懂人话、记住上下文、灵活应对各种提问的智能助手!

六、接下来可以做什么?

如果你已经掌握了这些,下一步可以:

  • 尝试更复杂的记忆机制:
  • 比如 ConversationSummaryMemory(摘要记忆),应对更长的对话。
  • 结合前端页面,让用户通过界面输入语言和内容,实现一个真正的交互式翻译工具。
  • 探索 LangChain 提供的其他工具,比如 RetrievalQA 用于知识库问答,让你的客服更强大。

如何高效转型Al大模型领域?

作为一名在一线互联网行业奋斗多年的老兵,我深知持续学习和进步的重要性,尤其是在复杂且深入的Al大模型开发领域。为什么精准学习如此关键?

  • 系统的技术路线图:帮助你从入门到精通,明确所需掌握的知识点。
  • 高效有序的学习路径:避免无效学习,节省时间,提升效率。
  • 完整的知识体系:建立系统的知识框架,为职业发展打下坚实基础。

AI大模型从业者的核心竞争力

  • 持续学习能力:Al技术日新月异,保持学习是关键。
  • 跨领域思维:Al大模型需要结合业务场景,具备跨领域思考能力的从业者更受欢迎。
  • 解决问题的能力:AI大模型的应用需要解决实际问题,你的编程经验将大放异彩。

以前总有人问我说:老师能不能帮我预测预测将来的风口在哪里?

现在没什么可说了,一定是Al;我们国家已经提出来:算力即国力!

未来已来,大模型在未来必然走向人类的生活中,无论你是前端,后端还是数据分析,都可以在这个领域上来,我还是那句话,在大语言AI模型时代,只要你有想法,你就有结果!只要你愿意去学习,你就能卷动的过别人!

现在,你需要的只是一份清晰的转型计划和一群志同道合的伙伴。作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐