RAG检索增强生成技术及应用
RAG是模型生成回答前从指定知识库中精准抓取信息,再结合这些依据去生成内容,回答问题(给一个学霸配备一个随身图书馆,方便随时查阅)
首先,是什么?
RAG是模型生成回答前从指定知识库中精准抓取信息,再结合这些依据去生成内容,回答问题(给一个学霸配备一个随身图书馆,方便随时查阅)
核心就是:知识库(存资料)、检索器(查资料)、排序器(整理需要的资料)、生成器(写答案)
然后,为什么要用?
1.最关键的:提升回答准确性,减少事实错误(幻觉):RAG通过实时检索外部知识,为模型提供可靠依据,能显著降低模型“幻觉”,生成更可信的回答。
2.解决模型知识陈旧与数据局限:大语言模型的知识受限于训练数据,RAG可以动态接入最新或专有数据源,动态实时检索,让模型保持知识更新和专业性。
3.突破输入长度限制,处理大规模知识:模型本身有输入长度限制,RAG通过外部知识库承载大量信息,使模型能够引用超出自身处理范围的专业或详细内容。
4.增强通用性,适配多领域任务:结合检索与生成,模型能灵活应对不同行业与用户需求,扩展应用场景,提升产品适用范围与实用性。
最后,怎么做?
它的工作流分三步:
一、数据预处理阶段:知识库构建和文档解析与清洗→文档分块(chunks)→Embedding处理
1.文档解析与清洗

(参考小红书:AI观察者http://xhslink.com/o/pIBrQw0R0o)
2.文档切块

3.Embedding处理
对切块后的文档进行向量化的处理,然后使用向量数据库进行存储
向量数据库:Milvus、Faiss、Elaticsearch、Chroma
二、检索阶段:查询向量数据库(相似性检索)→重排序(相关性排序)
1.查询向量数据库(相似性检索)
核心任务:结合语义/关键词/图进行检索
向量数据库:Milvus、Faiss、Elaticsearch、Chroma

2.reranking
核心任务:提升召回结果的相关性
如果说相似性检索是尽可能召回多的候选内容,那么重排序就是在候选里面挑出最优,根据相关性选出top-k个chunk,把真正相关的文档放在最前面,这样可以显著提高召回率,减少无关信息进入生成阶段,降低LLM计算负担和幻觉风险。

(具体技术路径可参考小红书:荆言Winterhttp://xhslink.com/o/9iL0IYsDfZ)
三、生成阶段:模型选型 → 上下文组装 → 提示词工程(PE工程) → 生成参数调优 → 生成回答(大模型基于“带依据的上下文”输出结构化回答)
结合 1.用户的Query 和 2.检索器从知识库中找到的相关文本块(上下文)
生成一个最终的、连贯且信息丰富的回答,这个过程就是“增强生成”。
(PS:PE工程我们有机会单独讲,这个很重要!!!!!)
*补充1:RAG中如何对用户问题进行Query的改写?
1.洞察问题
此处请结合大家做过的项目/实习具体场景来谈
(1)信息缺失:用户仅说 “我要还多少?”,未明确贷款合同编号、账单所属月份、还款计划类型(缺少指代主体)。
(2)表述模糊:用户问 “逾期影响大吗?”,未明确逾期时长、贷款产品类型、逾期金额(范围模糊,影响维度包括征信、罚息、催收措施等)。
(3)依赖上下文:多轮对话中,用户先问 “我逾期 3 天,能申请宽限期吗?”,接着问 “那这样还会收罚息吗?”(后一个 Query 依赖 “宽限期申请” 的上下文)。
(4)复杂多问:用户问 “我现在逾期 10 天,先还一半的话,剩下的能延期吗?另外我是担保人担保的,这会影响担保人吗?”(包含 “逾期部分还款后延期可能性”“担保人责任影响” 两个子问题)。
2.选择策略
(1)信息缺失 / 表述模糊:零样本改写 + HyDE:
零样本改写示例:用户问 “我要还多少?” → 改写为 “您编号为【XXX】的贷款合同,XX 月的应还款金额是多少?(含本金、利息及手续费)”。
HyDE 示例:用户问 “我的还款计划是怎样的?” → 先让 LLM 生成假设答案 “用户想了解其贷款合同的分期还款计划,包含每期还款金额、还款日期、剩余期数”,再用该假设检索知识库中匹配的还款计划详情。
(2)需要全面信息:多查询生成
典型场景:用户问 “分期还款划算吗?”生成多轮查询:
“分期还款的手续费率是多少?”
“分期还款对个人征信的影响”
“分期还款的申请流程及审核时间”→ 检索后整合信息,给用户清晰的成本、影响、流程说明。
(3)多轮对话:上下文压缩与注入(LLM总结对话历史成独立Query检索)
用户:“我贷款逾期 5 天了,客服说可以申请协商还款,怎么弄?”用户:“那协商期间还会算罚息吗?”→ LLM 总结上下文为 “用户贷款逾期 5 天,询问协商还款流程及协商期间的罚息计算规则”,再独立检索答案。
(4)复杂问题:问题分解
用户问 “我担保的朋友逾期了,他还了一部分,剩下的没还,我需要承担全部责任吗?另外我自己的贷款还能正常申请吗?”拆解为两个子问题:
“担保人在借款人部分还款后,剩余未还债务的责任范围”
“担保人自身贷款申请是否受被担保人逾期的影响”→ 分别检索后整合回答,确保逻辑清晰、覆盖全面。
**权衡:**改写增加 LLM 调用成本和延迟,简单问题直接检索更经济复杂场景值得投入
(参考小红书:赵多金AI产品经理http://xhslink.com/o/6iH3PFJvdAo**)
补充2:如何测评RAG的效果?
1.检索阶段 核心指标:精确率和召回率 其他指标:效率、鲁棒性(故意写一些错别字进行检测)
2.生成阶段 核心指标:事实准确性(幻觉率、事实冲突率、矛盾陈述率)、信息完整性(要素召回率)、表达流畅性(因果链是否完整)
如何测?自动化评测+人工评测(四元组标注法:陈述、来源、准确性、完整性)
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套 AI 大模型突围资料包:
- ✅ 从零到一的 AI 学习路径图
- ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
- ✅ 百度/阿里专家闭门录播课
- ✅ 大模型当下最新行业报告
- ✅ 真实大厂面试真题
- ✅ 2025 最新岗位需求图谱
所有资料 ⚡️ ,朋友们如果有需要 《AI大模型入门+进阶学习资源包》,下方扫码获取~
① 全套AI大模型应用开发视频教程
(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)
② 大模型系统化学习路线
作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!
③ 大模型学习书籍&文档
学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。
④ AI大模型最新行业报告
2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。
⑤ 大模型项目实战&配套源码
学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。
⑥ 大模型大厂面试真题
面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

以上资料如何领取?

为什么大家都在学大模型?
最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。
风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

以上全套大模型资料如何领取?

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)