LangGraph玩转RAG：三种架构深度解析，助你打造智能问答系统！

程序员小猴紫

211人浏览 · 2026-06-01 22:06:27

程序员小猴紫 · 2026-06-01 22:06:27 发布

LangGraph 里做 RAG，三种架构怎么选

LangGraph 很适合拿来做 RAG，但要先说清楚一件事：LangGraph 不是专门的 RAG 框架，它更像一个把检索、生成、验证、人工介入串起来的编排/runtime 层。

所以，当我们讨论“LangGraph 里怎么做 RAG”时，真正要回答的不是“要不要用某个固定框架”，而是“你的 RAG 流程应该是线性的、由模型决策的，还是带校验回路的”。

LangChain 的检索文档里，把 RAG 归纳成了三种很典型的架构：2 步 RAG、Agentic RAG、Hybrid RAG。这三种都可以放进 LangGraph 里实现，只是控制方式不同。

下面我把它们拆开讲清楚，并且给你看每种方式在 LangGraph 里的示意性实现结构。

先给结论

2 步 RAG：检索一定先于生成，结构最简单，适合 FAQ、文档问答、固定知识库场景。
Agentic RAG：由模型决定何时检索、检索几次、要不要换工具，灵活度最高，适合研究助理、多工具系统。
Hybrid RAG：在检索前后都加上增强与验证，兼顾控制力和灵活性，适合对答案质量更敏感的业务系统。

如果只想先把系统跑起来，2 步 RAG 往往是起点；如果你想让模型自己决定检索节奏，可以看 Agentic RAG；如果你既要稳定又要质量控制，Hybrid RAG 往往会是一个常见选择。

一、2 步 RAG：先检索，再生成

2 步 RAG 是最直观的做法：用户提问之后，先检索相关上下文，再把上下文交给 LLM 生成答案。

它的优点是路径短、延迟可预测、调试容易。大多数常见的 FAQ、知识库问答、制度查询，都是这个结构。

在 LangGraph 里，它通常就是一个很清晰的两节点流程：retrieve -> generate。


from typing import TypedDict from langgraph.graph import StateGraph, START, END class RAGState(TypedDict): question: str docs: list[str] answer: str def retrieve(state: RAGState): docs = retriever.get_relevant_documents(state[“question”]) return {“docs”: [d.page_content for d in docs]} def generate(state: RAGState): context = “\n\n”.join(state[“docs”][:3]) prompt = f"问题：{state[‘question’]}\n\n上下文：{context}" return {“answer”: llm.invoke(prompt)} builder = StateGraph(RAGState) builder.add_node(“retrieve”, retrieve) builder.add_node(“generate”, generate) builder.add_edge(START, “retrieve”) builder.add_edge(“retrieve”, “generate”) builder.add_edge(“generate”, END) graph = builder.compile()

from typing import TypedDict from langgraph.graph import StateGraph, START, END class RAGState(TypedDict): question: str docs: list[str] answer: str def retrieve(state: RAGState): docs = retriever.get_relevant_documents(state[“question”]) return {“docs”: [d.page_content for d in docs]} def generate(state: RAGState): context = “\n\n”.join(state[“docs”][:3]) prompt = f"问题：{state[‘question’]}\n\n上下文：{context}" return {“answer”: llm.invoke(prompt)} builder = StateGraph(RAGState) builder.add_node(“retrieve”, retrieve) builder.add_node(“generate”, generate) builder.add_edge(START, “retrieve”) builder.add_edge(“retrieve”, “generate”) builder.add_edge(“generate”, END) graph = builder.compile()

这类实现里，你可以用 LangChain 自带的 retriever、向量库、文档加载器，也可以换成 LlamaIndex 的 retriever 或 query engine。对 2 步 RAG 来说，关键不是用谁，而是检索一定在生成之前。

二、Agentic RAG：让模型决定何时检索

Agentic RAG 的核心变化是：检索不再是固定前置步骤，而是由智能体在推理过程中决定的动作。

比如模型先判断“我是不是需要外部知识”，如果需要，再决定用什么工具、查几次、查完后要不要继续追问。

这类结构的优势是灵活。它适合多工具研究助理、需要动态规划的知识工作流、或者“先想一想再查”的场景。

在 LangGraph 里，它常见的形态是：模型节点和工具节点形成循环，模型根据状态决定下一步是否调用检索工具。


from langchain.tools import tool @tool def search_kb(query: str) -> str: return knowledge_base.search(query) def agent_step(state): # 伪代码：让模型决定是否需要检索 decision = llm.invoke( f"判断是否需要检索。问题：{state[‘question’]}" ) return {“answer”: decision} def retrieve_tool(state): result = search_kb.invoke(state[“question”]) return {“tool_result”: result}

from langchain.tools import tool @tool def search_kb(query: str) -> str: return knowledge_base.search(query) def agent_step(state): # 伪代码：让模型决定是否需要检索 decision = llm.invoke( f"判断是否需要检索。问题：{state[‘question’]}" ) return {“answer”: decision} def retrieve_tool(state): result = search_kb.invoke(state[“question”]) return {“tool_result”: result}

在真实项目里，这个“工具”可以是任何能检索外部知识的能力：

LangChain retriever
LlamaIndex query engine
公司内部搜索服务
Web 搜索工具

所以 Agentic RAG 不是“必须上某个框架”，而是“让检索变成模型可调度的工具”。

三、Hybrid RAG：加查询增强、验证和回路

Hybrid RAG 更适合那些需要更多控制点的生产场景。它不只做“查一下就回答”，而是在前后都加了控制步骤：

先增强 query
再检索
再检查检索是否足够
生成后再检查答案质量
不够时再回到前面重试

这类结构适合对准确率、可解释性、引用质量要求更高的系统，比如领域问答、客服知识库、内部研究助手。

在 LangGraph 里，Hybrid RAG 的优势特别明显，因为它天然就是状态机：可以把“改写查询”“检索验证”“答案验证”都变成节点。


from typing import TypedDict class HybridState(TypedDict): question: str rewritten_question: str docs: list[str] retrieval_ok: bool answer_ok: bool answer: str def rewrite_query(state: HybridState): rewritten = llm.invoke(f"把问题改写得更适合检索：{state[‘question’]}“) return {“rewritten_question”: rewritten} def retrieve(state: HybridState): query = state.get(“rewritten_question”) or state[“question”] docs = retriever.get_relevant_documents(query) return {“docs”: [d.page_content for d in docs], “retrieval_ok”: len(docs) > 0} def generate(state: HybridState): context = “\n\n”.join(state[“docs”][:3]) answer = llm.invoke(f"根据上下文回答：\n{context}\n\n问题：{state[‘question’]}”) return {“answer”: answer}

from typing import TypedDict class HybridState(TypedDict): question: str rewritten_question: str docs: list[str] retrieval_ok: bool answer_ok: bool answer: str def rewrite_query(state: HybridState): rewritten = llm.invoke(f"把问题改写得更适合检索：{state[‘question’]}“) return {“rewritten_question”: rewritten} def retrieve(state: HybridState): query = state.get(“rewritten_question”) or state[“question”] docs = retriever.get_relevant_documents(query) return {“docs”: [d.page_content for d in docs], “retrieval_ok”: len(docs) > 0} def generate(state: HybridState): context = “\n\n”.join(state[“docs”][:3]) answer = llm.invoke(f"根据上下文回答：\n{context}\n\n问题：{state[‘question’]}”) return {“answer”: answer}

真正的 Hybrid RAG 往往还会再加一步：答案验证。比如检查答案是否真的基于检索证据、是否需要重新检索、是否需要人工审核。

这也是为什么有些生产系统会从 2 步 RAG 逐步加入查询增强、验证与回路，演变成更偏 Hybrid 的结构：不是因为前者不能用，而是因为后者更适合把“能答”推进到“答得稳”。

三种架构怎么选

如果你的任务是文档 FAQ、制度问答、产品说明这类问题，2 步 RAG 往往就够了。

如果你的任务更像“智能体去查资料、查工具、自己决定查不查”，那就用 Agentic RAG。

如果你的任务对正确率、引用、可回退和质量控制更敏感，那就用 Hybrid RAG。

在部分团队的实践里，这三种结构也可能呈现出一种从简单到复杂的演进关系，但这不是唯一顺序：

先用 2 步 RAG 跑通基础问答
再把固定检索改成可决策检索，进入 Agentic RAG
最后补上查询增强、验证和回路，收敛成 Hybrid RAG

LangGraph 在这里到底扮演什么角色

LangGraph 的价值，不是“它自己就是 RAG”，而是它可以把这三种架构都变成清晰的状态流：

2 步 RAG 里，它负责固定流程
Agentic RAG 里，它负责工具调用和循环决策
Hybrid RAG 里，它负责增强、验证、回退和重试

所以，更准确的一句话是：LangGraph 负责把 RAG 的流程做成可控的图，而 RAG 的知识层可以来自 LangChain 组件、LlamaIndex，或者你自己的检索服务。

结尾

如果把 RAG 做成一个工程系统，最重要的不是“选哪个框架最强”，而是先判断你要的是哪一种架构：

检索固定前置，还是由模型动态决定？
要不要验证？要不要回路？
要不要把检索能力做成独立工具或服务？

LangGraph 很适合做这些选择的编排层。至于 RAG 的知识层，LlamaIndex 只是一个很好的选项，但它从来不是唯一答案。

最后

我在一线科技企业深耕十二载，见证过太多因技术更迭而跃迁的案例。那些率先拥抱 AI 的同事，早已在效率与薪资上形成代际优势，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包：

✅AI大模型学习路线图
✅Agent行业报告
✅100集大模型视频教程
✅大模型书籍PDF
✅DeepSeek教程
✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了，有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

在这里插入图片描述

为什么说现在普通人就业/升职加薪的首选是AI大模型？

人工智能技术的爆发式增长，正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议，到全国两会关于AI产业发展的政策聚焦，再到招聘会上排起的长队，AI的热度已从技术领域渗透到就业市场的每一个角落。

智联招聘的最新数据给出了最直观的印证：2025年2月，AI领域求职人数同比增幅突破200% ，远超其他行业平均水平；整个人工智能行业的求职增速达到33.4%，位居各行业榜首，其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张，也让人才供需矛盾愈发突出。麦肯锡报告明确预测，到2030年中国AI专业人才需求将达600万人，人才缺口可能高达400万人，这一缺口不仅存在于核心技术领域，更蔓延至产业应用的各个环节。

在这里插入图片描述

资料包有什么？

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点
在这里插入图片描述

② AI大模型学习路线图（还有视频解说）

全过程AI大模型学习路线

在这里插入图片描述

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了，这些是我精选出来的

在这里插入图片描述

④各大厂大模型面试题目详解

在这里插入图片描述

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理，鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位，在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利，同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制，且资料与智泊AI共享，相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

在这里插入图片描述

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌，通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌，构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论，还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

在这里插入图片描述

如果说你是以下人群中的其中一类，都可以来智泊AI学习人工智能，找到高薪工作，一次小小的“投资”换来的是终身受益！

应届毕业生‌：无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌：非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈：传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

在这里插入图片描述

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

DeepSeek联合北大最新文章DSpark：如何让大模型推理速度提升 85%？

智能体开发者社区

世界模型火了，可你的AI连无人机翻转都算不准——缺的不是数据而是这条公理

Agent工程师成最稀缺岗位。本文指出当前AI Agent缺乏物理公理致旋转仿真/流体外推失效；《旋生万物》从"退化圆"出发构建旋子代数与螺旋联络统一旋转、平移及物理定律，为世界模型提供几何先验；《圆道与螺旋系列丛书》（22部·300万字·公理I²=-N）覆盖螺旋数论至生成式AI提示工程。适合Java/Python/嵌入式/算法工程师构建不可替代竞争力。下载：https://doi.org/10.