告别信息重复！RAG 2.0 借助 MMR 实现多样性检索，迈向智能知识系统

大语言模型（Large Language Models, LLMs）功能强大，但它们存在短期记忆和静态知识的局限。除非重新训练（这一过程缓慢且昂贵），否则它们无法可靠地回忆最新信息。这就是检索增强生成（Retrieval-Augmented Generation, RAG）的用武之地。 RAG允许模型从外部数据库获取事实，使它们更新更快、运行成本更低且更值得信赖。现在，在2025年，RAG 2.0

datian1234

995人浏览 · 2025-08-21 11:55:02

datian1234 · 2025-08-21 11:55:02 发布

前言

大语言模型（Large Language Models, LLMs）功能强大，但它们存在短期记忆和静态知识的局限。除非重新训练（这一过程缓慢且昂贵），否则它们无法可靠地回忆最新信息。

这就是检索增强生成（Retrieval-Augmented Generation, RAG）的用武之地。 RAG允许模型从外部数据库获取事实，使它们更新更快、运行成本更低且更值得信赖。现在，在2025年，RAG 2.0已经问世——更智能、更动态且已准备好用于生产环境。

1. 静态AI模型的问题

即使是GPT-4和Claude也有知识截止期。如果您的LLM不了解上周发生的事情，它就会产生幻觉。

对于大多数公司而言，由于成本和复杂性，每月重新训练一次LLM是不可能的。

2. RAG 1.0 快速回顾

文章内容

第一代RAG管道的工作方式如下：

将文档转换为向量嵌入（vector embeddings）
将它们存储在**向量数据库（vector database）**中（Pinecone、Weaviate、FAISS等）
在查询时，搜索相关文本块
将检索到的文本块+用户查询发送给LLM，以进行上下文感知生成

这使聊天机器人能够访问最新的公司或特定领域数据成为可能。

3. RAG 2.0的新特性

最近的论文（Meta的FreshLLMs、微软的Graph-RAG）引入了解决常见RAG问题的升级：

动态上下文优先级排序（Dynamic Context Prioritization） 系统自动决定哪些文档对查询最重要。
多跳推理（Multi-hop Reasoning） LLM可以检索、生成中间推理，并在最终输出前再次获取信息。
图增强检索（Graph-Augmented Retrieval） RAG 2.0不是进行平面向量搜索，而是构建**知识图谱（knowledge graph）**以获得更好的连接。
混合检索（Hybrid Retrieval） 结合关键词搜索（BM25）+向量相似度，获得更准确的结果。

按回车键或点击查看完整大小的图片

4.LangChain中的最大边际相关性(MMR)检索技术

在LangChain中，最大边际相关性(Maximum Marginal Relevance, MMR)是一种检索技术，用于选择不仅与给定查询相关，而且彼此之间具有多样性的文档。这解决了标准相似度搜索中的一个常见问题，即排名靠前的文档往往非常相似甚至存在冗余。

MMR的工作原理

初始检索：MMR首先执行初始搜索（通常使用语义相似度）以检索与查询最相关的一组文档。
迭代选择：从这个初始集合中，MMR迭代地选择文档，在每一步中同时考虑文档与查询的相关性以及与已选择文档的差异性。
平衡相关性和多样性：这种迭代选择过程通常涉及一个权衡参数(lambda)来调整相关性和多样性之间的平衡，确保最终检索的文档集合能够对查询提供全面且多样的视角。

在LangChain中使用MMR的优势

减少冗余：MMR最小化了检索结果中高度相似或近乎重复信息的存在，特别是在处理具有多个方面的复杂查询时。
增强信息覆盖：通过优先考虑多样性，MMR有助于确保检索的文档集体涵盖与查询相关的更广泛方面，提供更全面的理解。
改进上下文理解：在像大型语言模型(LLM)的检索增强生成(Retrieval-Augmented Generation, RAG)等应用中，上下文窗口是有限的，MMR允许选择信息丰富且多样的片段，从而产生更好的生成响应。

何时使用MMR

处理可能有多种解释的模糊查询时。
内容摘要任务中，选择多样化的关键信息至关重要。
当寻求提高检索信息的整体质量和全面性，而不仅仅是返回最相似的文档时。

LangChain实现

根据LangChain文档，LangChain的VectorStoreRetriever支持MMR搜索。在配置检索器时，可以指定"mmr"作为搜索类型，以利用其平衡相关性和多样性的能力。

5. Python中的RAG 2.0小示例

您可以使用LangChain和FAISS构建基本的混合RAG管道：

ounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(lineounter(linefrom langchain.embeddings import OpenAIEmbeddingsfrom langchain.vectorstores import FAISSfrom langchain.document_loaders import TextLoaderfrom langchain.chains import RetrievalQAfrom langchain.llms import OpenAI
# Load documentsloader = TextLoader("knowledge.txt")docs = loader.load()
# Create embeddings & store in FAISSembeddings = OpenAIEmbeddings()db = FAISS.from_documents(docs, embeddings)
# Build RAG pipelineretriever = db.as_retriever(search_type="mmr", search_kwargs={"k": 5})qa_chain = RetrievalQA.from_chain_type(    llm=OpenAI(temperature=0),    retriever=retriever)
print(qa_chain.run("What are the key points from the latest AI safety paper?"))

6. 为什么RAG 2.0是一场游戏规则改变者

借助RAG 2.0，公司可以：

无需重新训练即可使AI系统始终保持最新状态
提供有事实依据、带源链接的答案
构建能够跨多个文档进行推理的特定领域助手
将幻觉率降低**50%**以上（根据微软最近的研究）

7. 未来：RAG + 智能体

RAG 2.0与AI智能体（AI Agents）的结合已经在以下领域进行测试：

扫描判例法的法律研究助手
参考实时医学数据库的医疗知识机器人
从实时市场信息中获取数据的金融AI

最后

为什么要学AI大模型

当下，⼈⼯智能市场迎来了爆发期，并逐渐进⼊以⼈⼯通⽤智能（AGI）为主导的新时代。企业纷纷官宣“ AI+ ”战略，为新兴技术⼈才创造丰富的就业机会，⼈才缺⼝将达 400 万！

DeepSeek问世以来，生成式AI和大模型技术爆发式增长，让很多岗位重新成了炙手可热的新星，岗位薪资远超很多后端岗位，在程序员中稳居前列。

在这里插入图片描述

与此同时AI与各行各业深度融合，飞速发展，成为炙手可热的新风口，企业非常需要了解AI、懂AI、会用AI的员工，纷纷开出高薪招聘AI大模型相关岗位。
在这里插入图片描述
最近很多程序员朋友都已经学习或者准备学习 AI 大模型，后台也经常会有小伙伴咨询学习路线和学习资料，我特别拜托北京清华大学学士和美国加州理工学院博士学位的鲁为民老师给大家这里给大家准备了一份涵盖了AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频 全系列的学习资料，这些学习资料不仅深入浅出，而且非常实用，让大家系统而高效地掌握AI大模型的各个知识点。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

AI大模型系统学习路线

在面对AI大模型开发领域的复杂与深入，精准学习显得尤为重要。一份系统的技术路线图，不仅能够帮助开发者清晰地了解从入门到精通所需掌握的知识点，还能提供一条高效、有序的学习路径。

但知道是一回事，做又是另一回事，初学者最常遇到的问题主要是理论知识缺乏、资源和工具的限制、模型理解和调试的复杂性，在这基础上，找到高质量的学习资源，不浪费时间、不走弯路，又是重中之重。

AI大模型入门到实战的视频教程+项目包

看视频学习是一种高效、直观、灵活且富有吸引力的学习方式，可以更直观地展示过程，能有效提升学习兴趣和理解力，是现在获取知识的重要途径

在这里插入图片描述
光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

海量AI大模型必读的经典书籍（PDF）

阅读AI大模型经典书籍可以帮助读者提高技术水平，开拓视野，掌握核心技术，提高解决问题的能力，同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说，阅读经典书籍是非常有必要的。
在这里插入图片描述

600+AI大模型报告（实时更新）

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

AI大模型面试真题+答案解析

我们学习AI大模型必然是想找到高薪的工作，下面这些面试题都是总结当前最新、最热、最高频的面试题，并且每道题都有详细的答案，面试前刷完这套面试题资料，小小offer，不在话下
在这里插入图片描述

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla