RAG基础[10] - 总结与展望

本文系统介绍了RAG技术从入门到进阶的全过程。教程不仅帮助读者快速搭建基础RAG系统，更强调深入理解底层原理以应对实际业务需求。作者指出，RAG技术正朝着多模态、Agent化、自进化等方向发展，同时提供了丰富的学习资源清单。文章最后反思了AI时代技术人员应有的开放态度，建议放下既有经验，以归零心态拥抱新技术。教程融合了实践指导与前瞻思考，既包含具体技术实现方案，也探讨了行业发展趋势，为开发者提供了

yinchao163

972人浏览 · 2025-11-26 14:49:03

yinchao163 · 2025-11-26 14:49:03 发布

总结

通过本教程，读者应该能够从对RAG一无所知，到有点感觉，能够跑一个简单的demo玩一玩了。

RAG系统从能用到好用，中间隔着一道鸿沟，我们必须深入其中，从业务实际情况入手，把核心的中间变量打印出来，仔细观察中间值的质量，疏通被异常传递的信号流（有点像我们以前通过反汇编来观察异常一样）。

不用欣喜于找到了一个看似能用能直接部署的框架，这只是个开始。技术迭代更新太快，所有的代码都会立马被扫入历史的垃圾箱。不变的是对业务的理解以及对技术整体的理解。

俗话说：师傅领进门，修行靠个人。接下来就是修行靠个人的阶段了。

实战的时候我们仍然建议使用业界成熟的RAG框架（比如langgraph、ragflow等），快速构建。本教程更多是为了加强对RAG系统的底层认知而构建的，日后自己的RAG系统出现了性能瓶颈，也方便理解和针对性优化。

也许这就是AI大模型冲击下技术开发人员的新常态：

人人都是manager，你完全不用coding，但必须对发生了什么保持清晰的认识，并能够主导事情的发展方向。

展望

RAG技术正在快速发展，未来几年将呈现以下趋势：

1. 多模态RAG（Multimodal RAG）

传统的RAG主要处理文本数据，未来的RAG系统将整合图像、音频、视频等多种模态：

图文混合检索：同时检索文本和图像，回答"这个产品的使用说明是什么？"时能直接展示相关图片
视频理解：从视频中提取关键帧和字幕，构建多模态知识库
语音问答：支持语音输入和语音输出，构建更自然的交互体验

推荐学习资源：

2. Agent式RAG（Agentic RAG）

将RAG与AI Agent结合，让系统不仅能检索和回答，还能主动执行任务：

自主决策：根据用户意图，自动选择检索策略、调用工具、生成回答
多步骤推理：通过ReAct机制，将复杂问题拆解为多个检索-推理步骤
工具调用：集成外部API、数据库查询、代码执行等能力

推荐学习资源：

3. 自进化RAG系统

让RAG系统能够从用户反馈中持续学习和改进：

反馈循环：收集用户对答案的评分，自动优化检索策略
知识库自动更新：监控数据源变化，自动增量更新向量库
A/B测试框架：自动对比不同策略的效果，选择最优方案

推荐学习资源：

4. 更高效的检索策略

语义路由（Semantic Routing）：根据问题类型，智能选择不同的检索路径
分层检索（Hierarchical Retrieval）：先粗检索再精检索，提升效率和准确率
图数据库集成：结合知识图谱，实现结构化知识检索

5. 边缘部署与本地化

随着模型量化技术的发展，RAG系统将更多部署在边缘设备：

本地向量数据库：Chroma、FAISS等轻量级方案
量化模型：4-bit、8-bit量化，降低部署成本
混合云架构：敏感数据本地处理，通用能力云端调用

推荐学习资源：

6. 行业标准化

随着RAG应用的普及，将出现更多标准化工具和最佳实践：

评估标准：统一的RAG评估指标和基准测试集
框架整合：不同框架之间的互操作性提升
安全规范：数据隐私、内容审核等安全标准

感悟

一路走来其实不易，笔者的最后一些感想罗列如下：

AI协作时代重要的是多元思维、架构、洞见、价值观、开放的心态。以前所珍视的源码、看似精巧的实现方式、自以为的独门秘方可能会被迅速扫入历史的垃圾堆。
作为技术人员，单纯道听途说媒体对AI的褒贬意见随波逐流，不去亲身感受和体验，不想做新技术的弄潮儿，只是坐等看别人笑话，是十分危险的。
阻碍人进步的不是技术本身，而是我们的思想。必须解放思想，颠覆自己固有观念，才能更好利用AI。此处，笔者尤其从第一性原理获益颇多。（对日常各种事情突发奇想质疑一下，多问几个为什么，尤其是在有AI加持的情况下去刨根究底，你有可能会惊奇地发现：以前都是这样的，以后再这样就错了，哪怕现在还是对的）。这也促使我自主开发了另外一个项目😄~
阻碍人革新思维的罪魁祸首是自以为是，不谦虚。越是看似厉害小有成就的人越如此。而客观上看我们以往的成就和经验反而可能是累赘，我们却不自知！

anyway，在AI智能时代的序幕已经拉开的2025年，笔者愿意发自内心革了自己的命：承认自己无知，过往经验和成就一切归零。重头开始靠自己的双手和大脑来重构AI时代所需要的技能，重头开启自己的技术生涯。

致谢

虽然本教程是作者一人独创，但很明显脱离了AI和网络公开信息，必然一事无成。

感谢所有为RAG技术发展做出贡献的研究者和开发者。本教程参考了大量开源资源和文档，特别感谢：

chatGPT和qwen的AI协作能力，LLM真正的实力谁用谁知道
LangChain团队提供的优秀框架和文档
所有开源RAG项目的贡献者
社区中分享经验和最佳实践的开发者

反馈与贡献

如果你在使用本教程过程中遇到问题，或有改进建议，欢迎：

提交Issue到GitHub仓库
提交Pull Request改进内容
分享你的RAG实战经验

让我们一起让RAG技术更好地服务于实际应用！ 🚀

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

智能体开发者社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

智能体开发者社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla

智能体开发者社区

所有评论(0)

查看更多评论

yinchao163

@yinchao163

已为社区贡献8条内容

RAG基础[10] - 总结与展望

yinchao163

总结

展望

1. 多模态RAG（Multimodal RAG）

2. Agent式RAG（Agentic RAG）

3. 自进化RAG系统

4. 更高效的检索策略

5. 边缘部署与本地化

6. 行业标准化

相关进阶学习资料

📚 核心论文

Transformer与注意力机制

RAG相关论文

检索与向量化

🛠️ 官方文档与教程

框架文档

向量数据库

大模型API

🎓 在线课程

📖 书籍推荐

🔧 工具与平台

评估工具

开发工具

社区与论坛

📊 基准测试与数据集

🎯 实战项目参考

💡 博客与文章

🔍 持续关注

感悟

致谢

反馈与贡献

所有评论(0)

yinchao163

RAG基础[10] - 总结与展望

yinchao163

总结

展望

1. 多模态RAG（Multimodal RAG）

2. Agent式RAG（Agentic RAG）

3. 自进化RAG系统

4. 更高效的检索策略

5. 边缘部署与本地化

6. 行业标准化

相关进阶学习资料

📚 核心论文

Transformer与注意力机制

RAG相关论文

检索与向量化

🛠️ 官方文档与教程

框架文档

向量数据库

大模型API

🎓 在线课程

📖 书籍推荐

🔧 工具与平台

评估工具

开发工具

社区与论坛

📊 基准测试与数据集

🎯 实战项目参考

💡 博客与文章

🔍 持续关注

感悟

致谢

反馈与贡献

所有评论(0)

温馨提示：您尚未绑定手机号

yinchao163