强大新RAG范式！动态将上下文转化为参数知识，有效缓解RAG幻觉！

虽然它通过提供事实文本提高了可靠性，但随着上下文长度的增长，显著增加了推理成本，并引入了具有挑战性的RAG幻觉问题，这主要是由于LLM中缺乏相应的参数知识造成的。通过详细的时间复杂度计算和实际运行时间对比，我们提出的DyPRAG能有效提升模型性能，同时减少RAG带来的高推理开销以及PRAG带来的极高训练和存储开销（仅1%），更证明方法。的潜在映射，仅需要少量的训练数据就能有效学习到泛化性极强的转换

zenRRan

369人浏览 · 2025-04-07 12:26:15

zenRRan · 2025-04-07 12:26:15 发布

检索增强生成（RAG）通过从外部源检索相关文档并将其合并到上下文中来增强大语言模型（LLMs）。虽然它通过提供事实文本提高了可靠性，但随着上下文长度的增长，显著增加了推理成本，并引入了具有挑战性的RAG幻觉问题，这主要是由于LLM中缺乏相应的参数知识造成的。

参数化RAG （PRAG）通过离线训练将文档嵌入大模型参数有效地降低推理成本。然而其高昂的训练和存储成本以及有限的泛化能力，极大地限制了其实际应用。

我们提出动态参数化RAG，在推理时将文档知识动态转化为模型参数知识，能有效补充相应知识。并且能即插即用无缝和RAG结合，提升模型知识内化水平同时减少RAG幻觉的发生。

论文：Better wit than wealth: Dynamic Parametric Retrieval Augmented Generation for Test-time Knowledge Enhancement
链接：https://arxiv.org/pdf/2503.23895
项目：https://github.com/Trae1ounG/DyPRAG

编辑：深度学习自然语言处理公众号

方法

DyPRAG的核心思路在于训练一个轻量的参数转换器来建模从文档->参数的潜在映射，仅需要少量的训练数据就能有效学习到泛化性极强的转换器，在推理时几乎不会引入额外的计算开销且能提升模型性能，最少只需要2MB存储开销。

DyPRAG对比RAG和PRAG

实验

分布内QA实验

在多个问答数据集上训练参数转换器并进行实验，DyPRAG表现出极优的性能：

DyPRAG能有效注入参数知识：对比RAG，在没有提供任何文档拼接到上下文的情况下，DyPRAG表现出明显优于RAG的性能同时减少了推理开销。
上下文知识+动态生成参数知识有效促进知识融合：DyPRAG-Combine将文档加入上下文结合动态生成参数知识，在所有情况下取得最好效果，有效促进了模型知识和上下文知识的融合。

分布内主实验

分布外QA实验

DyPRAG能有效转换分布外的文档到参数知识，在补充参数知识后始终可以作为相比RAG更强更鲁棒的基线。

分布外数据集实现

为什么DyPRAG能减少RAG幻觉？

RAG幻觉（或叫知识冲突）经常由于模型内部知识和外部提供上下文知识发生冲突导致发生。可能模型包含正确的参数知识但结合上下文知识报错，也可能上下文知识正确但模型包含错误参数知识导致模型回答错误。
DyPRAG首先动态将检索文档转换为模型参数知识，提前让模型“做足了功课”，在遇到相对应的上下文内容时就能极大程度避免知识冲突发生，这也是DyPRAG-Combine性能提升的直接来源，极低的开销使得DyPRAG有希望成为RAG幻觉的有效解决方式。

RAG幻觉示例分析

知识内化实验

基于RAGTruth幻觉数据集衡量DyPRAG-Combine对知识的内化程度（使用GPT-4o打分）。

RAGTruth中的文档来源和训练时完全不同并且大模型训练时完全没有见过——DyPRAG能有效将没有见过知识进行内化，内化程度显著优于RAG方法。

RAGTruth数据集验证

计算/存储开销

通过详细的时间复杂度计算和实际运行时间对比，我们提出的DyPRAG能有效提升模型性能，同时减少RAG带来的高推理开销以及PRAG带来的极高训练和存储开销（仅1%），更证明方法即插即用提升性能的高可用性！

实际存储和训练开销

理论分析推理、存储、训练开销

结论

我们提出动态参数化RAG (Dynamic Parametric RAG)，一个轻量级框架可以以即插即用的方式以最小的成本有效地将文档转换为参数。
我们提出了一个强大而实用的RAG范式：有效地将上下文知识与测试时动态生成的参数知识结合起来，实现更强大的知识融合。
实验结果表明，DyPRAG具有极优的泛化能力，能够有效地注入参数并无缝地融合上下文知识，在减少RAG幻觉的同时提高了模型性能。

备注：昵称-学校/公司-方向/会议(eg.ACL)，进入技术/投稿群

id：DLNLPer，记得备注呦

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla