华为:基于中心图的RAG框架
如何通过构建查询驱动的图来改善检索增强生成(RAG)方法,以提高多跳问题回答的准确性和可解释性?论文提出了一种新的查询中心图检索增强生成(QCG-RAG)框架,通过增强图的构建和检索机制,解决了现有图基 RAG 方法的粒度困境。

📖标题:Query-Centric Graph Retrieval Augmented Generation
🌐来源:arXiv, 2509.21237
🌟摘要
基于图的检索增强生成 (RAG) 通过外部知识丰富了大型语言模型 (LLM),用于长上下文理解和多跳推理,但现有方法面临粒度困境:细粒度实体级图会产生很高的令牌成本并丢失上下文,而粗文档级图无法捕获细微的关系。我们介绍了 QCG-RAG,这是一个以查询为中心的图 RAG 框架,可以实现查询粒度索引和多跳块检索。我们的以查询为中心的方法利用 Doc2Query 和 Doc2Query- 来构建具有可控粒度的查询为中心的图,提高了图的质量和可解释性。然后,定制的多跳检索机制通过生成的查询选择相关块。LiHuaWorld 和 MultiHop-RAG 的实验表明,QCG-RAG 在问答准确性方面始终优于先前基于块和图形的 RAG 方法,为多跳推理建立了一种新的范式。
🛎️文章简介
🔸研究问题:如何通过构建查询驱动的图来改善检索增强生成(RAG)方法,以提高多跳问题回答的准确性和可解释性?
🔸主要贡献:提出了一种新的查询中心图检索增强生成(QCG-RAG)框架,通过增强图的构建和检索机制,解决了现有图基 RAG 方法的粒度困境。
📝重点思路
🔸提出了查询中心图(QCG)构建框架,通过生成与文本块相关的合成查询-回答对来丰富检索空间。
🔸采用扩展的Doc2Query方法生成高质量查询,并依据语义相似性进行筛选,以减少噪声。
🔸提出了基于查询的检索机制,分为四个步骤:检索相关查询、扩展邻接查询、聚合并排序相关文本块以及生成最终回答。
🔸设计了一种多跳检索过程,能够根据复杂查询准确检索相关文本块。
🔎分析总结
🔸QCG-RAG在多跳和长上下文问答中,表现出明显优于传统的基于块和图的RAG方法,在准确性上取得了最先进的性能。
🔸通过实验发现,查询中心图能够更好地编码查询与查询、查询与文本块之间的关系,从而有效地整合散布的证据,形成连贯的推理链。
🔸实验表明,查询的设计、节点选择以及超参数的平衡设置对模型的性能至关重要,意即正确的图构建策略对于提升模型性能至关重要。
💡个人观点
论文引入了查询中心图的概念,有效地解决了传统图基RAG的粒度问题,为多跳问题回答提供了更为细致和高效的图结构表达。
🧩附录

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)