ChronoRAG:优化时间问答场景，让叙事文本问答精度提升15%

长篇章叙事型文本的问答（如小说、剧本）往往要求模型把分散在多处的情节按时间顺序拼成一条完整“故事线”。现有 RAG 系统把文档切成孤立句子/片段做向量检索，导致。“按时间线组装邻近段落，再送入 LLM 生成答案”，即不再追求“检索更多句子”，而是“检索更少但带时间上下文的连贯片段”。查询：“George Darrow 准备前往法国与 Anna Leath 团聚时，人在哪？

Gao Allen

1189人浏览 · 2025-09-05 15:12:07

Gao Allen · 2025-09-05 15:12:07 发布

对论文《Chronological Passage Assembling in RAG framework for Temporal Question Answering》进行系统总结：

1. 背景信息
长篇章叙事型文本的问答（如小说、剧本）往往要求模型把分散在多处的情节按时间顺序拼成一条完整“故事线”。现有 RAG 系统把文档切成孤立句子/片段做向量检索，导致

事件先后顺序被打断，时间推理困难；
检索结果彼此脱节，关键线索被碎片化。
因此，在“时间敏感”问题上，传统 RAG 准确率明显下降。

2. 解决方案
提出 ChronoRAG——一个面向叙事文本的检索增强生成框架，核心思想：
“按时间线组装邻近段落，再送入 LLM 生成答案”，即不再追求“检索更多句子”，而是“检索更少但带时间上下文的连贯片段”。

3. 解决方案中核心的方法/步骤/策略
1) 离线构图（Graph Construction）

固定长度分块（Layer-0，≈100 token/chunk）；
每 10 个相邻块用 LLM 做“块摘要”；
在摘要上提取“关系描述句”（原子事实），作为 Layer-1 节点；
给 Layer-1 与 Layer-0 都打上“叙事顺序索引”，并记录父子链接；
邻域组装：每个 Layer-1 节点保存其前后 k 个邻居关系句，形成“局部故事流”。

2) 在线检索与生成（Passage Retrieval & Answer Generation）

用查询向量先召回最相关的 Layer-1 关系句（key）；
根据索引把其邻域关系句及对应 Layer-0 原文（value）一并取出，按顺序拼接；
将上下文+查询送入 LLM 生成最终答案。

3) 设计亮点

仅保留单层摘要+顺序索引，避免深层树/图带来的冗余；
用“关系句”做精确定位，用“邻域组装”保证时间连贯；
检索阶段同时利用 Layer-1（高精确）与 Layer-0（细节）实现粗细互补。

4. 文章使用的实例与实验细节
任务描述

在 NarrativeQA 数据集（355 篇故事/剧本，10 557 对问答）上评估；
额外划分出 1 111 条“时间问题”（含 When/After/Before 等关键词）专门测试时间推理。

所用模型与配置

摘要 & 关系抽取：Meta-Llama-3-8B-Instruct；
向量编码：arctic-snowflake-embed-l；
答案生成：UnifiedQA-v2-T5-3B；
统一设置：top-k=20，上下文上限 1 500 token，禁用 BM25 避免文本变形。

主要实验结果（ROUGE-L）

全数据集：ChronoRAG 0.308，领先第二名 RAPTOR-CT 0.297；
时间问题子集：ChronoRAG 0.268，比第二名 RAPTOR-CT 的 0.261 再提升 2.7%；
消融：去掉邻域组装 → 0.295/0.252；去掉块摘要 → 0.272/0.233；去掉关系抽取 → 0.255/0.227，验证各组件均贡献显著。

案例示意
查询：“George Darrow 准备前往法国与 Anna Leath 团聚时，人在哪？”

传统方法返回 6 条孤立句，出现 London/Paris 两个地名，模型无法判断；
ChronoRAG 只返回 3 段按顺序组装好的片段，明确指出“London 晚宴重逢”→“准备启程”，模型正确输出“In London”。

5. 结论

叙事问答的关键不只是“找到事实”，而是“还原事件时间流”；
通过“单层摘要+顺序索引+邻域组装”就能以更低计算成本实现更佳的时间推理效果；
在 NarrativeQA 全量与时间子集上均取得 SOTA，证明时间连贯性对 RAG 的重要性。

6. 限制条件

固定长度分块可能破坏语义边界，虽然简化了检索，但对极度密集对话场景仍可能切断关键信息；
邻域窗口大小与 token 上限存在 trade-off，窗口过大则召回段数减少，反而降低性能；
依赖 LLM 做摘要与关系抽取，计算量随文档长度线性增长，对超长书籍仍需流式或增量处理；
目前仅针对“时间顺序”显式建模，对多线叙事、倒叙/插叙等复杂结构尚未深入探讨；
评估指标采用 ROUGE-L，虽适合短答案，但对需要生成较长解释或开放式问答的场景可能不够全面。
ChronoRAG 论文 6 维度速览表

#	维度	关键信息
1	问题背景	叙事文本 QA 需还原时间线；现有 RAG 把文档切成孤立片段→事件顺序断裂、时间推理差。
2	解决方案	ChronoRAG：按“时间顺序”组装邻近段落再生成答案，少而连贯 > 多而碎片。
3	核心方法	① 离线：固定块→摘要→关系句→顺序索引+邻域组装； ② 在线：先召回关系句→拉取前后邻居+原文→按序送入 LLM。
4	实例&实验	数据集：NarrativeQA（10 557 对）+1 111 条“时间问题”；模型：Llama-3-8B 摘要/T5-3B 生成；指标：ROUGE-L；结果：全集 0.308（+3.7%）、时间问题 0.268（+2.7%）SOTA；消融验证每步均关键。
5	结论	时间连贯性>孤立事实；单层顺序索引+邻域组装即可低成本提升叙事 QA。
6	限制	固定分块或断语义；邻域窗口 vs token 上限需权衡；依赖 LLM 摘要，超长书仍需增量；暂显式处理单线顺序，复杂倒叙/多线待扩展。

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla