浙大:LLM类人记忆架构LightMem
如何设计有效且轻量的记忆系统,以提高大语言模型(LLM)在长对话场景中的表现?论文提出了LightMem,一种受人类记忆启发的轻量级记忆架构,显著提高了长对话的准确性与效率。

📖标题:LightMem: A Lightweight Memory Architecture for Long-Term Interactive Memory in LLMs
🌐来源:arXiv, 2510.18866
🌟摘要
尽管大型语言模型 (LLM) 具有显着的能力,但在动态和复杂的环境中很难有效地利用历史交互信息。内存系统通过引入持久信息存储、检索和利用机制,使llm能够超越无状态的交互。然而,现有的内存系统通常会引入大量的时间和计算开销。为此,我们引入了一种新的内存系统 LightMem,它在内存系统的性能和效率之间取得了平衡。受人类记忆的Atkinson-Shiffrin模型的启发,LightMem将记忆组织成三个互补的阶段。首先,受认知启发的感觉记忆通过轻量级压缩快速过滤不相关的信息,并根据它们的主题对信息进行分组。接下来,主题感知的短期记忆巩固这些基于主题的组,组织和总结内容以获得更结构化的访问。最后,具有睡眠时间更新的长期记忆采用离线程序,将巩固与在线推理解耦。使用 GPT 和 Qwen 主干在 LONGMEMEVAL 上的实验表明,LightMem 在准确率(高达 10.9% 的增益)方面优于强基线,同时将令牌使用减少了多达 117 倍,API 调用需要高达 159 倍,运行时间超过 12 倍。该代码可在 https://github.com/zjunlp/LightMem 获得。
🛎️文章简介
🔸研究问题:如何设计有效且轻量的内存系统,以提高大语言模型(LLM)在长对话场景中的表现?
🔸主要贡献:论文提出了LightMem,一种受人类记忆启发的轻量级记忆架构,显著提高了长对话的准确性与效率。
📝重点思路
🔸利用预压缩模块去除冗余信息,以减少输入数据的噪声。
🔸采用主题分段模块,根据语义和主题相似性动态分组相关语句,提高记忆构建的准确性。
🔸引入"睡眠时间"更新机制,优化长时记忆的维护,并分离实时更新与推断过程。
🔎分析总结
🔸LightMem在QA准确性上相比强基线提升了2.70%-9.65%。
🔸在效率方面,LightMem将token消耗减少了32×-117×,API调用减少了17×-177×,运行时间降低了1.67×-12.45×。
🔸通过离线“睡眠时间”的合并,增强了长时知识更新的可靠性,减少了信息丢失和不一致性。
💡个人观点
论文模仿人类记忆的多阶段处理方式,基于主题构建记忆并优化长时记忆处理。
🧩附录


更多推荐
所有评论(0)