浙大：LLM类人记忆架构LightMem

如何设计有效且轻量的记忆系统，以提高大语言模型（LLM）在长对话场景中的表现？论文提出了LightMem，一种受人类记忆启发的轻量级记忆架构，显著提高了长对话的准确性与效率。

大模型任我行

755人浏览 · 2025-10-25 10:00:00

大模型任我行 · 2025-10-25 10:00:00 发布

在这里插入图片描述

📖标题：LightMem: A Lightweight Memory Architecture for Long-Term Interactive Memory in LLMs
🌐来源：arXiv, 2510.18866

🌟摘要

尽管大型语言模型 (LLM) 具有显着的能力，但在动态和复杂的环境中很难有效地利用历史交互信息。内存系统通过引入持久信息存储、检索和利用机制，使llm能够超越无状态的交互。然而，现有的内存系统通常会引入大量的时间和计算开销。为此，我们引入了一种新的内存系统 LightMem，它在内存系统的性能和效率之间取得了平衡。受人类记忆的Atkinson-Shiffrin模型的启发，LightMem将记忆组织成三个互补的阶段。首先，受认知启发的感觉记忆通过轻量级压缩快速过滤不相关的信息，并根据它们的主题对信息进行分组。接下来，主题感知的短期记忆巩固这些基于主题的组，组织和总结内容以获得更结构化的访问。最后，具有睡眠时间更新的长期记忆采用离线程序，将巩固与在线推理解耦。使用 GPT 和 Qwen 主干在 LONGMEMEVAL 上的实验表明，LightMem 在准确率（高达 10.9% 的增益）方面优于强基线，同时将令牌使用减少了多达 117 倍，API 调用需要高达 159 倍，运行时间超过 12 倍。该代码可在 https://github.com/zjunlp/LightMem 获得。

🛎️文章简介

🔸研究问题：如何设计有效且轻量的内存系统，以提高大语言模型（LLM）在长对话场景中的表现？
🔸主要贡献：论文提出了LightMem，一种受人类记忆启发的轻量级记忆架构，显著提高了长对话的准确性与效率。

📝重点思路

🔸利用预压缩模块去除冗余信息，以减少输入数据的噪声。
🔸采用主题分段模块，根据语义和主题相似性动态分组相关语句，提高记忆构建的准确性。
🔸引入"睡眠时间"更新机制，优化长时记忆的维护，并分离实时更新与推断过程。

🔎分析总结

🔸LightMem在QA准确性上相比强基线提升了2.70%-9.65%。
🔸在效率方面，LightMem将token消耗减少了32×-117×，API调用减少了17×-177×，运行时间降低了1.67×-12.45×。
🔸通过离线“睡眠时间”的合并，增强了长时知识更新的可靠性，减少了信息丢失和不一致性。

💡个人观点

论文模仿人类记忆的多阶段处理方式，基于主题构建记忆并优化长时记忆处理。

🧩附录

在这里插入图片描述

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

智能体开发者社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

智能体开发者社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla