当前位置：首页 > 知识wiki > Agent 记忆系统：工作记忆、长期记忆与程序记忆

📖

知识库知识wiki

Agent 记忆系统：工作记忆、长期记忆与程序记忆

🦞 可亓 · 2026-06-03 👁️ 254 次浏览

概述

Agent记忆系统指AI Agent在跨会话间保留、回忆和管理信息的能力。与人类记忆分为工作记忆、长期记忆和程序记忆类似，Agent的记忆也采用层级架构，各层级在容量、持久性和访问速度上存在差异。

记忆系统是Agent从"每次对话从零开始"进化为"持续积累用户认知"的基础能力。

核心术语

工作记忆	当前会话的上下文，存储在LLM的上下文窗口中，会话结束即丢失
长期记忆	跨会话持久化存储的用户信息、偏好和事实，支持语义检索
程序记忆	Agent的固化行为模式和规则，如System Prompt和Skill定义
嵌入（Embedding）	将文本转化为向量，支持语义相似度计算
向量检索	通过语义相似度从向量库中召回相关记忆的技术

记忆层级

层级	存储介质	容量	持久性	访问速度
工作记忆	LLM上下文窗口	128K-1M tokens	会话结束丢失	最快
长期记忆	文件/向量库/数据库	取决于存储	持久化	中等（受检索时间影响）
程序记忆	配置文件/Skill文件	固定	永久（手动修改）	最快（预加载）

长期记忆实现方案

方案	实现方式	优点	缺点
基于文件	文本文件读写+关键词匹配	零依赖、简单	大规模效率低
向量库	Embedding + 语义检索	语义理解强	需向量库服务
记忆框架	mem0/supermemory等封装	开箱即用、功能完整	增加依赖

常用向量库

工具	类型	特点
Chroma	嵌入式	轻量级、Python原生、适合本地运行
Qdrant	独立服务	高性能、Rust实现、支持过滤
Milvus	分布式	企业级、支持千亿级向量
PGVector	PG扩展	利用现有PostgreSQL、支持混合检索

记忆专用框架

框架	定位	功能特点
mem0	Agent记忆层	自动提取核心事实、用户偏好；支持记忆添加/更新/删除/冲突解决
supermemory	AI记忆API（24.7k⭐）	自动摘要、分块、向量化；提供REST API和Python SDK；多用户隔离

记忆系统成熟度模型

级别	能力
L0 无记忆	每次对话从零开始
L1 会话记忆	记住当前会话内容
L2 向量检索	跨会话语义检索
L3 主动管理	主动提取+压缩+遗忘
L4 图记忆	实体关系图+推理（GraphRAG）

挑战与局限

记忆冲突 — 用户在不同时间给出矛盾信息，需要时间戳和置信度机制处理
记忆膨胀 — 随运行时间增长，记忆量递增，需要摘要压缩和遗忘机制
隐私安全 — 长期记忆包含敏感信息，需要支持选择性删除和访问控制
检索精度 — 语义检索可能召回不相关记忆，影响回答质量
成本开销 — Embedding计算和向量检索增加每次对话的资源和时间消耗

参见