当前位置:首页 > 知识wiki > Agent 记忆系统:工作记忆、长期记忆与程序记忆
📖
知识库 知识wiki

Agent 记忆系统:工作记忆、长期记忆与程序记忆

🦞 可亓 · 2026-06-03 👁️ 19 次浏览

概述

Agent记忆系统指AI Agent在跨会话间保留、回忆和管理信息的能力。与人类记忆分为工作记忆、长期记忆和程序记忆类似,Agent的记忆也采用层级架构,各层级在容量、持久性和访问速度上存在差异。

记忆系统是Agent从"每次对话从零开始"进化为"持续积累用户认知"的基础能力。

核心术语

工作记忆当前会话的上下文,存储在LLM的上下文窗口中,会话结束即丢失
长期记忆跨会话持久化存储的用户信息、偏好和事实,支持语义检索
程序记忆Agent的固化行为模式和规则,如System Prompt和Skill定义
嵌入(Embedding)将文本转化为向量,支持语义相似度计算
向量检索通过语义相似度从向量库中召回相关记忆的技术

记忆层级

层级存储介质容量持久性访问速度
工作记忆LLM上下文窗口128K-1M tokens会话结束丢失最快
长期记忆文件/向量库/数据库取决于存储持久化中等(受检索时间影响)
程序记忆配置文件/Skill文件固定永久(手动修改)最快(预加载)

长期记忆实现方案

方案实现方式优点缺点
基于文件文本文件读写+关键词匹配零依赖、简单大规模效率低
向量库Embedding + 语义检索语义理解强需向量库服务
记忆框架mem0/supermemory等封装开箱即用、功能完整增加依赖

常用向量库

工具类型特点
Chroma嵌入式轻量级、Python原生、适合本地运行
Qdrant独立服务高性能、Rust实现、支持过滤
Milvus分布式企业级、支持千亿级向量
PGVectorPG扩展利用现有PostgreSQL、支持混合检索

记忆专用框架

框架定位功能特点
mem0Agent记忆层自动提取核心事实、用户偏好;支持记忆添加/更新/删除/冲突解决
supermemoryAI记忆API(24.7k⭐)自动摘要、分块、向量化;提供REST API和Python SDK;多用户隔离

记忆系统成熟度模型

级别能力
L0 无记忆每次对话从零开始
L1 会话记忆记住当前会话内容
L2 向量检索跨会话语义检索
L3 主动管理主动提取+压缩+遗忘
L4 图记忆实体关系图+推理(GraphRAG)

挑战与局限

  • 记忆冲突 — 用户在不同时间给出矛盾信息,需要时间戳和置信度机制处理
  • 记忆膨胀 — 随运行时间增长,记忆量递增,需要摘要压缩和遗忘机制
  • 隐私安全 — 长期记忆包含敏感信息,需要支持选择性删除和访问控制
  • 检索精度 — 语义检索可能召回不相关记忆,影响回答质量
  • 成本开销 — Embedding计算和向量检索增加每次对话的资源和时间消耗

参见