Agent 记忆 / RAG / 向量库 / 隐私删除

Agent 记忆与 RAG 架构规划器

输入应用场景、资料来源、更新频率、隐私等级和检索策略，生成短期记忆、长期记忆、RAG 管线、权限审计、删除机制和上线检查清单。适合客服 Agent、销售跟进、个人助理、企业内部知识库和研究资料库。

应用场景资料来源更新频率隐私等级检索策略保留天数

资料数量平均 tokens/资料预计用户数

Agent 记忆目标

记忆分层

短期记忆：保存当前任务、用户问题、工具调用结果和未完成步骤；任务结束后清理或归档摘要。
长期记忆：只保存经过确认的稳定事实，例如用户问题摘要、产品规则版本、已解决工单模式、升级原因。
知识库记忆：把混合资料切成约 3,600 个 chunks，并保留来源、版本、权限和更新时间。
评测记忆：保存真实问题、期望引用、失败样本和人工判定，用于每次更新后回归。
保留策略：默认保留 180 天，到期复核、删除或重新确认。

RAG 管线

检索策略：混合检索。适合生产场景，先关键词/过滤，再向量召回和重排。更稳，但要多维护元数据和评测集。
入库前：清洗文本、去重、切 chunk、抽取标题/来源/权限/时间等元数据。
召回时：先按权限和元数据过滤，再做关键词/向量召回，必要时加入 rerank。
生成时：只允许基于召回片段回答，必须输出引用来源和不确定性。
失败时：无来源、低置信、敏感问题和越权请求必须转人工。

隐私与删除

敏感数据默认不进入长期记忆；必须保存时只存摘要、哈希或脱敏字段。
每条长期记忆都要记录来源、写入原因、写入时间、最后使用时间和删除状态。
用户应能请求删除个人记忆；删除后要同步清理向量索引、缓存和摘要。
权限模型至少包含用户、团队、资料来源、工具调用和审核角色。
审计日志记录检索 query、命中文档、生成回答、人工审核和错误反馈。

可复制架构说明

适合放进 PRD、技术方案、客户 Proposal、内部评审或开发任务拆解。

# Agent 记忆与 RAG 架构规划

## 目标
让客服 Agent 能回答产品问题、引用来源、记住客户上下文，并在敏感问题上转人工

## 基本判断
- 应用场景：客服知识库。让 Agent 基于知识库和历史工单回答问题，同时识别需要人工升级的情况。
- 资料来源：混合资料
- 更新频率：每天更新
- 隐私等级：客户资料
- 资料规模：1200 份资料，约 3,600 个 chunks，预计 50 个用户。
- 推荐架构：Postgres 元数据 + 向量库 + 人工审核记忆写入

## 记忆分层
- 短期记忆：保存当前任务、用户问题、工具调用结果和未完成步骤；任务结束后清理或归档摘要。
- 长期记忆：只保存经过确认的稳定事实，例如 用户问题摘要、产品规则版本、已解决工单模式、升级原因。
- 知识库记忆：把 混合资料 切成约 3,600 个 chunks，并保留来源、版本、权限和更新时间。
- 评测记忆：保存真实问题、期望引用、失败样本和人工判定，用于每次更新后回归。
- 保留策略：默认保留 180 天，到期复核、删除或重新确认。

## RAG 管线
- 检索策略：混合检索。适合生产场景，先关键词/过滤，再向量召回和重排。 更稳，但要多维护元数据和评测集。
- 入库前：清洗文本、去重、切 chunk、抽取标题/来源/权限/时间等元数据。
- 召回时：先按权限和元数据过滤，再做关键词/向量召回，必要时加入 rerank。
- 生成时：只允许基于召回片段回答，必须输出引用来源和不确定性。
- 失败时：无来源、低置信、敏感问题和越权请求必须转人工。

## 隐私、权限与删除
- 敏感数据默认不进入长期记忆；必须保存时只存摘要、哈希或脱敏字段。
- 每条长期记忆都要记录来源、写入原因、写入时间、最后使用时间和删除状态。
- 用户应能请求删除个人记忆；删除后要同步清理向量索引、缓存和摘要。
- 权限模型至少包含用户、团队、资料来源、工具调用和审核角色。
- 审计日志记录检索 query、命中文档、生成回答、人工审核和错误反馈。

## 高风险提醒
- 过期规则误答
- 赔付承诺越权
- 客户隐私泄露

架构组件对比

短期记忆

只保留当前会话、任务步骤和临时上下文，任务结束后可清理。

长期记忆

保存用户偏好、项目事实和稳定信息，必须有写入审批和过期机制。

RAG 知识库

保存文档 chunks、元数据、向量和引用来源，用于可追溯回答。

评测集

保存真实问题、期望来源、错误样本和回归测试，防止越改越差。

上线前检查清单

不要把所有历史对话都当长期记忆；先抽取稳定事实，再人工确认。
RAG 回答必须带来源、更新时间和置信边界，不允许无来源硬答。
客户资料、合同、财务和隐私数据必须支持删除、脱敏和访问留痕。
每次知识库更新后跑评测集，检查召回率、错误引用和过期规则。
向量库不是数据库替代品；元数据、权限、版本和审计记录要结构化保存。
记忆写入要有白名单字段，不要让 Agent 自己决定保存任何敏感信息。

提醒：本工具只做架构规划，不会替你读取真实客户资料或保存记忆。正式上线前，请人工复核资料授权、隐私合规、删除机制、引用来源和评测结果。

记忆与 RAG 规划后下一步

先用工具做判断，再用模板整理交付。生成内容只能作为草稿，不要不审核就直接发给客户。

下载新手模板包把 Proposal、报价、需求沟通和交付检查先标准化。查看 AI 工具导航按编程、部署、收款、自动化和 SEO 场景挑工具。查看 30 天路线图按天推进工具配置、作品集、小单筛选和复盘。