记忆分层
- 短期记忆:保存当前任务、用户问题、工具调用结果和未完成步骤;任务结束后清理或归档摘要。
- 长期记忆:只保存经过确认的稳定事实,例如 用户问题摘要、产品规则版本、已解决工单模式、升级原因。
- 知识库记忆:把 混合资料 切成约 3,600 个 chunks,并保留来源、版本、权限和更新时间。
- 评测记忆:保存真实问题、期望引用、失败样本和人工判定,用于每次更新后回归。
- 保留策略:默认保留 180 天,到期复核、删除或重新确认。
Agent 记忆 / RAG / 向量库 / 隐私删除
输入应用场景、资料来源、更新频率、隐私等级和检索策略,生成短期记忆、长期记忆、RAG 管线、权限审计、删除机制和上线检查清单。适合客服 Agent、销售跟进、个人助理、企业内部知识库和研究资料库。
适合放进 PRD、技术方案、客户 Proposal、内部评审或开发任务拆解。
# Agent 记忆与 RAG 架构规划 ## 目标 让客服 Agent 能回答产品问题、引用来源、记住客户上下文,并在敏感问题上转人工 ## 基本判断 - 应用场景:客服知识库。让 Agent 基于知识库和历史工单回答问题,同时识别需要人工升级的情况。 - 资料来源:混合资料 - 更新频率:每天更新 - 隐私等级:客户资料 - 资料规模:1200 份资料,约 3,600 个 chunks,预计 50 个用户。 - 推荐架构:Postgres 元数据 + 向量库 + 人工审核记忆写入 ## 记忆分层 - 短期记忆:保存当前任务、用户问题、工具调用结果和未完成步骤;任务结束后清理或归档摘要。 - 长期记忆:只保存经过确认的稳定事实,例如 用户问题摘要、产品规则版本、已解决工单模式、升级原因。 - 知识库记忆:把 混合资料 切成约 3,600 个 chunks,并保留来源、版本、权限和更新时间。 - 评测记忆:保存真实问题、期望引用、失败样本和人工判定,用于每次更新后回归。 - 保留策略:默认保留 180 天,到期复核、删除或重新确认。 ## RAG 管线 - 检索策略:混合检索。适合生产场景,先关键词/过滤,再向量召回和重排。 更稳,但要多维护元数据和评测集。 - 入库前:清洗文本、去重、切 chunk、抽取标题/来源/权限/时间等元数据。 - 召回时:先按权限和元数据过滤,再做关键词/向量召回,必要时加入 rerank。 - 生成时:只允许基于召回片段回答,必须输出引用来源和不确定性。 - 失败时:无来源、低置信、敏感问题和越权请求必须转人工。 ## 隐私、权限与删除 - 敏感数据默认不进入长期记忆;必须保存时只存摘要、哈希或脱敏字段。 - 每条长期记忆都要记录来源、写入原因、写入时间、最后使用时间和删除状态。 - 用户应能请求删除个人记忆;删除后要同步清理向量索引、缓存和摘要。 - 权限模型至少包含用户、团队、资料来源、工具调用和审核角色。 - 审计日志记录检索 query、命中文档、生成回答、人工审核和错误反馈。 ## 高风险提醒 - 过期规则误答 - 赔付承诺越权 - 客户隐私泄露
只保留当前会话、任务步骤和临时上下文,任务结束后可清理。
保存用户偏好、项目事实和稳定信息,必须有写入审批和过期机制。
保存文档 chunks、元数据、向量和引用来源,用于可追溯回答。
保存真实问题、期望来源、错误样本和回归测试,防止越改越差。
提醒:本工具只做架构规划,不会替你读取真实客户资料或保存记忆。正式上线前,请人工复核资料授权、隐私合规、删除机制、引用来源和评测结果。
先用工具做判断,再用模板整理交付。生成内容只能作为草稿,不要不审核就直接发给客户。