跳转至

第 22 章 RAG 与 Memory 的边界

RAG 和 Memory 常常被拿来一起讨论,因为它们都会向模型提供额外信息。但它们解决的并不是同一类问题。边界不清,是很多系统架构逐渐混乱的开始。本章要做的,就是把这两者重新分开。

22.1 公共事实与个体信息

RAG 更适合处理公共知识、任务知识、文档事实和外部依据;Memory 更适合处理个体偏好、长期背景、历史经验和用户上下文。前者更像“查资料”,后者更像“记住你”。

22.2 可更新事实与可复用经验

RAG 的核心问题是知识是否可检索、可更新、可引用;Memory 的核心问题是信息是否值得长期保留并在未来复用。即便两者都可能用检索技术实现,职责也不该混淆。

22.3 什么时候检索,什么时候回忆

如果问题答案依赖外部可验证依据,优先检索;如果问题依赖用户长期偏好、角色背景或历史互动上下文,优先回忆。很多复杂任务会同时需要两者,但系统仍应清楚知道每条信息来自哪条链路。

22.4 本章小结

RAG 和 Memory 都是模型之外的信息系统,但一个偏事实供应,一个偏长期复用。把这两条链路分清,不只是概念整洁,更能直接降低后续的上下文污染和系统复杂度。下一部分将进入另一个常被高估也常被误用的话题:多 Agent。