第 13 章 为什么 Agent 需要知识系统¶
很多初学者会把 Agent 的能力边界误认为主要取决于模型本身。但只要任务开始依赖企业内部文档、实时状态、结构化业务数据和可追溯依据,模型参数知识就很快不够用了。知识系统存在的意义,并不是“再给模型补点资料”,而是为 Agent 提供一套可更新、可检索、可引用、可授权的事实供应机制。
13.1 参数知识的边界¶
模型参数里当然包含大量知识,但这些知识至少有四个天然限制:
- 不一定包含你的私有业务知识。
- 不一定是最新的。
- 不一定可追溯来源。
- 不一定能处理权限隔离。
这意味着,只要系统对正确性、时效性和合规性有要求,单靠模型记忆就不够。
13.2 外部知识的价值¶
外部知识系统带来的核心价值不是“知道更多”,而是“知道得更可控”。系统可以明确:
- 知识来自哪里。
- 更新时间是什么。
- 当前用户能不能看。
- 这条结论能不能回指依据。
这四点在生产系统里,通常比“模型本身记住了多少”更重要。
13.3 知识系统与工具系统的区别¶
知识系统主要解决“依据从哪里来”,工具系统主要解决“动作如何发生”。两者经常协作,但不能混在一起。比如:
- 知识检索可以告诉 Agent 某个流程怎么做。
- 工具调用可以真正执行这个流程的一步。
一个成熟的 Agent 应同时区分“找依据”和“做动作”。
13.4 为什么 RAG 会成为默认路径¶
在多数场景下,RAG 之所以成为知识系统的默认选择,不是因为它时髦,而是因为它提供了一个相对通用的链路:把外部资料转成可索引对象,在任务发生时按需召回,再注入模型上下文。它天然适合面向文档、文本片段和半结构化知识的场景。
但 RAG 不等于全部知识系统。数据库查询、搜索系统、图谱、规则库、配置中心,本质上也都属于知识供应机制。只不过 RAG 是其中最常见、最容易先落地的一种。
13.5 本章小结¶
Agent 需要知识系统,不是因为模型“太笨”,而是因为生产环境中的事实必须可更新、可追溯、可授权、可引用。RAG 是最常见的一条路径,但它只是知识系统的一种实现方式。下一章会开始拆 RAG 本身的基础架构:文档如何进入系统、如何被切分、索引、检索和注入上下文。