跳转至

第 13 章 为什么 Agent 需要知识系统

很多初学者会把 Agent 的能力边界误认为主要取决于模型本身。但只要任务开始依赖企业内部文档、实时状态、结构化业务数据和可追溯依据,模型参数知识就很快不够用了。知识系统存在的意义,并不是“再给模型补点资料”,而是为 Agent 提供一套可更新、可检索、可引用、可授权的事实供应机制。

13.1 参数知识的边界

模型参数里当然包含大量知识,但这些知识至少有四个天然限制:

  • 不一定包含你的私有业务知识。
  • 不一定是最新的。
  • 不一定可追溯来源。
  • 不一定能处理权限隔离。

这意味着,只要系统对正确性、时效性和合规性有要求,单靠模型记忆就不够。

13.2 外部知识的价值

外部知识系统带来的核心价值不是“知道更多”,而是“知道得更可控”。系统可以明确:

  • 知识来自哪里。
  • 更新时间是什么。
  • 当前用户能不能看。
  • 这条结论能不能回指依据。

这四点在生产系统里,通常比“模型本身记住了多少”更重要。

13.3 知识系统与工具系统的区别

知识系统主要解决“依据从哪里来”,工具系统主要解决“动作如何发生”。两者经常协作,但不能混在一起。比如:

  • 知识检索可以告诉 Agent 某个流程怎么做。
  • 工具调用可以真正执行这个流程的一步。

一个成熟的 Agent 应同时区分“找依据”和“做动作”。

13.4 为什么 RAG 会成为默认路径

在多数场景下,RAG 之所以成为知识系统的默认选择,不是因为它时髦,而是因为它提供了一个相对通用的链路:把外部资料转成可索引对象,在任务发生时按需召回,再注入模型上下文。它天然适合面向文档、文本片段和半结构化知识的场景。

但 RAG 不等于全部知识系统。数据库查询、搜索系统、图谱、规则库、配置中心,本质上也都属于知识供应机制。只不过 RAG 是其中最常见、最容易先落地的一种。

13.5 本章小结

Agent 需要知识系统,不是因为模型“太笨”,而是因为生产环境中的事实必须可更新、可追溯、可授权、可引用。RAG 是最常见的一条路径,但它只是知识系统的一种实现方式。下一章会开始拆 RAG 本身的基础架构:文档如何进入系统、如何被切分、索引、检索和注入上下文。