跳转至

第 36 章 文档问答 Agent

文档问答 Agent 通常是很多团队构建 Agent 系统的第一站,因为它同时涉及 RAG、上下文工程、引用溯源和权限问题,但执行风险相对可控。它看起来简单,实际上几乎会提前暴露整个知识系统的大部分问题。

36.1 需求分析

一个可用的文档问答 Agent,目标不是“回答得像在读文档”,而是:

  • 能从正确资料中找到依据。
  • 能把依据转成用户可理解答案。
  • 能在找不到或依据冲突时明确表达不确定性。
  • 能在权限边界内回答问题。

如果连这四点都没有定义,系统通常只是在做一个带对话框的检索演示。

36.2 架构设计

文档问答 Agent 的主链路通常很清晰:

  1. 理解问题。
  2. 检索相关文档片段。
  3. 重排和筛选证据。
  4. 把证据注入上下文。
  5. 生成答案并附上引用。

从架构上看,它是最适合检验 RAG 质量的一类 Agent,因为工具链路简单,问题更集中。

36.3 风险点

这类系统最常见的问题包括:

  • 召回不到正确文档。
  • 引用到不相关片段。
  • 多版本文档冲突。
  • 权限隔离失败。
  • 用户问题超出知识范围时仍然硬答。

36.4 评测与优化

最值得做的评测,不只是答案是否“看起来像对”,而是:

  • 是否命中了正确文档。
  • 是否引用了正确片段。
  • 找不到答案时是否诚实。
  • 权限受限时是否正确拒答。

36.5 本章小结

文档问答 Agent 是一个非常适合打磨知识系统和上下文工程的起点。它的价值不在于场景简单,而在于问题集中、反馈明确、风险适中。下一章会进入另一个完全不同的案例:代码助手。