跳转至

第 37 章 代码助手 Agent

代码助手是最典型的高工具密度 Agent 场景之一。它不只需要理解自然语言任务,还必须读代码、查依赖、运行命令、解释错误、生成补丁并验证结果。相比文档问答,它更能体现 Tool Use、Planning 和 Workflow 的协同价值。

37.1 工具链设计

一个可用的代码助手通常至少需要:

  • 文件读取与搜索。
  • 代码定位与符号发现。
  • 测试或构建执行。
  • 补丁生成与变更解释。

如果没有这些工具,很多“代码助手”本质上还是代码问答器。

37.2 上下文构建

代码场景最大的难点之一,是上下文窗口远小于代码库规模。系统必须知道:

  • 该读哪些文件。
  • 哪些依赖关系最关键。
  • 哪些测试或报错最值得放进当前上下文。

这让 Context Engineering 比自然语言场景更具决定性。

37.3 执行与验证

代码修改不能停在“生成补丁”,还必须经过验证链路。例如测试、lint、构建或局部运行结果,都应进入后续判断。没有验证的代码助手,只是更会写代码的猜测器。

37.4 风险与约束

代码助手的主要风险包括:

  • 改错文件。
  • 修复表面症状却引入回归。
  • 在证据不足时做大范围改动。
  • 过度依赖单次错误日志。

因此它通常需要更强的阶段边界和验证门禁。

37.5 本章小结

代码助手能很好地展示 Agent 为什么不仅仅是 Prompt。它几乎同时依赖上下文工程、工具系统、规划机制、Workflow 和评测。下一章会继续看另一种更偏任务闭环的场景:任务执行型 Agent。