Claude Code 子代理嵌套实战：5 层编排、/usage 归因、三级模型降级链

AIEII

6 月 8 日到 12 日，Claude Code 从 v2.1.169 连发到 v2.1.175，一周七个版本。其中藏着一个改变玩法的更新：子代理现在可以派生自己的子代理，最深 5 层嵌套。

在这之前，Claude Code 的多 agent 是单层 fan-out：主会话派一批 worker，收结果，结束。现在它变成了递归结构：主控派领域协调者，协调者再派执行 worker。这是真正的编排平台和"批量开小号"的区别。

嵌套子代理怎么用好

5 层是上限，不是建议。实战里最有用的是三层结构：

主会话（你）
└── 协调者 agent（按领域拆分，如"前端改造"）
    └── 执行 worker（按文件/模块干活）

几条用了几天换来的经验：

层数能少就少。每加一层，上下文传递就多一次损耗，任务描述会像传话游戏一样变形。两层够用的别上三层
中间层只做拆分和验收，不做实事。让协调者自己动手改代码，它会忘记自己还有 worker 没收尾
给每层明确的产出契约。“把结果写到 X 文件"比"完成后汇报"可靠得多，父层死了产物还在

配套更新让编排真正可用

光有嵌套不够，这一周的另外几个更新才是把多 agent 从玩具变成工具的关键。

/usage 用量归因（v2.1.174）：可以按 skill、agent、plugin、MCP 细分消耗，还能看到 cache miss、长上下文、subagents 各自吃了多少，24 小时和 7 天两个视图。跑编排最怕的就是 token 黑洞，现在终于能定位是哪个 agent 在烧钱。

fallbackModel 三级降级链（v2.1.174）：可以配置最多 3 个降级模型，主模型过载时按序尝试。跑在 CI 或定时任务里的自动化管线，这是直接可用的可靠性特性，建议所有无人值守场景都配上：

{
  "fallbackModel": ["claude-opus-4-8", "claude-sonnet-4-6", "claude-haiku-4-5-20251001"]
}

--safe-mode（v2.1.169）：一键禁用全部自定义（CLAUDE.md、插件、skills、hooks、MCP）。排障神器。当你怀疑"是不是我哪个 hook 把行为搞坏了”，先 claude --safe-mode 跑一遍对照，立刻知道锅在配置还是在模型。

/cd <path>（v2.1.169）：会话中切换工作目录，且不打断 prompt cache。跨仓库任务不用再开新会话了。

一个真实的编排模板

以"把一个老项目的测试覆盖率提上来"为例：

层级	角色	任务
主会话	总控	扫描项目结构，按模块拆分，派协调者
第 2 层	模块协调者 ×N	分析该模块缺失的测试，派 worker，验收产出
第 3 层	执行 worker	给指定文件写测试，跑通过，写结果文件

收尾时主会话汇总各模块结果，统一跑全量测试。整个过程开着 /usage 看归因，发现某个协调者消耗异常就单独排查。

一句提醒：嵌套编排的 token 消耗是乘法不是加法。先用小任务验证你的层级设计，再放真实工作量进去。配合上面 GitHub Copilot 转用量计费的大环境看，“先算账再开跑"会是今年所有 agent 用户的必修课。

参考来源：Claude Code 官方 changelog / GitHub CHANGELOG