Newsroom
AIEII

Claude Code 子代理嵌套实战:5 层编排、/usage 归因、三级模型降级链

v2.1.169 到 v2.1.175 一周连发:子代理可以再派子代理(最深 5 层)、--safe-mode 排障、fallbackModel 降级链。多 agent 编排的正确姿势。

2026年06月13日

Claude Code 子代理嵌套实战:5 层编排、/usage 归因、三级模型降级链

6 月 8 日到 12 日,Claude Code 从 v2.1.169 连发到 v2.1.175,一周七个版本。其中藏着一个改变玩法的更新:子代理现在可以派生自己的子代理,最深 5 层嵌套

在这之前,Claude Code 的多 agent 是单层 fan-out:主会话派一批 worker,收结果,结束。现在它变成了递归结构:主控派领域协调者,协调者再派执行 worker。这是真正的编排平台和"批量开小号"的区别。


嵌套子代理怎么用好

5 层是上限,不是建议。实战里最有用的是三层结构:

主会话(你)
└── 协调者 agent(按领域拆分,如"前端改造")
    └── 执行 worker(按文件/模块干活)

几条用了几天换来的经验:

  1. 层数能少就少。每加一层,上下文传递就多一次损耗,任务描述会像传话游戏一样变形。两层够用的别上三层
  2. 中间层只做拆分和验收,不做实事。让协调者自己动手改代码,它会忘记自己还有 worker 没收尾
  3. 给每层明确的产出契约。“把结果写到 X 文件"比"完成后汇报"可靠得多,父层死了产物还在

配套更新让编排真正可用

光有嵌套不够,这一周的另外几个更新才是把多 agent 从玩具变成工具的关键。

/usage 用量归因(v2.1.174):可以按 skill、agent、plugin、MCP 细分消耗,还能看到 cache miss、长上下文、subagents 各自吃了多少,24 小时和 7 天两个视图。跑编排最怕的就是 token 黑洞,现在终于能定位是哪个 agent 在烧钱。

fallbackModel 三级降级链(v2.1.174):可以配置最多 3 个降级模型,主模型过载时按序尝试。跑在 CI 或定时任务里的自动化管线,这是直接可用的可靠性特性,建议所有无人值守场景都配上:

{
  "fallbackModel": ["claude-opus-4-8", "claude-sonnet-4-6", "claude-haiku-4-5-20251001"]
}

--safe-mode(v2.1.169):一键禁用全部自定义(CLAUDE.md、插件、skills、hooks、MCP)。排障神器。当你怀疑"是不是我哪个 hook 把行为搞坏了”,先 claude --safe-mode 跑一遍对照,立刻知道锅在配置还是在模型。

/cd <path>(v2.1.169):会话中切换工作目录,且不打断 prompt cache。跨仓库任务不用再开新会话了。

一个真实的编排模板

以"把一个老项目的测试覆盖率提上来"为例:

层级角色任务
主会话总控扫描项目结构,按模块拆分,派协调者
第 2 层模块协调者 ×N分析该模块缺失的测试,派 worker,验收产出
第 3 层执行 worker给指定文件写测试,跑通过,写结果文件

收尾时主会话汇总各模块结果,统一跑全量测试。整个过程开着 /usage 看归因,发现某个协调者消耗异常就单独排查。

一句提醒:嵌套编排的 token 消耗是乘法不是加法。先用小任务验证你的层级设计,再放真实工作量进去。配合上面 GitHub Copilot 转用量计费的大环境看,“先算账再开跑"会是今年所有 agent 用户的必修课。

参考来源Claude Code 官方 changelog / GitHub CHANGELOG

广告合作联系
立即联系 →
加入会员申请
了解详情 →
← Kimi Work 内测:300 个子代理住进你的电脑,用你 … MCP 要无状态化了:7 月大版本是 breaking … →
💬 Comments
3 min read