6 月 8 日到 12 日,Claude Code 从 v2.1.169 连发到 v2.1.175,一周七个版本。其中藏着一个改变玩法的更新:子代理现在可以派生自己的子代理,最深 5 层嵌套。
在这之前,Claude Code 的多 agent 是单层 fan-out:主会话派一批 worker,收结果,结束。现在它变成了递归结构:主控派领域协调者,协调者再派执行 worker。这是真正的编排平台和"批量开小号"的区别。
嵌套子代理怎么用好
5 层是上限,不是建议。实战里最有用的是三层结构:
主会话(你)
└── 协调者 agent(按领域拆分,如"前端改造")
└── 执行 worker(按文件/模块干活)
几条用了几天换来的经验:
- 层数能少就少。每加一层,上下文传递就多一次损耗,任务描述会像传话游戏一样变形。两层够用的别上三层
- 中间层只做拆分和验收,不做实事。让协调者自己动手改代码,它会忘记自己还有 worker 没收尾
- 给每层明确的产出契约。“把结果写到 X 文件"比"完成后汇报"可靠得多,父层死了产物还在
配套更新让编排真正可用
光有嵌套不够,这一周的另外几个更新才是把多 agent 从玩具变成工具的关键。
/usage 用量归因(v2.1.174):可以按 skill、agent、plugin、MCP 细分消耗,还能看到 cache miss、长上下文、subagents 各自吃了多少,24 小时和 7 天两个视图。跑编排最怕的就是 token 黑洞,现在终于能定位是哪个 agent 在烧钱。
fallbackModel 三级降级链(v2.1.174):可以配置最多 3 个降级模型,主模型过载时按序尝试。跑在 CI 或定时任务里的自动化管线,这是直接可用的可靠性特性,建议所有无人值守场景都配上:
{
"fallbackModel": ["claude-opus-4-8", "claude-sonnet-4-6", "claude-haiku-4-5-20251001"]
}
--safe-mode(v2.1.169):一键禁用全部自定义(CLAUDE.md、插件、skills、hooks、MCP)。排障神器。当你怀疑"是不是我哪个 hook 把行为搞坏了”,先 claude --safe-mode 跑一遍对照,立刻知道锅在配置还是在模型。
/cd <path>(v2.1.169):会话中切换工作目录,且不打断 prompt cache。跨仓库任务不用再开新会话了。
一个真实的编排模板
以"把一个老项目的测试覆盖率提上来"为例:
| 层级 | 角色 | 任务 |
|---|---|---|
| 主会话 | 总控 | 扫描项目结构,按模块拆分,派协调者 |
| 第 2 层 | 模块协调者 ×N | 分析该模块缺失的测试,派 worker,验收产出 |
| 第 3 层 | 执行 worker | 给指定文件写测试,跑通过,写结果文件 |
收尾时主会话汇总各模块结果,统一跑全量测试。整个过程开着 /usage 看归因,发现某个协调者消耗异常就单独排查。
一句提醒:嵌套编排的 token 消耗是乘法不是加法。先用小任务验证你的层级设计,再放真实工作量进去。配合上面 GitHub Copilot 转用量计费的大环境看,“先算账再开跑"会是今年所有 agent 用户的必修课。