Claude Code 动态工作流上线：一次会话自主规划，并行跑数百个子智能体

AIEII

你见过一个 AI 同时跑 750 个子任务吗？

Jarred Sumner 见过。他用 Claude Code 的动态工作流，在 11 天里把 Bun 的底层从 Zig 迁移到 Rust，约 75 万行代码，原有测试套件通过率 99.8%。期间数百个子智能体并行工作，每个文件都有两个独立的 reviewer 智能体做交叉验证。

这件事说明的不只是"AI 变快了"，而是 AI 产品的构建方式正在发生结构性转变。

从单步助手到调度层：动态工作流是什么

过去用 Claude Code，基本流程是这样的：你给一个任务，Claude 开始执行，用一个上下文窗口处理所有事情。

遇到大型代码库，这套模式会出问题。上下文窗口装不下几十个文件的内容；任务之间相互依赖，无法并行；一个中间步骤出错，整条链路就得重来。人在中间不断介入，充当手动调度器，花大量时间在任务管理上，而不是在真正有价值的判断上。

2026 年 5 月 28 日，Anthropic 发布了 Claude Opus 4.8，同时附带了一个更值得关注的功能：动态工作流（Dynamic Workflows）。

核心变化是这样的：Claude 不再亲自做所有事，而是先写一段 JavaScript 编排脚本，然后由运行时调用一批子智能体（subagents）去并行完成各个子任务。Claude 本身退到了调度层，负责规划和验证；真正干活的是那些子智能体。

用一个比方来说，以前 Claude 是一个全能工人，一个人从头干到尾。现在 Claude 是工程主管，写工单，分配工位，监督验收，具体施工由团队完成。

特性	旧线性流程	动态工作流
执行方式	单线程，逐步推进	并行调度多个子智能体
上下文限制	单一上下文窗口	每个智能体有独立上下文
任务中断恢复	从头重来	保存进度，可断点续跑
适用场景	单文件、短任务	大型代码库、多步骤任务
结果验证	依赖用户检查	智能体互相交叉审核

编排脚本本身有一个重要的技术限制：它无法直接操作文件系统或运行 shell 命令，这两件事只有子智能体才能做。脚本的职责是描述任务的逻辑结构，而不是执行具体操作。这个设计在工程上相当合理，把调度层和执行层彻底分开，减少了副作用污染的风险。

从产品角度看，这也是 Claude Code 第一次真正具备了"项目级理解"的能力框架。过去 AI 编码工具的极限是"文件级"，现在这个边界往前推到了"仓库级"乃至"工程任务级"。

并行子智能体怎么跑

看一下完整的执行链路。

你在 Claude Code 里描述一个任务，比如"给这个仓库加全面的测试覆盖"。Claude 理解任务后，写一段 JavaScript 脚本，定义整个工作流的结构：先分析哪些模块需要测试，再拆成若干子任务，每个子任务分配给一个子智能体。

运行时拿到脚本，开始调度。子智能体被分批创建，每批最多 16 个并发。它们相互独立，各自持有自己的工具和上下文。一个智能体在写 auth.test.ts，另一个已经在跑 payment.test.ts 的测试了，互不干扰。

整个工作流最多可以调度 1,000 个子智能体（单次执行上限）。对于大型代码库审计、文档生成、大规模迁移这类任务，这个上限已经足够大。

据 Anthropic 官方博客，动态工作流可以在单次会话中自主规划并分解大规模多步骤任务，跨大型代码库并行跑子智能体并验证代码。运行期间进度会持续保存，任务中断后可以恢复，而不是从零开始。

Bun 的迁移案例是目前公开最详细的一个。Jarred Sumner 描述，在文件级别，系统让 reviewer 智能体专门来挑 coder 智能体写的代码的问题，形成对抗式验证。一方写，另一方找茬，结论收敛之后才算完成这个文件。类似的机制在学术同行评审里早有实践，现在被移植到了 AI 编码工作流里。

这种设计能成立，有一个前提：子智能体之间的独立性。如果所有智能体共用一个状态，并发写入就会产生冲突。目前的实现里，每个智能体的工作范围在脚本阶段就已经定义好，运行时强制隔离执行边界。

还有一个细节值得注意：进度保存。大型工作流跑到一半，网络断了或者本地机器睡了，以前这意味着全部重来。现在运行时会把状态持久化，中断后可以恢复。这在处理数小时级别的任务时是一个实质性的体验改善，不用因为一次断电或超时丢掉整个执行结果。

从架构上看，这套机制有点像分布式系统里的 worker pool 模式：主控节点（Claude 生成的脚本）定义任务队列，worker 节点（子智能体）从队列拉取任务并行执行，结果汇总回主节点做最后验证。唯一不同的是，worker 本身也是 AI，可以理解自然语言的任务描述，不需要把每件事都结构化成机器指令。

能做什么，不能做什么

动态工作流适合三类场景，不适合另外几类。

适合的场景：

代码库大规模审计，是最直接的用途。让几十个智能体分别分析不同模块的安全漏洞、性能瓶颈、依赖版本，最后汇总报告。过去这类任务要么交给人做，要么用单线程 AI 跑几个小时，中间还得人工拼接结果。

大型迁移，类似 Bun 从 Zig 到 Rust 的案例。按模块并行迁移，每个模块有独立的 reviewer，通过率可追踪，失败的模块可以单独重跑，不影响其他模块。

跨文件一致性检查。API 接口文档和实现是否一致，多语言版本之间的翻译是否对齐，全局变量命名是否统一，这类需要"多文件对照"的任务，并行子智能体比单线程更有效率，并且天然适合分批验证。

不适合的场景：

需要强全局状态的任务。如果你的任务要求每一步都依赖上一步的输出，而且中间状态必须是全局可见的，并行调度会引入竞态问题。这类任务最好还是线性流程。

短任务和单文件修改。动态工作流本身有编排开销。写一个函数、修一个 bug，用普通对话模式更快，没必要为了几百行代码启动一整套调度链路。

对稳定性要求极高的生产环境，这是 Anthropic 自己强调的。动态工作流目前仍处于研究预览阶段，不建议直接接入生产关键路径。

动态工作流目前在研究预览阶段，需要 Claude Code v2.1.154 或以上版本，在所有付费计划（Pro、Max、Team、Enterprise）下可用。Max 和 Team 计划默认开启，Enterprise 需管理员手动启用，Pro 用户需在 /config 的 Dynamic workflows 设置里手动激活。数据来源：Claude Code 官方文档。

场景	是否适合动态工作流	备注
大型代码库迁移	适合	Bun 迁移是典型案例
全仓库安全审计	适合	并行分析效率高
跨文件一致性检查	适合	多智能体对照比较
修单个 bug	不适合	编排开销大于收益
强状态依赖的顺序任务	不适合	并发会引入竞态
生产关键路径	暂不建议	研究预览阶段，稳定性待观察

在成本方面，并行运行更多智能体意味着更多的 token 消耗。Anthropic 目前没有给出单次工作流的费用估算，实际成本取决于任务规模和智能体数量。在正式依赖这个功能之前，建议先用小规模任务测试一下，感受 token 消耗的量级再决定是否大规模使用。

对你的开发工作流意味着什么

来说实际影响。

最直接的变化是：你可以把以前需要人工拆分、手动串联的大任务，直接交给 Claude Code 去规划和执行。

以前你可能会这样做：先让 AI 生成一个迁移计划，自己看一遍，再一段一段喂给 AI 执行，遇到错误手动处理，再继续下一段。整个过程你是调度者，AI 是执行者。你花大量精力在任务管理上，而不是在真正需要判断力的地方。

动态工作流把这个分工调整了。你描述目标，Claude 写计划，子智能体执行，另一批子智能体验证，完了给你看结果。中间那层调度工作，AI 自己处理了。

对独立开发者和小团队来说，影响最明显。一个人维护的项目，要做全面的重构或迁移，过去要么拖很久，要么做得不彻底。现在可以让工作流跑一夜，早上看结果，再决定哪些地方需要人工介入。

对大团队，这个功能的价值在于把一些重复性的技术工作从工程师的日程里移走：定期的安全扫描、依赖更新、测试覆盖率补全，这类任务可以定期触发工作流自动完成，工程师只需要做最后的审核，而不是全程盯着。

Akshay Pachaar 在 X 上的分析提到，动态工作流解决了 AI 编码工具长期以来的两个痛点：上下文窗口的物理限制，和顺序执行带来的效率瓶颈。这两件事同时被处理，才有可能产生 Bun 迁移那样量级的结果。

在工具使用层面，如果你现在用 Claude Code，升级到 v2.1.154 或以上版本，然后在 /config 里确认动态工作流已开启。Pro 用户默认是关闭的，需要手动开。Max 和 Team 用户直接可用，不需要额外配置。

有一点需要心理预期：研究预览意味着边界情况的处理还不完善，某些复杂任务可能会出错或超时。目前的建议是，在非关键的工程任务上先试用，积累一些对它边界的了解，再考虑是否接入更重要的工作流。

写在最后

动态工作流不是 Claude Code 的一个小功能更新，是一次底层能力的结构性升级。

从单步执行到并行调度，从上下文瓶颈到多智能体独立执行，从人工串联任务到 AI 自主规划验证。这几件事同时发生，才产生了 Bun 迁移案例那样的结果：75 万行代码，11 天，99.8% 测试通过率。

现在它仍是研究预览，稳定性、成本控制和边界情况的处理还有改进空间。但方向是清晰的。

AI 辅助编码的下一步，不只是更快地生成单行代码，而是能承接完整的工程任务，从规划到执行到验证。你的角色，正在从"给 AI 喂任务"变成"定义目标，审核结果"。

本文数据均来自 Anthropic 官方博客、TechCrunch 报道及 Claude Code 官方文档，数据截止 2026 年 6 月 1 日。动态工作流目前仍处于研究预览阶段，功能和定价可能随正式版发布有所调整。

延伸阅读