2026年主流行工具有何不同？subAgent是趋势还是营销？深度解析！

程序员小猴紫

286人浏览 · 2026-05-20 10:43:35

程序员小猴紫 · 2026-05-20 10:43:35 发布

AI Coding工具中的“subAgent”正从营销词发展为工程抽象，实现上下文、权限、任务和执行的拆分管理。主流工具如Claude Code、Codex、OpenClaw、Gemini CLI均在强化subAgent能力，但设计哲学各异。文章从技术视角解析subAgent的本质、各工具异同及使用选择，强调其通过边界划分解决工程问题，而非简单增加AI数量。不同工具侧重点不同：Claude Code聚焦专家角色配置，Codex强调并行工作流，OpenClaw注重后台session管理，Gemini CLI则将Agent作为工具调用。文章建议根据任务特点选择合适工具，并给出多Agent编程实践建议，指出subAgent是AI Coding工具工程化的基础，未来可能收敛于标准化配置、权限最小化、上下文隔离等能力，推动AI Coding走向多Agent协作环境。

截至 2026-05-01，AI Coding 工具里的 “subAgent” 已经不是一个单纯的营销词，而逐渐变成一种工程抽象：把上下文、工具权限、任务边界和并行执行拆开管理。

最近几个主流 AI Coding 工具都在强化 subAgent 能力，比如 Claude Code 的 subagents、OpenAI Codex 的 subagents、OpenClaw 的后台 subagent session、Gemini CLI 的 subagents。

它们看起来都叫 subAgent，但背后的产品哲学并不一样。

这篇文章尝试从技术视角梳理几个问题：

1. subAgent 本质上解决什么问题？
1. Claude Code、Codex、OpenClaw、Gemini CLI 的 subAgent 有什么异同？
1. 实际使用时，应该怎么选？

一、subAgent 解决的不是“多个 AI 聊天”，而是工程边界问题

很多人第一次看到 subAgent，会自然理解成：

一个主 AI，叫几个小 AI 帮它干活。

这个理解没有错，但太浅了。

从工程实现看，subAgent 更重要的是引入了几个边界：

边界	作用
上下文边界	子 Agent 有自己的 context，不污染主会话
工具边界	子 Agent 可以只拿到部分工具权限
任务边界	每个子 Agent 只负责一个明确任务
并行边界	多个任务可以同时跑，而不是顺序等待
责任边界	主 Agent 负责汇总，子 Agent 负责局部执行

这几个边界加起来，才是 subAgent 真正有价值的地方。

举个例子，假设你让 AI 修一个复杂 bug。一个单 Agent 可能会在同一个上下文里同时做这些事：

• 读代码
• 猜测 bug 原因
• 搜索日志
• 修改实现
• 跑测试
• 回看 PR diff
• 写总结

上下文很快变脏。中间的错误假设、无关文件、失败尝试都会留在主会话里，影响后续判断。

subAgent 的思路是：把这些工作拆出去。

比如：

• 让一个 subAgent 专门读日志和复现问题
• 让一个 subAgent 专门看相关代码路径
• 让一个 subAgent 专门做代码审查
• 主 Agent 只接收它们的结论，然后决定下一步

这就是 subAgent 的核心价值：不是让 AI 数量变多，而是让复杂任务的上下文和责任被拆开。

二、四个工具的 subAgent 设计哲学

先给一个总览表。

工具	subAgent 的核心定位
Claude Code	可配置的专家角色
Codex	显式并行工作流
OpenClaw	后台运行的 Agent session
Gemini CLI	作为工具暴露的专家 Agent

它们都能做“任务委派”，但侧重点不同。

三、Claude Code：subAgent 是“可治理的专家角色”

Claude Code 的 subAgent 最像一个“预配置专家”。

一个 subAgent 通常包含：

• 名称
• 描述
• system prompt
• 可用工具
• 模型配置
• 权限模式
• MCP server
• hooks
• memory
• isolation 配置

其中 name 和 description 是核心必填项，其他字段用于进一步收窄工具、模型、权限和运行方式。

Claude Code 的 subAgent 可以放在：

.claude/agents/~/.claude/agents/

也可以通过 CLI 动态传入。

一个典型的 Claude Code subAgent 可能长这样：

---name: code-reviewerdescription: Review code changes for correctness, security, and maintainability.tools: Read, Grep, Globmodel: sonnet---You are a senior code reviewer. Focus on bugs, security issues, regressions, and missing tests.

Claude Code 的特点是：它把 subAgent 做成了可复用、可治理、可沉淀的专家角色。

比如团队可以沉淀这些 agent：

• code-reviewer
• security-reviewer
• test-fixer
• database-migration-reviewer
• frontend-accessibility-checker

这些 agent 可以跨项目复用，也可以通过项目级配置覆盖用户级配置。

Claude Code 还支持 foreground/background subAgent。foreground 会阻塞主会话，background 可以并发执行。

但它也有边界：普通 subAgent 主要是向主 Agent 汇报结果，它们之间不是天然的多人协作关系。

一句话总结：

Claude Code subAgent 更像“专家角色系统”，适合把团队经验固化成长期可复用的 Agent 配置。

四、Codex：subAgent 是“显式并行执行策略”

Codex 的 subAgent 设计更强调并行工作流。

它不像 Claude Code 那样主要围绕“专家人格库”展开，而是更关注：

• 哪些任务可以并行？
• 哪些任务应该交给 worker？
• 哪些任务适合 explorer？
• 主 Agent 什么时候等待结果？
• 多个 Agent 的结果如何汇总？

Codex 里常见的内置角色包括：

角色	适合任务
explorer	快速调查代码库、回答具体代码问题
worker	修改代码、实现功能、修复问题
default	通用任务

Codex 的一个关键原则是：只有用户明确要求时，Codex 才会 spawn subagent。

也就是说，它不是随时自动开一堆 agent，而是更偏“显式编排”。

Codex 当前内置 default、worker、explorer 三类 agent。自定义 agent 使用 TOML 文件，位置通常是：

.codex/agents/~/.codex/agents/

每个自定义 agent 至少需要 name、description、developer_instructions，也可以覆盖模型、reasoning effort、sandbox、MCP 和 skills 等配置。

比如你可以这样使用：

请并行启动几个 agent：1. 一个 explorer 调查认证模块的数据流2. 一个 explorer 查看测试覆盖情况3. 一个 worker 修复登录失败的问题

Codex 很适合这类场景：

• 大型代码库调研
• PR review
• 多模块并行改造
• 一个 Agent 实现，另一个 Agent 并行验证
• 多个独立假设同时排查

它的工程味更强：当你让多个 worker 同时改代码时，最好明确文件所有权。

比如：

Worker A 只负责 auth/ 目录。Worker B 只负责 tests/auth/ 目录。不要互相回滚对方改动。

这类约束对于多 Agent 编码非常重要。否则多个 Agent 同时修改同一个文件，很容易互相覆盖。

一句话总结：

Codex subAgent 更像“并行执行框架”，适合把复杂任务拆成多个互不阻塞的执行分支。

五、OpenClaw：subAgent 是“后台 Agent session”

OpenClaw 的 subAgent 设计更偏运行时系统。

它关注的不是“专家角色是否优雅”，而是：

• 如何启动一个后台 Agent？
• 如何给它分配队列？
• 如何查看状态？
• 如何发消息？
• 如何停止？
• 如何控制并发？
• 如何处理嵌套？

OpenClaw 的 subAgent 更像一个后台 session。

它可以非阻塞运行，主会话不用一直等待。你可以继续做别的事，然后再查看 subAgent 的状态、日志或结果。

这种设计非常适合长任务，比如：

• 后台跑大规模代码扫描
• 长时间测试
• 多个 issue 并行修复
• 让一个 Agent 持续跟进某个任务
• 主 Agent 继续做调度和决策

OpenClaw 还提供了比较明显的运维控制能力，比如：

• 查看 subAgent 信息
• 查看日志
• 给 subAgent 发消息
• kill subAgent
• 控制并发队列
• 设置嵌套深度

它的嵌套默认比较克制：maxSpawnDepth 默认是 1，也就是普通 sub-agent 默认不能继续无限扩散；如果要做 orchestrator 模式，可以把深度调到 2。每个 agent session 也有活跃子任务数量上限，默认是 5，用来避免失控 fan-out。

所以 OpenClaw 的 subAgent 更像是：

Agent runtime + session manager + task queue

而不是单纯的“专家 prompt”。

一句话总结：

OpenClaw subAgent 更像“后台任务系统”，适合需要运行时管理、队列控制和长期任务跟踪的多 Agent 工作流。

六、Gemini CLI：subAgent 是“Agent as Tool”

Gemini CLI 的 subAgent 设计很有特点：它更接近 agent-as-tool。

也就是说，subAgent 会作为一个工具暴露给主 Agent。主 Agent 在需要时调用这个工具。

Gemini CLI 有内置 subAgent，比如：

• codebase_investigator
• cli_help
• generalist
• 实验性的 browser_agent

同时也支持自定义本地 agent 文件，通常放在：

.gemini/agents/~/.gemini/agents/

它和 Claude Code 一样，也支持通过 Markdown + YAML frontmatter 描述 agent。

Gemini CLI 的自定义 agent 可以声明 kind: local，并通过 tools 收窄工具范围；远程 subAgent 则使用 kind: remote，通过 A2A agent card 接入远程 agent。

但 Gemini CLI 的抽象更像：

主 Agent 拥有一组工具，其中某些工具本身就是 Agent。

这带来一个好处：工具边界比较清晰。

主 Agent 可以判断什么时候调用 codebase_investigator，也可以通过 @subagent 显式调用某个 agent。

Gemini CLI 还有一个很值得关注的方向：remote subagents / A2A。也就是 subAgent 不一定只在本地进程中，它可以通过 Agent-to-Agent 协议连接远程 Agent。

这让 Gemini CLI 的多 Agent 设计天然适合跨进程、跨服务协作。

一句话总结：

Gemini CLI subAgent 更像“可被主 Agent 调用的专家工具”，并且在远程 Agent 协作上留了很大空间。

七、四者对比：同样叫 subAgent，抽象层不同

把它们放在一起看，会发现差异很明显。

维度	Claude Code	Codex	OpenClaw	Gemini CLI
核心抽象	专家角色	并行工作流	后台 session	Agent 工具
配置方式	Markdown + YAML	TOML / 内置角色 / 调度 API	运行时配置 + session 管理	Markdown + YAML
触发方式	自动或显式调用	偏显式 spawn	显式后台启动	自动或 `@agent`
主要优势	可复用、可治理	并行探索和实现	运行时管理强	工具化和远程协作
典型场景	code review、安全审查、测试修复	多分支调研、并行实现	后台长任务、队列管理	专家工具调用、A2A 协作
协作方式	主要回报给主 Agent	主 Agent 编排汇总	主 session 管理多个后台 session	主 Agent 调用子 Agent 工具
成本特点	中等	取决于并行数量	取决于后台 session 数	取决于工具调用次数

如果用一句话区分：

• Claude Code：把专家沉淀下来
• Codex：把任务并行拆出去
• OpenClaw：把 Agent 当后台任务管起来
• Gemini CLI：把 Agent 当工具调用起来

八、先和 Agent teams 划清边界

这里需要先划清一个边界：Claude Code 的 Agent teams 是更上层的多 Agent 协作形态，而本篇讨论的 subAgent 仍然是“单会话内的任务委派”。

前者关注的是队员之间如何直接通信、如何共享任务看板、如何做横向协作；后者关注的是如何把某个局部任务拆给一个专门的专家去完成。

如果你已经读过我上一篇关于 Claude Code Agent teams 的文章，可以把本文理解为它的前置概念补充：Agent teams 讨论的是“多个 Agent 怎么协作”，而本文讨论的是“不同工具如何定义和调用 subAgent”。

九、不同场景怎么选？

可以用一个简单判断标准：任务越明确，越适合轻量 subAgent；任务越长、越需要运行时管理，越适合后台 session；任务越依赖远程协作，越适合 agent-as-tool 或 A2A。

Claude Code subAgent

如果你希望把团队经验沉淀成可复用角色，优先考虑 Claude Code subAgent。

典型场景：

• code review
• security review
• test fixer
• database migration reviewer
• frontend accessibility checker

请让 code-reviewer 检查这次改动有没有 bug。

Codex subAgent

如果你要把一个复杂任务拆成多个并行分支，优先考虑 Codex subAgent。

典型场景：

• 多个 explorer 并行读不同模块
• 一个 worker 改实现，另一个 worker 补测试
• 一个 agent 实现，另一个 agent 并行 review
• 多个假设同时排查

请并行启动两个 explorer：一个调查订单状态流转，一个调查支付回调链路。最后由主 agent 汇总结论。

OpenClaw subAgent

如果任务需要长期后台运行、状态查看、日志追踪、并发队列或 kill/send 这类运维控制，优先考虑 OpenClaw subAgent。

典型场景：

• 后台跑全仓库扫描
• 同时处理多个 issue
• 长时间测试和日志跟踪
• 主会话继续调度，后台 agent 持续执行

启动一个后台 subagent 跑全量测试，并在完成后汇报失败用例摘要。

Gemini CLI subAgent

如果你更希望把专家 agent 当成工具来调用，或者希望连接远程 Agent，Gemini CLI 的 subAgent/A2A 思路更合适。

典型场景：

• 主 Agent 自动调用 codebase_investigator
• 用 @subagent 显式指定专家
• 将远程 agent 作为能力接入 CLI
• 把浏览器、代码库分析、CLI 帮助拆成独立 agent 工具

十、多 Agent 编程的几个实践建议

1. 不要为了“多”而多

多 Agent 最大的问题是协调成本。

如果任务本来就是线性的，比如：

读一个文件 -> 改一行代码 -> 跑一个测试

这时开多个 Agent 只会浪费 token。

多 Agent 适合的是“可以并行探索”的任务。

2. 明确文件所有权

如果多个 Agent 要改代码，一定要提前说清楚谁负责哪些文件。

比如：

Agent A 只负责 src/auth/。Agent B 只负责 tests/auth/。Agent C 只负责文档，不改实现代码。

否则多个 Agent 同时改同一个文件，容易产生冲突。

3. 主 Agent 要做收敛，不要只做转发

多 Agent 的价值不只是并行跑任务，而是最后要有一个高质量综合判断。

主 Agent 应该做这些事：

• 比较各 Agent 的结论
• 找出冲突点
• 判断证据质量
• 决定最终方案
• 控制后续修改范围

否则多 Agent 只是把噪声放大。

4. 权限要尽量收窄

不要默认给所有 subAgent 全量工具权限。

比如 code reviewer 可能只需要：

• Read
• Grep
• Glob

不一定需要 Bash，也不一定需要写文件权限。

测试修复 Agent 可能需要：

• Read
• Edit
• Bash

数据库审查 Agent 可能只应该有只读权限。

subAgent 的一个重要价值就是权限隔离。如果所有 Agent 都拿全权限，这个价值就被削弱了。

5. 长任务更适合后台 session

如果任务会跑很久，比如：

• 全仓库扫描
• 大规模测试
• 多模块迁移
• 多 issue 并行处理

这类任务更适合 OpenClaw 这种后台 session 模型。

如果只是一次性问答或局部审查，用普通 subAgent 更轻。

十一、我的判断：subAgent 会成为 AI Coding 工具的基础设施

从这些工具的设计可以看到一个趋势：

AI Coding 正在从“单个聪明助手”走向“可编排的 Agent 系统”。

过去我们主要关心：

这个模型会不会写代码？

现在更需要关心：

这个系统能不能拆任务？能不能隔离上下文？能不能控制权限？能不能并行执行？能不能汇总结论？能不能处理多个 Agent 之间的边界？

这也是为什么 subAgent 重要。

它不是一个简单功能，而是 AI Coding 工具走向工程化的基础抽象。

不同工具现在走了不同路线：

• Claude Code 在做专家角色
• Codex 在做显式并行编排
• OpenClaw 在做后台 session 和运行时管理
• Gemini CLI 在做 agent-as-tool 和远程 Agent 协作

短期看，这些设计会继续分化。

长期看，它们可能会收敛到几个共同能力：

1. Agent 配置标准化
1. 工具权限最小化
1. 上下文隔离
1. 多 Agent 通信
1. 任务队列和状态管理
1. 可观测性和成本控制
1. 人类审批与质量门禁

即将到来的 AI Coding 工具，可能不再只是一个聊天框，而是一个由多个专业 Agent 组成的工程协作环境。

假如你从2026年开始学大模型，按这个步骤走准能稳步进阶。

接下来告诉你一条最快的邪修路线，

3个月即可成为模型大师，薪资直接起飞。

阶段1:大模型基础

阶段2:RAG应用开发工程

阶段3:大模型Agent应用架构

阶段4:大模型微调与私有化部署

配套文档资源+全套AI 大模型学习资料，朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】👇👇
在这里插入图片描述

配套文档资源+全套AI 大模型学习资料，朋友们如果需要可以微信扫描下方二维码免费领取【`保证100%免费`】👇👇

在这里插入图片描述

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

【小白也能轻松用】个人办公AI搭建，OpenClaw零基础零代码快速部署（含最新安装包）

智能体开发者社区

别再手动编译了，用 Docker 在 Instinct GPU 上三分钟跑通 vLLM

本文详解如何利用 Docker 在 AMD Instinct GPU 上三分钟快速部署 vLLM。借助 ROCm 7.x 官方预构建镜像，开发者可彻底告别手动编译地狱，轻松实现 Llama 3.1 等模型的高效推理。文章涵盖 BF16/FP8 精度配置及性能实测，助您大幅降低环境配置成本，加速大模型服务上线。