哎,我经常同时跑五六个agent, 发觉自己脑子在切换这五六个上下文的时候经常短路,我的前额叶的能力成为了我在AI时代的短板
OpenAI 有一句话,我觉得比所有 benchmark 都重要。
他们在介绍 Codex 子智能体系统的时候说:
瓶颈已经不再是 agent 能干什么,而是人类怎么指挥和监督更多的 agent。
这句话出来,整个讨论框架就变了。
现在的情况是这样的。
Codex 在 2026 年 3 月正式推出了子智能体功能,一个 manager agent 可以同时调度最多 8 个 agent 并行运作。
Claude Code 则走 Agent Teams 路线,子 agent 共享任务列表,可以互发消息,并行推进有依赖关系的任务。
两家都在往同一个方向走:
让一个人可以同时管理一支 agent 团队,而不是和一个 agent 挨条聊天。
已经有 YC 系的创业公司在跑通宵开发循环:
子 agent 整夜处理测试和功能任务,早上工程师来 review pull request。
这个场景成立了,不是实验室里的成立,是真实公司在用。
但同时,有一个数字很扎人。
2026 年的 AI 编程助手实际带来的生产力提升是 20-30%,集中在特定工作流,远不是 2023 年承诺的 10 倍。
这两件事同时为真:
agent 可以跑一整晚,但整体生产力提升是 20-30%。
为什么?
因为瓶颈根本没在模型上。
瓶颈在人。
在你怎么分解任务,怎么设验收标准,怎么设计 agent 的边界,怎么在早上看懂它到底干了什么。
子 agent 的核心价值不是速度,而是保护主线程不被上下文污染,每个子任务有自己独立的上下文窗口,不会把其他任务的噪音带进来。
这个设计本质上是在模拟一件事:
一家公司里不同职能的人,为什么不能共用同一个脑子。
子 agent 的问题不是打开更多线程,而是当你的任务拆分不清晰、边界模糊、写入范围冲突的时候,并行只会放大混乱。
所以你会发现,现在真正有差异化的不是谁的 benchmark 更高。
Claude Code 的护城河不只是模型质量,而是围绕模型的编排层:
项目记忆、工具访问、MCP、子 agent、hook、工作流。
工具在收敛,护城河在管理层。
这就是我一直在说的薄壳公司的内核。
薄,指的是执行层可以极度精简,agent 来扛。
但壳的结构要有:
目标契约、验收标准、任务分解、恢复机制,一个都不能省。
省掉的结果不是便宜,是你早上来了,看着一堆 pull request,不知道该 merge 哪个,不知道哪里跑偏了,不知道从哪里重新接。
人类开发者的核心竞争力,正在从代码实现(How)回归到问题定义(What)和价值判断(Why)。
这不是一句鸡汤。
这是当 agent 可以并行跑 8 条线的时候,你唯一剩下的不可替代性。
你管的不是代码。
你管的是一支会干活但不会判断价值的团队。
当然这份工作,从来都不容易。