提示词工程已死,Loop Engineering 来了:AI 编码智能体协作新范式
从手动提示到自动化循环,重新定义人与AI的协作方式
提示词工程已死,Loop Engineering 来了:AI 编码智能体协作新范式
从手动提示到自动化循环,重新定义人与AI的协作方式
循环工程(Loop Engineering)是AI编码智能体协作的全新范式,核心是用自动化循环体系替代手动向智能体下发指令。工程师的工作重心从编写提示词转变为设计整套运行循环。本文详细拆解循环工程的六大核心模块——自动化调度、工作树、项目技能、插件连接器、子智能体和持久化记忆,并结合Claude Code和Codex的实际应用,分析其优势、成本与边界,帮助开发者掌握这一未来人机协作的主流方式。
引言:从提示词到循环,范式正在转移
过去两年,使用 AI 编码智能体的主流方式是:你写一段提示词,它返回一段代码;你发现不对,再补一句,它再改。整个过程像一场永无止境的对话,人始终是那个“推一下动一下”的驱动者。但如今,一批顶尖开发者正在转向一种全新的模式——循环工程(Loop Engineering)。
Claude Code 负责人 Boris Cherny 直言:“我不再手动提示 Claude 了。我有 loop 在跑,它们负责提示 Claude、决定下一步做什么。我的工作就是写循环。”谷歌云 AI 总监 Addy Osmani 也撰文指出,这种转变比过去的提示词工程更复杂,但也更强大。
循环工程的核心思想是:不再手动一轮一轮指挥 Agent,而是设计一个能自动发现任务、分配执行、检查结果、记录状态并决定下一步的系统。人的角色从“执行者”退后为“调度者”,从“写提示词”升级为“设计循环”。
本文将从概念、核心模块、实际应用、成本边界和 FAQ 五个维度,为你全面解析这一新范式。如果你想深入了解 Agent 的底层原理,可参考 AI Agent 与多智能体。
什么是循环工程?
循环工程,简单说就是:你定义目标,让系统自动驱动 Agent 迭代完成。它不是简单的定时任务,而是一个闭环系统,具备以下特征:
Addy Osmani 打过一个比方:你可以选择当一名“全程在场的工程师”,也可以当一名“只管按启动键的人”。Loop Engineering 让你成为后者,但前提是你得先设计好那个“启动后自动运转的系统”。
循环工程的六大核心模块
一个完整的循环系统由五个功能模块加一个记忆模块构成。Claude Code 和 Codex 都已内置这些能力,只是命名略有差异。
1. 自动化调度(Automations):循环的心跳
自动化是区分“一次手动运行”和“持续循环”的关键。它让 Agent 能按计划或事件自动启动。
/loop 指令周期性运行提示或命令,支持 cron 定时任务,也可用 hooks 在 Agent 生命周期节点触发脚本。还能推送到 GitHub Actions 实现离线运行。两者都提供 /goal 原语:设定一个可验证的目标(如“test/auth 下所有测试通过”),Agent 会持续工作直到条件满足,每轮结束后由独立小模型检查是否完成,而非执行者自评。
2. 工作树(Worktrees):并行不冲突的基石
当多个 Agent 同时编辑代码时,文件冲突是常见问题。git worktree 提供了解决方案:每个 Agent 拥有独立的工作目录和分支,共享同一仓库历史,但物理隔离。
--worktree 标志或 isolation: worktree 配置,为每个子 Agent 分配独立 checkout,用完自动清理。工作树解决了机械冲突,但别忘了,人工审核能力才是真正的瓶颈——你能同时运行多少 Agent,取决于你一天能认真 review 多少产出。
3. 项目技能(Skills):让 Agent 不再“失忆”
每次新会话,Agent 都像新同事一样对项目一无所知。技能模块将项目知识固化到外部文件,避免重复解释。
SKILL.md(指令和元数据),以及可选脚本、资源文件。$ 或 /skills 调用,也可自动匹配任务描述。技能是化解“意图债务”的关键——Agent 每次冷启动都会凭猜测补全规则,而技能把规则写死,让循环每轮都能站在前一轮的肩膀上。
4. 插件与连接器(Plugins & Connectors):打通工具链
只能读写本地文件的循环是“半封闭”的。基于 MCP 协议的连接器,让 Agent 能访问 issue 系统、数据库、CI、Slack 等外部工具。
有了连接器,Agent 不再只是“说”——它可以直接创建 PR、关联工单、通知频道,真正融入研发流程。
5. 子智能体(Sub-agents):执行与校验分离
这是循环中最有价值的设计。写代码的 Agent 很难发现自己的错误,因此需要独立的校验 Agent。
.codex/agents/ 下用 TOML 文件定义子 Agent,可指定模型和推理强度(如安全审计用强模型,检索用轻模型)。.claude/agents/ 中配置,支持多角色团队(如一个探索需求、一个写代码、一个做测试)。/goal 指令底层也用了这一逻辑:由独立模型判断任务是否完成,避免执行者自我判定。
6. 持久化记忆(Memory):让循环不“断片”
Agent 在会话之间会遗忘一切,因此记忆必须存在磁盘上,而非上下文里。一个 Markdown 文件、Linear 看板或数据库记录,都能作为载体。
一个完整的循环运行示例
假设你有一个 GitHub 仓库,希望自动维护。以下是一个典型循环:
github-project-triage 技能分类问题——自动修复、需人工决策、忽略。LOOP_MEMORY.md,供下次参考。整个过程无需人工逐轮提示,你只需在每天结束时 review 自动生成的 PR 列表。
成本与边界:不是银弹
循环工程并非万能,它有三个显著局限:
1. Token 成本爆炸
循环会反复读取上下文、试错、验证,甚至多个 Agent 并行,token 消耗远超单次对话。如果任务不值得反复跑,或者没有稳定的反馈信号,循环可能还没帮你省时间,先把成本烧光。
2. 人工审核不可缺失
AI 说“完成了”,不等于真没问题;说“测试通过了”,不等于业务逻辑正确。无人盯着的循环会无人盯着地犯错。必须保留人工最终审核权。
3. 理解债务与认知屈服
长期依赖自动生成代码,开发者可能逐渐失去对项目的深入理解。代码越堆越多,自己真正理解的却越来越少。Addy Osmani 警告:AI 干得越多,人越容易不再去看过程。
因此,循环的用法不是把人拿掉,而是把人从重复劳动中抽离,但把判断、验收和刹车权留在自己手里。
哪些工作适合用循环?
只要任务重复、流程稳定、结果部分可验证,循环就有落地空间。
总结:从提示词工程师到循环设计师
循环工程不是新瓶装旧酒,它代表了人机协作的又一次升级。过去大家比的是谁的提示词写得好;接下来比的可能是谁的 loop 设计得好——怎么调度、怎么验证、怎么记录、什么时候该停。
如果你想进一步学习如何设计高效的 Agent 工作流,可参考 AI 工作流编排。如果你对 Agent 的底层机制感兴趣,AI Agent 与多智能体 提供了更系统的解读。
最后,记住 Addy Osmani 那句话:这件事不会让你的工作变简单,它只是把发力点挪了个位置。你可以选择做那个始终在场、清楚每一步在发生什么的工程师,也可以做那个只负责按下开始键、然后看着代码越堆越多的人。
选择权在你。
FAQ
Q1: 循环工程和传统的提示词工程有什么区别? A1: 提示词工程关注如何写一句好的提示词来驱动 AI 完成单次任务;循环工程则关注如何设计一个自动化系统,让系统自主发现任务、分配执行、校验结果并持续迭代。前者是“手动挡”,后者是“自动驾驶”。
Q2: 循环工程需要哪些工具支持? A2: 目前 Claude Code 和 OpenAI Codex 已内置完整支持,包括自动化调度、工作树、技能、插件/连接器和子智能体。你也可以用 bash 脚本 + MCP 协议自建,但工具化方案更便捷。
Q3: 循环工程会导致开发者失业吗? A3: 不会。循环工程将开发者从重复劳动中解放,但要求更高的系统设计能力。开发者需要掌握 Agent 行为、工作流编排、质量控制和成本优化等新技能,角色从“执行者”转变为“调度者”。
Q4: 循环工程适合所有类型的项目吗? A4: 不适合一次性、低价值或结果无法自动验证的任务。最适合的是重复性高、流程稳定、有明确反馈信号(如测试通过/失败)的场景,如代码维护、数据 pipeline、内容聚合等。
Q5: 如何开始实践循环工程?
A5: 从一个小任务开始,比如用 Claude Code 的 /goal 指令让 Agent 自动修复一个已知 bug,或设置一个每日自动扫描 CI 失败的循环。逐步增加模块,如加入子 Agent 做代码审查、用 MCP 连接 issue 系统。
相关教程
深入解析 MCP 协议如何与 CLI、Skills 结合,打造实时、可控的 Agent 数据交互引擎
拓扑优化、蜂群协同与经济激励:三种前沿方法让固定工作流的多智能体系统性能持续提升
系统梳理 Harness 概念、设计原则与落地经验,帮助读者构建生产级 Agent 运行环境
系统梳理 AI Agent 面临的主要安全威胁及防御策略,帮助开发者构建安全可靠的智能体系统
系统剖析生产环境中智能体六大失效原因,并覆盖缓存碰撞、提示注入等前沿攻击的防御方法
积木、建造者、大脑的关系