提示词工程已死,Loop Engineering 来了:AI 编码智能体协作新范式

从手动提示到自动化循环,重新定义人与AI的协作方式

返回教程列表
进阶25 分钟

提示词工程已死,Loop Engineering 来了:AI 编码智能体协作新范式

从手动提示到自动化循环,重新定义人与AI的协作方式

循环工程(Loop Engineering)是AI编码智能体协作的全新范式,核心是用自动化循环体系替代手动向智能体下发指令。工程师的工作重心从编写提示词转变为设计整套运行循环。本文详细拆解循环工程的六大核心模块——自动化调度、工作树、项目技能、插件连接器、子智能体和持久化记忆,并结合Claude Code和Codex的实际应用,分析其优势、成本与边界,帮助开发者掌握这一未来人机协作的主流方式。

引言:从提示词到循环,范式正在转移

过去两年,使用 AI 编码智能体的主流方式是:你写一段提示词,它返回一段代码;你发现不对,再补一句,它再改。整个过程像一场永无止境的对话,人始终是那个“推一下动一下”的驱动者。但如今,一批顶尖开发者正在转向一种全新的模式——循环工程(Loop Engineering)

Claude Code 负责人 Boris Cherny 直言:“我不再手动提示 Claude 了。我有 loop 在跑,它们负责提示 Claude、决定下一步做什么。我的工作就是写循环。”谷歌云 AI 总监 Addy Osmani 也撰文指出,这种转变比过去的提示词工程更复杂,但也更强大。

循环工程的核心思想是:不再手动一轮一轮指挥 Agent,而是设计一个能自动发现任务、分配执行、检查结果、记录状态并决定下一步的系统。人的角色从“执行者”退后为“调度者”,从“写提示词”升级为“设计循环”。

本文将从概念、核心模块、实际应用、成本边界和 FAQ 五个维度,为你全面解析这一新范式。如果你想深入了解 Agent 的底层原理,可参考 AI Agent 与多智能体

什么是循环工程?

循环工程,简单说就是:你定义目标,让系统自动驱动 Agent 迭代完成。它不是简单的定时任务,而是一个闭环系统,具备以下特征:

  • 自主启动:按时间、事件或条件触发,无需人工干预。
  • 任务发现与分配:自动扫描问题、分类、分配给合适的子 Agent。
  • 执行与验证分离:写代码的 Agent 和检查代码的 Agent 各司其职。
  • 状态持久化:跨会话记忆,避免每次从头开始。
  • 自我终止:当目标达成或超出处理范围时,主动停止或升级给人。
  • Addy Osmani 打过一个比方:你可以选择当一名“全程在场的工程师”,也可以当一名“只管按启动键的人”。Loop Engineering 让你成为后者,但前提是你得先设计好那个“启动后自动运转的系统”。

    循环工程的六大核心模块

    一个完整的循环系统由五个功能模块加一个记忆模块构成。Claude Code 和 Codex 都已内置这些能力,只是命名略有差异。

    1. 自动化调度(Automations):循环的心跳

    自动化是区分“一次手动运行”和“持续循环”的关键。它让 Agent 能按计划或事件自动启动。

  • Codex:在 Automations 面板创建任务,设置项目、提示词、运行频率(如每5分钟、每小时),可选择本地或后台 worktree 运行。有发现的结果进入 Triage 收件箱,无异常的自动归档。
  • Claude Code:通过 /loop 指令周期性运行提示或命令,支持 cron 定时任务,也可用 hooks 在 Agent 生命周期节点触发脚本。还能推送到 GitHub Actions 实现离线运行。
  • 两者都提供 /goal 原语:设定一个可验证的目标(如“test/auth 下所有测试通过”),Agent 会持续工作直到条件满足,每轮结束后由独立小模型检查是否完成,而非执行者自评。

    2. 工作树(Worktrees):并行不冲突的基石

    当多个 Agent 同时编辑代码时,文件冲突是常见问题。git worktree 提供了解决方案:每个 Agent 拥有独立的工作目录和分支,共享同一仓库历史,但物理隔离。

  • Codex:原生支持多线程 worktree,互不干扰。
  • Claude Code:通过 --worktree 标志或 isolation: worktree 配置,为每个子 Agent 分配独立 checkout,用完自动清理。
  • 工作树解决了机械冲突,但别忘了,人工审核能力才是真正的瓶颈——你能同时运行多少 Agent,取决于你一天能认真 review 多少产出。

    3. 项目技能(Skills):让 Agent 不再“失忆”

    每次新会话,Agent 都像新同事一样对项目一无所知。技能模块将项目知识固化到外部文件,避免重复解释。

  • 格式统一:一个文件夹内含 SKILL.md(指令和元数据),以及可选脚本、资源文件。
  • Codex 通过 $/skills 调用,也可自动匹配任务描述。
  • Claude Code 同样支持,技能可跨会话复用。
  • 技能是化解“意图债务”的关键——Agent 每次冷启动都会凭猜测补全规则,而技能把规则写死,让循环每轮都能站在前一轮的肩膀上。

    4. 插件与连接器(Plugins & Connectors):打通工具链

    只能读写本地文件的循环是“半封闭”的。基于 MCP 协议的连接器,让 Agent 能访问 issue 系统、数据库、CI、Slack 等外部工具。

  • Codex 和 Claude Code 都支持 MCP,连接器可互通。
  • 插件将技能和连接器打包,方便团队一键安装。
  • 有了连接器,Agent 不再只是“说”——它可以直接创建 PR、关联工单、通知频道,真正融入研发流程。

    5. 子智能体(Sub-agents):执行与校验分离

    这是循环中最有价值的设计。写代码的 Agent 很难发现自己的错误,因此需要独立的校验 Agent。

  • Codex:在 .codex/agents/ 下用 TOML 文件定义子 Agent,可指定模型和推理强度(如安全审计用强模型,检索用轻模型)。
  • Claude Code:在 .claude/agents/ 中配置,支持多角色团队(如一个探索需求、一个写代码、一个做测试)。
  • /goal 指令底层也用了这一逻辑:由独立模型判断任务是否完成,避免执行者自我判定。

    6. 持久化记忆(Memory):让循环不“断片”

    Agent 在会话之间会遗忘一切,因此记忆必须存在磁盘上,而非上下文里。一个 Markdown 文件、Linear 看板或数据库记录,都能作为载体。

  • 记录已完成的任务、失败的原因、待办事项。
  • 每次循环启动时读取,结束后更新。
  • 模型会忘,但仓库不会。
  • 一个完整的循环运行示例

    假设你有一个 GitHub 仓库,希望自动维护。以下是一个典型循环:

  • 自动调度:每5分钟触发一次,扫描新 issue、PR、CI 失败。
  • 技能调用:用 github-project-triage 技能分类问题——自动修复、需人工决策、忽略。
  • 工作树隔离:为每个需要修复的问题创建独立 worktree。
  • 子智能体执行:一个 Agent 写修复代码,另一个 Agent 对照技能和测试用例审核。
  • 连接器操作:通过 MCP 创建 PR、关联 issue、在 Slack 通知。
  • 记忆更新:将本次执行结果写入 LOOP_MEMORY.md,供下次参考。
  • 整个过程无需人工逐轮提示,你只需在每天结束时 review 自动生成的 PR 列表。

    成本与边界:不是银弹

    循环工程并非万能,它有三个显著局限:

    1. Token 成本爆炸

    循环会反复读取上下文、试错、验证,甚至多个 Agent 并行,token 消耗远超单次对话。如果任务不值得反复跑,或者没有稳定的反馈信号,循环可能还没帮你省时间,先把成本烧光。

    2. 人工审核不可缺失

    AI 说“完成了”,不等于真没问题;说“测试通过了”,不等于业务逻辑正确。无人盯着的循环会无人盯着地犯错。必须保留人工最终审核权。

    3. 理解债务与认知屈服

    长期依赖自动生成代码,开发者可能逐渐失去对项目的深入理解。代码越堆越多,自己真正理解的却越来越少。Addy Osmani 警告:AI 干得越多,人越容易不再去看过程

    因此,循环的用法不是把人拿掉,而是把人从重复劳动中抽离,但把判断、验收和刹车权留在自己手里。

    哪些工作适合用循环?

  • 代码维护:自动扫描 issue、修复 bug、跑测试、开 PR。
  • 内容运营:定时抓取新闻源,生成选题清单。
  • 数据分析:定期拉取数据、生成报表、发送通知。
  • 客服系统:自动分类工单、回复常见问题、升级复杂问题。
  • 只要任务重复、流程稳定、结果部分可验证,循环就有落地空间。

    总结:从提示词工程师到循环设计师

    循环工程不是新瓶装旧酒,它代表了人机协作的又一次升级。过去大家比的是谁的提示词写得好;接下来比的可能是谁的 loop 设计得好——怎么调度、怎么验证、怎么记录、什么时候该停。

    如果你想进一步学习如何设计高效的 Agent 工作流,可参考 AI 工作流编排。如果你对 Agent 的底层机制感兴趣,AI Agent 与多智能体 提供了更系统的解读。

    最后,记住 Addy Osmani 那句话:这件事不会让你的工作变简单,它只是把发力点挪了个位置。你可以选择做那个始终在场、清楚每一步在发生什么的工程师,也可以做那个只负责按下开始键、然后看着代码越堆越多的人。

    选择权在你。

    FAQ

    Q1: 循环工程和传统的提示词工程有什么区别? A1: 提示词工程关注如何写一句好的提示词来驱动 AI 完成单次任务;循环工程则关注如何设计一个自动化系统,让系统自主发现任务、分配执行、校验结果并持续迭代。前者是“手动挡”,后者是“自动驾驶”。

    Q2: 循环工程需要哪些工具支持? A2: 目前 Claude Code 和 OpenAI Codex 已内置完整支持,包括自动化调度、工作树、技能、插件/连接器和子智能体。你也可以用 bash 脚本 + MCP 协议自建,但工具化方案更便捷。

    Q3: 循环工程会导致开发者失业吗? A3: 不会。循环工程将开发者从重复劳动中解放,但要求更高的系统设计能力。开发者需要掌握 Agent 行为、工作流编排、质量控制和成本优化等新技能,角色从“执行者”转变为“调度者”。

    Q4: 循环工程适合所有类型的项目吗? A4: 不适合一次性、低价值或结果无法自动验证的任务。最适合的是重复性高、流程稳定、有明确反馈信号(如测试通过/失败)的场景,如代码维护、数据 pipeline、内容聚合等。

    Q5: 如何开始实践循环工程? A5: 从一个小任务开始,比如用 Claude Code 的 /goal 指令让 Agent 自动修复一个已知 bug,或设置一个每日自动扫描 CI 失败的循环。逐步增加模块,如加入子 Agent 做代码审查、用 MCP 连接 issue 系统。