别再写 Prompt 了，你的 AI 正在等一个它自己能跑的系统

Loop Engineering AI Agent Claude Code 循环工程自动化

发布于 2026-07-02 09:41:45 5 次浏览

别再写 Prompt 了，你的 AI 正在等一个它自己能跑的系统

一个编剧写完剧本，不会留在片场盯每一台摄影机。

但今天大部分人和 AI 的关系，恰恰就是这个——你写"剧本"（Prompt），然后全程守在片场，盯着每一帧拍摄。AI 出错你纠正，AI 偏了你拉回来，一轮又一轮，你在片场的时间比 AI 干活的时间还长。

Boris Cherny，Claude Code 的创造者，今年 6 月说了一句话：**"我不再给 Claude 写 Prompt 了。我有循环在跑，它们替我去 Prompt Claude。"**

这句话背后是一个正在发生的范式迁移：从 Prompt Engineering（你写指令）到 Loop Engineering（你设计系统）。不是 AI 变聪明了，是你的角色变了。

从"写台词"到"搭片场"

理解这个转变，最简单的方式是看 Token 消耗的量级变化：

阶段	你的角色	Token 量级
Prompt Engineering	全程操作员	百~千
Context Engineering	信息管道设计师	千~万
Harness Engineering	系统搭建者，偶尔介入	万~十万
Loop Engineering	循环设计者，系统自己跑	十万~持续运行

每一个阶段都不是替代上一个，而是在上面叠加。Prompt 你还是要写，但不再是你手动一轮一轮喂——一个自动运行的循环帮你喂。

这个循环的核心组件有五个加一个：

心跳（Heartbeat）：定时触发器。不是你去查，是系统到点自己醒
工作树（Worktrees）：并行隔离区。多个 Agent 同时干活不会打架
技能（Skills）：持久化的规则文件。Agent 随时调用，不用你每次重说
连接器（Connectors）：通往外界的管道。搜索、API、数据库——Agent 自己能碰
验证器（Verifier）：独立的裁判。写代码的 Agent 和审代码的 Agent 必须不是同一个
记忆脊柱（Memory Spine）：对话之外的状态持久化。防止长周期任务中 Agent 遗忘

五个组件拼出一个能自己转的系统，记忆脊柱是串起一切的中枢神经。

三个场景，看循环怎么跑

场景一：库存监控——从"你去看"到"它替你看"

你想抢一款新手机，以前是每天刷十次页面。Loop Engineering 的做法是：设一个心跳每小时触发，目标定义为"按钮不再显示 Out of Stock 且价格低于预算"，记忆脊柱记录上次观察到的状态——库存没变就不报，变了才通知你。

AI 从"回答问题的工具"变成了"监控局势的哨兵"。

场景二：全网商机扫描——从"你去找"到"它替你筛"

自动扫描 Reddit、X 等平台，寻找提到"支持团队过载"或"寻找 AI 顾问"的帖子。技能组件预设评分规则（1-10 分质量分级），连接器通过 MCP 协议拉数据。人类准入点（Human Gate）：AI 只起草私信，绝不自动发送——声誉保护。

在你还没开始搜索之前，AI 已经完成需求挖掘和初稿准备。

场景三：PR 自动修复——从"你修 Bug"到"它替你值班"

GitHub 上 PR 测试失败，AI 自动修复。关键设计：为每个修复任务开独立工作树分支，防止多个 Agent 冲突。修复完由另一个独立模型运行测试验证——写代码的不能既当选手又当裁判。测试不过，报错信息反馈回 LLM，自我修正，循环直到通过。

Boris Cherny 说，这种模式让他休假时也有 Agent 自动处理 PR。

有人已经跑到了极端

Steve Yegge（前 Google 工程师）搭了一个叫 Gas Town 的系统——同时跑 20-30 个 Claude Code 实例，由一个"Mayor"Agent 统一调度，"Polecats"做具体执行，"Witnesses"监控卡死的 Agent，所有状态存在 Git 里——崩溃也不丢进度。

他靠这套系统一个月提交了 4 万行代码、100+ PR。代价呢？40 个 Claude Code Max 账号，月费数千美元。

这就是 Loop Engineering 的双面性：它确实能成倍放大产出，但放大器不挑方向——好的循环乘以好的工程师是核弹，坏的循环乘以坏的决策是绞肉机。

真正的工程含量不在"转起来"，在"不出轨"

Addy Osmani（Google Cloud AI 总监）提醒过一个冷峻的事实：一个循环要真的省钱，得同时满足四个条件，缺一个成本就大过收益——

这件事每周至少重复一次——循环的搭建成本靠反复运行摊平
结果能自动验证——有测试、有编译、有明确的对错判断
Token 预算扛得住浪费——循环一定会有空转和无效尝试
Agent 手上有高级工程师级别的工具——否则它连文件都改不对

两个最典型的翻车模式：

Overbaking（发酵过头）：目标设定模糊（如"让代码更好看"），AI 可能为了修一个小问题重构整个项目，产出一堆没人要的功能
Money Furnace（钱炉）：没有熔断机制，无人值守的循环可能数小时内烧掉数千万 Token

知乎上有人一句话总结到位：**"loop 是真东西，但大部分人现在还用不上。"** 这不是泼冷水，是帮你省下一次"搭了个寂寞"。

你的新角色：不是操作员，是系统架构师

Loop Engineering 标志着 AI 协作进入了"Deploy and Walk Away"的时代。

你的核心竞争力不再是写出巧妙的提示词，而是能精准定义三件事：

该观察什么？（心跳触发什么事件）
什么时候停止？（验证器如何判定目标达成）
出了岔子怎么办？（熔断机制在哪里）

这不是"AI 越来越强所以人可以躺平"的故事。模型的能力没有质的飞跃，变的是你愿意为它铺多厚的地基。

从编剧到片场总设计师，不是你离开了片场，是你在片场的位置变了。

参考来源：Addy Osmani《Loop Engineering》、Boris Cherny Claude Code 演讲、O'Reilly Radar、Steve Yegge Gas Town 项目、Cobus Greyling 博客

别再写 Prompt 了，你的 AI 正在等一个它自己能跑的系统

从"写台词"到"搭片场"

三个场景，看循环怎么跑

场景一：库存监控——从"你去看"到"它替你看"

场景二：全网商机扫描——从"你去找"到"它替你筛"

场景三：PR 自动修复——从"你修 Bug"到"它替你值班"

有人已经跑到了极端

真正的工程含量不在"转起来"，在"不出轨"

你的新角色：不是操作员，是系统架构师

评论