别再写 Prompt 了,你的 AI 正在等一个它自己能跑的系统
一个编剧写完剧本,不会留在片场盯每一台摄影机。
但今天大部分人和 AI 的关系,恰恰就是这个——你写"剧本"(Prompt),然后全程守在片场,盯着每一帧拍摄。AI 出错你纠正,AI 偏了你拉回来,一轮又一轮,你在片场的时间比 AI 干活的时间还长。
Boris Cherny,Claude Code 的创造者,今年 6 月说了一句话:**"我不再给 Claude 写 Prompt 了。我有循环在跑,它们替我去 Prompt Claude。"**
这句话背后是一个正在发生的范式迁移:从 Prompt Engineering(你写指令)到 Loop Engineering(你设计系统)。不是 AI 变聪明了,是你的角色变了。
从"写台词"到"搭片场"
理解这个转变,最简单的方式是看 Token 消耗的量级变化:
| 阶段 | 你的角色 | Token 量级 |
|---|---|---|
| Prompt Engineering | 全程操作员 | 百~千 |
| Context Engineering | 信息管道设计师 | 千~万 |
| Harness Engineering | 系统搭建者,偶尔介入 | 万~十万 |
| Loop Engineering | 循环设计者,系统自己跑 | 十万~持续运行 |
每一个阶段都不是替代上一个,而是在上面叠加。Prompt 你还是要写,但不再是你手动一轮一轮喂——一个自动运行的循环帮你喂。
这个循环的核心组件有五个加一个:
- 心跳(Heartbeat):定时触发器。不是你去查,是系统到点自己醒
- 工作树(Worktrees):并行隔离区。多个 Agent 同时干活不会打架
- 技能(Skills):持久化的规则文件。Agent 随时调用,不用你每次重说
- 连接器(Connectors):通往外界的管道。搜索、API、数据库——Agent 自己能碰
- 验证器(Verifier):独立的裁判。写代码的 Agent 和审代码的 Agent 必须不是同一个
- 记忆脊柱(Memory Spine):对话之外的状态持久化。防止长周期任务中 Agent 遗忘
五个组件拼出一个能自己转的系统,记忆脊柱是串起一切的中枢神经。
三个场景,看循环怎么跑
场景一:库存监控——从"你去看"到"它替你看"
你想抢一款新手机,以前是每天刷十次页面。Loop Engineering 的做法是:设一个心跳每小时触发,目标定义为"按钮不再显示 Out of Stock 且价格低于预算",记忆脊柱记录上次观察到的状态——库存没变就不报,变了才通知你。
AI 从"回答问题的工具"变成了"监控局势的哨兵"。
场景二:全网商机扫描——从"你去找"到"它替你筛"
自动扫描 Reddit、X 等平台,寻找提到"支持团队过载"或"寻找 AI 顾问"的帖子。技能组件预设评分规则(1-10 分质量分级),连接器通过 MCP 协议拉数据。人类准入点(Human Gate):AI 只起草私信,绝不自动发送——声誉保护。
在你还没开始搜索之前,AI 已经完成需求挖掘和初稿准备。
场景三:PR 自动修复——从"你修 Bug"到"它替你值班"
GitHub 上 PR 测试失败,AI 自动修复。关键设计:为每个修复任务开独立工作树分支,防止多个 Agent 冲突。修复完由另一个独立模型运行测试验证——写代码的不能既当选手又当裁判。测试不过,报错信息反馈回 LLM,自我修正,循环直到通过。
Boris Cherny 说,这种模式让他休假时也有 Agent 自动处理 PR。
有人已经跑到了极端
Steve Yegge(前 Google 工程师)搭了一个叫 Gas Town 的系统——同时跑 20-30 个 Claude Code 实例,由一个"Mayor"Agent 统一调度,"Polecats"做具体执行,"Witnesses"监控卡死的 Agent,所有状态存在 Git 里——崩溃也不丢进度。
他靠这套系统一个月提交了 4 万行代码、100+ PR。代价呢?40 个 Claude Code Max 账号,月费数千美元。
这就是 Loop Engineering 的双面性:它确实能成倍放大产出,但放大器不挑方向——好的循环乘以好的工程师是核弹,坏的循环乘以坏的决策是绞肉机。
真正的工程含量不在"转起来",在"不出轨"
Addy Osmani(Google Cloud AI 总监)提醒过一个冷峻的事实:一个循环要真的省钱,得同时满足四个条件,缺一个成本就大过收益——
- 这件事每周至少重复一次——循环的搭建成本靠反复运行摊平
- 结果能自动验证——有测试、有编译、有明确的对错判断
- Token 预算扛得住浪费——循环一定会有空转和无效尝试
- Agent 手上有高级工程师级别的工具——否则它连文件都改不对
两个最典型的翻车模式:
- Overbaking(发酵过头):目标设定模糊(如"让代码更好看"),AI 可能为了修一个小问题重构整个项目,产出一堆没人要的功能
- Money Furnace(钱炉):没有熔断机制,无人值守的循环可能数小时内烧掉数千万 Token
知乎上有人一句话总结到位:**"loop 是真东西,但大部分人现在还用不上。"** 这不是泼冷水,是帮你省下一次"搭了个寂寞"。
你的新角色:不是操作员,是系统架构师
Loop Engineering 标志着 AI 协作进入了"Deploy and Walk Away"的时代。
你的核心竞争力不再是写出巧妙的提示词,而是能精准定义三件事:
- 该观察什么?(心跳触发什么事件)
- 什么时候停止?(验证器如何判定目标达成)
- 出了岔子怎么办?(熔断机制在哪里)
这不是"AI 越来越强所以人可以躺平"的故事。模型的能力没有质的飞跃,变的是你愿意为它铺多厚的地基。
从编剧到片场总设计师,不是你离开了片场,是你在片场的位置变了。
参考来源:Addy Osmani《Loop Engineering》、Boris Cherny Claude Code 演讲、O'Reilly Radar、Steve Yegge Gas Town 项目、Cobus Greyling 博客
暂无评论。