别再写 Prompt 了,你的 AI 正在等一个它自己能跑的系统

别再写 Prompt 了,你的 AI 正在等一个它自己能跑的系统

一个编剧写完剧本,不会留在片场盯每一台摄影机。

但今天大部分人和 AI 的关系,恰恰就是这个——你写"剧本"(Prompt),然后全程守在片场,盯着每一帧拍摄。AI 出错你纠正,AI 偏了你拉回来,一轮又一轮,你在片场的时间比 AI 干活的时间还长。

Boris Cherny,Claude Code 的创造者,今年 6 月说了一句话:**"我不再给 Claude 写 Prompt 了。我有循环在跑,它们替我去 Prompt Claude。"**

这句话背后是一个正在发生的范式迁移:从 Prompt Engineering(你写指令)到 Loop Engineering(你设计系统)。不是 AI 变聪明了,是你的角色变了。

从"写台词"到"搭片场"

理解这个转变,最简单的方式是看 Token 消耗的量级变化:

阶段 你的角色 Token 量级
Prompt Engineering 全程操作员 百~千
Context Engineering 信息管道设计师 千~万
Harness Engineering 系统搭建者,偶尔介入 万~十万
Loop Engineering 循环设计者,系统自己跑 十万~持续运行

每一个阶段都不是替代上一个,而是在上面叠加。Prompt 你还是要写,但不再是你手动一轮一轮喂——一个自动运行的循环帮你喂

这个循环的核心组件有五个加一个:

  • 心跳(Heartbeat):定时触发器。不是你去查,是系统到点自己醒
  • 工作树(Worktrees):并行隔离区。多个 Agent 同时干活不会打架
  • 技能(Skills):持久化的规则文件。Agent 随时调用,不用你每次重说
  • 连接器(Connectors):通往外界的管道。搜索、API、数据库——Agent 自己能碰
  • 验证器(Verifier):独立的裁判。写代码的 Agent 和审代码的 Agent 必须不是同一个
  • 记忆脊柱(Memory Spine):对话之外的状态持久化。防止长周期任务中 Agent 遗忘

五个组件拼出一个能自己转的系统,记忆脊柱是串起一切的中枢神经。

三个场景,看循环怎么跑

场景一:库存监控——从"你去看"到"它替你看"

你想抢一款新手机,以前是每天刷十次页面。Loop Engineering 的做法是:设一个心跳每小时触发,目标定义为"按钮不再显示 Out of Stock 且价格低于预算",记忆脊柱记录上次观察到的状态——库存没变就不报,变了才通知你。

AI 从"回答问题的工具"变成了"监控局势的哨兵"。

场景二:全网商机扫描——从"你去找"到"它替你筛"

自动扫描 Reddit、X 等平台,寻找提到"支持团队过载"或"寻找 AI 顾问"的帖子。技能组件预设评分规则(1-10 分质量分级),连接器通过 MCP 协议拉数据。人类准入点(Human Gate):AI 只起草私信,绝不自动发送——声誉保护。

在你还没开始搜索之前,AI 已经完成需求挖掘和初稿准备。

场景三:PR 自动修复——从"你修 Bug"到"它替你值班"

GitHub 上 PR 测试失败,AI 自动修复。关键设计:为每个修复任务开独立工作树分支,防止多个 Agent 冲突。修复完由另一个独立模型运行测试验证——写代码的不能既当选手又当裁判。测试不过,报错信息反馈回 LLM,自我修正,循环直到通过。

Boris Cherny 说,这种模式让他休假时也有 Agent 自动处理 PR

有人已经跑到了极端

Steve Yegge(前 Google 工程师)搭了一个叫 Gas Town 的系统——同时跑 20-30 个 Claude Code 实例,由一个"Mayor"Agent 统一调度,"Polecats"做具体执行,"Witnesses"监控卡死的 Agent,所有状态存在 Git 里——崩溃也不丢进度。

他靠这套系统一个月提交了 4 万行代码、100+ PR。代价呢?40 个 Claude Code Max 账号,月费数千美元

这就是 Loop Engineering 的双面性:它确实能成倍放大产出,但放大器不挑方向——好的循环乘以好的工程师是核弹,坏的循环乘以坏的决策是绞肉机

真正的工程含量不在"转起来",在"不出轨"

Addy Osmani(Google Cloud AI 总监)提醒过一个冷峻的事实:一个循环要真的省钱,得同时满足四个条件,缺一个成本就大过收益——

  1. 这件事每周至少重复一次——循环的搭建成本靠反复运行摊平
  2. 结果能自动验证——有测试、有编译、有明确的对错判断
  3. Token 预算扛得住浪费——循环一定会有空转和无效尝试
  4. Agent 手上有高级工程师级别的工具——否则它连文件都改不对

两个最典型的翻车模式:

  • Overbaking(发酵过头):目标设定模糊(如"让代码更好看"),AI 可能为了修一个小问题重构整个项目,产出一堆没人要的功能
  • Money Furnace(钱炉):没有熔断机制,无人值守的循环可能数小时内烧掉数千万 Token

知乎上有人一句话总结到位:**"loop 是真东西,但大部分人现在还用不上。"** 这不是泼冷水,是帮你省下一次"搭了个寂寞"。

你的新角色:不是操作员,是系统架构师

Loop Engineering 标志着 AI 协作进入了"Deploy and Walk Away"的时代。

你的核心竞争力不再是写出巧妙的提示词,而是能精准定义三件事:

  1. 该观察什么?(心跳触发什么事件)
  2. 什么时候停止?(验证器如何判定目标达成)
  3. 出了岔子怎么办?(熔断机制在哪里)

这不是"AI 越来越强所以人可以躺平"的故事。模型的能力没有质的飞跃,变的是你愿意为它铺多厚的地基

从编剧到片场总设计师,不是你离开了片场,是你在片场的位置变了。


参考来源:Addy Osmani《Loop Engineering》、Boris Cherny Claude Code 演讲、O'Reilly Radar、Steve Yegge Gas Town 项目、Cobus Greyling 博客

评论

暂无评论。

登录后可发表评论。