最近 loopEngine(把 AI 编码 agent 跑成一个循环:生成 → 审查 → 迭代)这个概念挺火的,蹭一波。但我想聊的不是概念本身,而是我们**真刀真枪**用这套循环写完了一个产品——而且早在 Claude Code 出官方 workflow 功能之前,我们就已经在这么折腾了。
先把底交了:我们这个产品技术上其实没啥难点。真正有意思、也真正决定速度和质量的,是怎么把"写代码"这件事用 agent 循环工程化。这篇就讲这个过程的演进和心得。
一个数字坐实一下:差不多六周、两百多条变更记录,基本是我一个人 + 一堆 agent 循环推出来的。下面是这套循环怎么一步步长出来的。
第一阶段:手动双开——一个写,一个审
最原始的 loop,土到掉渣:我同时开两个对话,一个当 coder 负责写,一个当 reviewer 专门审,我自己在两边手动搬代码。
慢、累、像人肉管道。但它第一次让我尝到"生成-批判"双角色的甜头:
- 写代码的那个 agent 会偷懒、会过度自信、会把"我觉得没问题"当成"没问题";
- 审查的那个 agent 屁股坐在另一边,专门挑刺、找边界、问"这里并发安全吗";
- 两个一对线,质量立刻上一个台阶。
这其实就是 loopEngine 的内核——别让同一个脑子既当运动员又当裁判。
第二阶段:让写手自己 fork 一个审查分身
手动搬代码太蠢了。下一步是让那个 coding agent 自己 fork 出一个子 agent 来审自己刚写的东西(self-review loop),审完把意见拿回来自己改。
到这一步,一个对话内就闭环了:自己生成 → 自己开分身批判 → 自己迭代,我不用再当搬运工。这就是我们土法炼出来的第一版"loop engine"——只是当时还没这个时髦名字。
第三阶段:workflow 编排——把循环变成多阶段流水线
再往后,单一的"写-审"循环不够用了,我们上了 workflow 编排:把循环扩成可组合的多阶段流水线。关键心得是——没有万能 loop,不同的活配不同的"循环形状"。我们常用的几种排列组合:
- 调研型:调研 → 设计 → code → review(先搞清楚再动手,适合不熟的领域);
- 功能型:code → review → test → debug,循环到测试绿为止;
- 排错型:复现 → 二分定位 → 修 → 回归测试;
- 并行扇出:多个 agent 各写一版方案 / 各审一个维度(正确性、安全、性能…),再合并取优。
同一个任务,挑对循环形状,产出质量和速度差很多。人的活也从"亲手写代码"变成了"设计循环 + 定验收标准 + 拍板"。
几条踩出来的心得
1. 单发不如循环。一把过的代码,几乎总藏着偷懒和坑;让另一个角色对抗性地审一遍,成本低、收益大。
2. 别让生成者评判自己。要么换个角色、要么 fork 个分身——"利益不一致"才挑得出真问题。自己审自己,基本是橡皮图章。
3. loop 一定要有退出条件。测试绿 / 审查零 critical / 连续 N 轮没有新发现——否则就是空转烧 token。
4. 别一套流水线打天下。调研、功能、排错是完全不同的循环形状,硬套一个模板会很别扭。
说到底,loopEngine 没什么黑魔法,本质就是把"生成 → 批判 → 迭代"这件事自动化、流水线化,再按任务选对循环结构。我们这个产品技术上不难,但靠这套循环,一个人也能高速且稳定地把它一路推到上线。
这套打法还在继续进化,后面有新心得再更新。产品在这儿,欢迎来玩:
- 🔗 SayCraft:https://saycraft.ai
- ▶️ Demo:https://www.youtube.com/watch?v=GexoXdZSI9k