【Loop Engineering循环工程】从理论到实践,它真的适合每个人吗?
本文整理自 B站「Loop Engineering循环工程从理论到实践它真的适合每个人吗」通过音视频总结 Ai好记 进行视频转图文整理以下为AI润色整理后的内容。大家好本期我们来聊聊最近蛮火热的一个话题Loop Engineering。有人说这是AI Agent时代的范式转移那究竟是什么我们在日常的工作学习中有用到它吗它能够怎么帮助到咱们本期我们就来分享一下。先给大家看一条推。这是在6月初OpenAI 作者 Peter 发的两句话没过几天就已经冲到了数百万的浏览。他说你不该再用提示词来驱动智能体为你编程了。你应该去设计那些循环来驱动智能体工作。差不多同一时间Claude Code那边的Boris Cherny说得更加直白。他说他已经不用提示词来驱动Claude Code了他有一堆的loop也就是循环在跑是它们在驱动Claude Code自己来决定该干什么。而Boris Cherny他自己的工作呢也就只是写loop。后来Addy Osmani写了一篇文章把这波讨论收拢成了一个词叫Loop Engineering循环工程。要理解Loop Engineering最好的入口就是Boris Cherny讲他自己这一年是怎么变的。他描述了三个阶段。咱们可以对号入座一下看看自己目前在哪个阶段。第一阶段逐行驾驶或者逐行地驱动智能体工作。你手写代码模型给你自动补全。大家还记得最早的时期咱们用AI工具不停地 tap tap tap。第二个阶段并行手动你或许会同时开5个、10个Claude Code每个都在干活。但每次对话都是你亲手发起的。你成了一个调度员在好几个窗口之间来回切换。很多重度用户现在应该就处在这个阶段而我个人或许大概率也在这个阶段。而第三阶段你不再发起对话。你写了一个系统让它自己去读你的仓库、读 issue、读 CIi的失败自己决定该用什么样的提示词驱动Agents工作。你从Loop Engineering里打字的那个人变成了Loop Engineering的作者。总的来说循环工程就是这第三阶段你不再亲手写每一条的提示词而是去设计那个替你写提示词的系统。那么一个典型的循环系统是由什么搭建起来的呢adosmoney 把它拆成了 5 块外加一根脊柱我们来逐一过一下。第一块是心跳它用来自动触发也就是定时任务。到点它自己跑自己去发现有什么活要干并不需要你来手动的驱动它。第二块工作流也就是workflow这也是在AI时代慢慢开始兴起的一种使用方式。当然它并不是新事物。多个智能体同时工作时各自待在自己隔离的分支目录里互相不踩踏对方的文件就像两个工程师各开各的分支不会同时修改同一行。第三块就是Skills可能大家已经非常熟悉了。把项目的规则规矩写进一个 Skills 的 MD 文件写一次每个 Agent 每次都会读。第四块连接器靠MCP接到你真实在用的工具上比如issue系统、数据库Slack。有了他Agent才不只是吐一句话说“这是修复方案你该帮我去开 issue帮我去开合并请求或者帮我发通知”。取而代之的是通过MCP通过工具Agent 可以自己去完成这些工作。第五块子智能体把写代码和审代码这两块拆开。whatsmoney 有句话说的很到位写代码的那个模型给自己的作业打分有时候太宽容了。所以我们需要让另一个Agent来挑刺。最后就是那根脊柱支撑起整个Loop Engineering系统的记忆。它或许就是一个简单的 Markdown 文件或许是一块 Linear 的看板。把做过什么、试过什么、还差什么都记在对话之外。Agent 会忘但如果我们用这种持久化的系统则可以帮助它记住这一切。那我们现在来看一个典型的流程我们把这几块拼起来Loop Engineering的一次循环应该是这样的。比如早上定时出发任务调度一个分诊 skill去读昨天晚上的集成系统的失败以及最近的提交。每一个能处理的问题开一个独立的worktree一个子智能体来进行修复而另一个子智能体对照 skill 和测试来审查连接器把合并请求开出来再把ticket更新掉。一旦有搞不定的问题则丢进收件箱等你来看而状态文件则实时把这一切都记录下来明天会接着跑。Boris Cherny说这一圈下来可以看得出来你只设计了一次中间的每一步你一条提示词都没有写完全由这个循环系统自主地进行工作。光听我说可能有点抽象我们直接上手演示一番。先来个最小力度的演示吧——把循环也就是loop这个词里最核心的概念先提取出来是什么呢也就是目标/goal。目标通常约定达到什么样的状态或目的才结束。在Claude Code有这么一个命令叫slashgo。我们先打开一个Claude绘画输入slashgo大家就能看到这个命令。这个命令的作用是你给他一个可以判定真假的目标他自己一轮一轮地执行。每轮结束都会有一个判断目标达到了没有如果没有再来一轮直到达到目标自动收工。我们现在给他一个小小的目标吧。现在我给他这么一个目标。用verysmallwoodsresearch获取过去的资讯和研究数据提取其中OpenAI和Shop的数据直到凑够5条。这个 verysmallwoodsresearch 是我自己搭建的一个数据同步或获取的后端。通过这个技能把数据获取回来。现在他并不需要我每写一条就催他或驱动他反复地做这个任务。你看它并不需要我额外的提示词驱动就能够自动根据我提出的目标去完成工作直到目标达成。现在只是完成了一个热身目标达成了。那下一步我们希望实现一个真正的循环。我想专门演示一个不是写代码的loop。因为很多人一听到Loop Engineering就以为这只是程序员的事情。实际上并不是的。它本质是让一个长期进程替你做重复的脑力活。写代码只是其中的一部分。我自己每天也会做一些重复的活比如发现AI圈新发生的事情、一些资讯挑出其中值得写成文章的选题。这件事每天都干特别适合做成loop。在这里要分清两个命令go是现在就跑跑到条件为真而lo则不一样它是按照时间表盲跑到点就把你给他的那段提示词再跑一遍。它并不判断完成没有只负责准时的执行。这正好就是Addy Osmani说的那个“心跳”。我们来做这么一个演示。事例是这样的我期望通过loop做一个循环任务。这个任务中用verysmaLLwoods-research拉取过去24小时的研究员和新闻挑出能够写成深度文的追加进一个叫inbox.md的文件。再用一个叫topic-scorer的子智能体给每一条做评级再写回 inbox。最后呢再用一个Scheduleθ81-5的表达式来约定是周一到周五工作日每天早上8点做这个事情。为了演示我们把这个调度的频度改得高一些比如每分钟执行一次。我们可以改dashdashschedule这个参数也可以通过自然语言描述。那我们这样改先删掉dashdashschedule参数在上面提示词的最后添加一句“每分钟执行一次”。这样在调度的时候它就会实现一个每分钟执行一次的定时任务。我们来执行一下。它首先会尝试找到其中引用的 MD 文件inbox.md以及可用的Skills和Agents还找到了topic-scorer这个子智能体的定义。我把它放在了 demo 的目录中。我们再开一个终端可以打开这个 MD 文件来看看这里面有一些什么内容。分别针对每个话题他都用感叹号、勾或叉叉做了评级并且标记了是通过Loop Engineering自动追加的。到现在本轮的循环已经完成并且给到了我一些比较详细的信息调度任务是什么他已经完成了注册每分钟触发一次。这种在绘画中的定时任务是 7 天后自动过期。如果想要提前停用呢用rome delete。那下方呢就给到了咱们这一次数据的处理后追加的一些资讯或者信息。在这里大家看到这个定时任务又触发了那我们来看一下更新后的文件在2026-06-12做了如下的追加。接下来他还应该对它进行打分评估。我在这里就暂时退出了这个绘画不再执行。刚才咱们演示了这个定时任务是怎么工作的。这样每天早上我将能打开选题收件箱看到的不是一堆原始的链接而是已经分好级、带着理由的候选。我只需要浏览这些资讯按照它的评级打分来决定哪些优先看、哪些放在后面并且帮助我来筛选哪些可以进入后续的内容创作或哪些更值得我进行进一步的阅读。这就是Loop Engineering落到每一个普通人的工作流上大致的样子。讲到这里或许还是得泼盆冷水。有篇文章写得还是蛮直接的多数开发者其实还并不需要Agent Loop。我觉得他说的还是有一定的道理。他给了4条测试条件四条权重做Loop Engineering才划算。第一这个活每周以上都会重复一次性的活不值得做这套的搭建。第二验证能够自动化。这点很重要测试、lint、检查这些能够自己把坏结果挡掉的不用你肉眼审的。第三你的token预算得扛得住甚至扛得住浪费。Loop会反复重复地读取上下文重试、来回试探这些都需要花token花钱不管最后代码用没用上。第四Agent手里有资深工程师那套工具有日志有能够浮现问题的环境还有能够把自己写的代码跑起来的。看看在哪里它崩掉了。基本上这4条都满足Loop循环看起来才值得大。Smoney 的文章中也给到了我们很重要的一些提醒。一个呢就是理解债loop 越快的交付你没有亲手写的代码、亲手看的代码仓库里有的东西和你脑子里真正搞懂的东西差距就越大。另一个更加扎心的事实是最危险的姿态是舒舒服服地接受 loop 凸出来的一切这是非常危险的。在 AI 生成的内容中越多我们不了解的内容对于我们来讲风险就越大。还有一个真实的失败样本。Geo有个出了名的循环技术或许大家也知道Loop Engineering也就是拉尔夫循环这么一个概念。它的特点就是锲而不舍、永不放弃不停地执行。它也有个著名的失败模式叫bating发酵过头你让它修个小的 bug它会跑很久很久最后自作主张地加上一堆没人要的功能甚至把本来能编译的代码都改坏。无人盯着的loop也是无人盯着的犯错。所以验证这件事永远还是在你自己的手上。即使定义成了循环任务你也需要在适合的时间点、适合的环境上具备自我验证的能力。我们回头看Loop Engineering并不是又一个要追的新工具它更像一个视角的切换从“我来写提示词驱动智能体”变成“我来设计那个用提示词驱动智能体的系统”。必要的工具其实你手上都有了。比如像Claude Code所提供的loop命令git为我们提供的具有隔离能力的工作树worktree能够驱动智能体工作的技能包skill以及帮助我们在一个独立环境中独立工作的子智能体。但别一上来就给所有这些事情都套上一个loop。先挑一件你每周都在重复而且结果能够自动验证的小事把它写成一个loop。就像我刚才那个选题的任务这个任务的执行风险还是偏小的。然后记住Addy Osmani说的那句话当那个写loop的人别当那个只会按启动键的人写完Loop Engineering我们还要有能力定时地、定期地在必要的环节上进行验证。