新闻详情
Loop Engineering:设计一个循环让Agent自己跑
Loop Engineering:设计一个循环让Agent自己跑
过去两年你用编程 Agent 的方式很简单写一条好提示塞够上下文等它输出你再写下一条。Agent 是工具你全程握着它一轮接一轮。现在不一样了。你构建一个小系统——它自己找活干、分配任务、检查结果、记录进度、决定下一步。你不再亲自戳 Agent系统替你做这件事。Osmani 把这件事分成五个构建块 一个记忆层。有意思的是Codex 和 Claude Code 现在都支持这全部六样东西只是名字不同。五个构建块1. 自动化Automations——心跳让循环真正循环起来的东西。不是跑一次就完事而是按计划自动执行。Codex 的 Automations tab 里你选项目、写提示、设频率跑出结果进 Triage 收件箱没结果自动归档。OpenAI 内部用它做日常 issue 分类、汇总 CI 失败、写 commit 简报、抓上周引入的 bug。Claude Code 通过/loop、cron 任务、hooks 和 GitHub Actions 实现同样的事。/goal更狠——你写一个条件比如test/auth 下所有测试通过且 lint 干净它一直跑到条件满足才停而且每次迭代由一个独立的小模型判断是否完成不是写代码的那个自己打分。2. 工作树Worktrees——并行不打架同时跑多个 Agent 时文件冲突是最大的坑。两个 Agent 写同一个文件跟两个工程师改同一行代码没区别。git worktree 解决这个问题——每个 Agent 有自己的独立工作目录共享同一个仓库历史但编辑互不干扰。Codex 内建支持Claude Code 用--worktree标志或isolation: worktree配置实现。但 Osmani 提醒工具解决了机械冲突你才是真正的瓶颈——你的审查带宽决定了能并行跑多少个不是工具。3. 技能Skills——不用每次都从头解释项目每次新会话都要重新解释项目上下文像金鱼一样。Skill 就是干这个的。格式很简单一个文件夹里面放SKILL.md描述指令和元数据再加可选脚本、参考文件、资源。Codex 用$或/skills调用Claude Code 也一样。Osmani 之前提过意图债务intent debt——Agent 每次启动都是冷启动你的意图有漏洞它就自信地猜。Skill 就是把意图写在外面写一次每次运行都读到。没有 Skill循环每次从零推导整个项目有了 Skill知识会累积。4. 插件和连接器Plugins Connectors——触达真实工具只能看文件系统的循环是弱小的。基于 MCP 的连接器让 Agent 读 issue 跟踪器、查数据库、调 staging API、往 Slack 发消息。Codex 和 Claude Code 都支持 MCP所以给一个写的连接器通常另一个也能用。插件把连接器和技能打包队友一次安装就能用上你整套配置。这决定了 Agent 是说这是修复方案还是自己开 PR、关联 Linear 工单、CI 绿了自动在频道里人。5. 子 AgentSub-agents——写代码的和检查的分开循环里最有价值的结构设计。写代码的模型给自己打分太宽容了。第二个 Agent 用不同的指令、甚至不同的模型来抓第一个自己骗过自己的地方。Codex 用.codex/agents/下的 TOML 文件定义子 Agent可以指定模型和推理强度。Claude Code 用.claude/agents/和 agent teams。通常的分工一个探索一个实现一个对照规范验证。在无人值守的循环里一个你信得过的验证者是你敢走开的唯一理由。1. 状态State——第六样东西一个 Markdown 文件或者 Linear 看板——任何活在单次对话之外的东西记录做了什么、下一步做什么。听起来太简单了但每个长期运行的 Agent 都依赖这个技巧。模型在两次运行之间会忘记一切所以状态必须存在磁盘上而不是上下文里。Agent 会忘仓库不会。一个循环长什么样Osmani 分享了一个他常用的模式每天早上自动化跑一次。提示词调用一个 triage skill读取昨天的 CI 失败、打开的 issue、最近的 commit把发现写进 Markdown 或 Linear。每个值得做的发现开一个独立的工作树派子 Agent 起草修复第二个子 Agent 对照项目 skills 和现有测试审查。连接器让循环自己开 PR、更新工单。循环处理不了的进 Triage 收件箱等你。你只设计了一次。你没有手动提示任何一步。循环解决不了的事Osmani 很清醒地列出了三个会变得更尖锐的问题验证还是你的责任。无人值守的循环也是无人值守地犯错。把验证者从写代码的分开只是让做完了更有意义一点但做完了是声称不是证明。你的理解会退化。循环越快地产出你没写的代码你实际理解的东西和代码库之间的差距就越大。这是理解债务comprehension debt顺畅的循环只会让它增长更快——除非你读循环产出的东西。认知投降。循环自己跑的时候很容易停止有自己的判断拿什么是什么。设计循环如果你带着判断力去做它是解药如果你用它来逃避思考它是催化剂。小结这篇文章最有价值的部分不是那五个构建块——这些东西文档里都有。它真正点破的是杠杆点已经移动了。Bcherny 说我不再提示 Claude 了我写循环不是说工作变轻松了是说发力点变了。两个不同的人搭出完全一样的循环结果可能完全相反。一个用它加速自己深度理解的工作另一个用它逃避理解工作本身。循环不知道区别。你知道。这就是为什么循环设计比提示工程更难而不是更容易。最后 Osmani 的结语很克制我直接引用Build the loop. But build it like someone who intends to stay the engineer, not just the person who presses go.设计循环。但要像一个打算继续当工程师的人那样去设计而不是一个只负责按按钮的人。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】