三条龙三副缰绳之前聊过 Harness Engineering驾驭工程。当客厅里来了一条龙就需配上一套完整的驾驭系统包括缰绳、马鞍、护具。实际上自从 Agent 出现后驾驭工程便一直存在。只是 OpenClaw 的出现促使 AI 主权从模型厂商转移到用户侧我们才对驾驭工程有了更深刻的体会进而引发业界共鸣。然而不同时代的 Agent 形态所需的缰绳并不相同。以 Manus、OpenClaw 和 Claude Managed Agent 三种主流的 Agent 为例它们都遵循三层结构底层是基础模型中间是 Agent 能力构建层顶层是用户交互界面。但在“谁来构建中间层”和“中间层有多厚”这两个问题上三者给出了不同的答案。三种 Agent 形态三种产品设计哲学Manus交钥匙式的黑盒 Agent 方案。第二层 Agent 能力层记忆、系统提示、知识库、Workflow、MCP 等由 Manus 负责调优和控制。用户拿到的是一个成品只拥有第三层浏览器界面的使用权。这就好比买了一台品牌整车发动机、变速箱、悬挂系统都是厂商标定好的只需踩油门、控制方向盘。OpenClaw开放骨架用户负责优化 Agent 效果。第二层 Agent 能力层被解构为一组文本协议agent.md 定义行为、soul.md 定义性格、User.MD 描述用户画像再加上 Heartbeat 心跳机制、Skills 技能和 Sessions 会话管理。这些全部归用户所有通过自然语言“调教”龙虾让它更懂用户能做更多事。第三层的交互界面从单一浏览器扩展到 Discord、飞书、钉钉等 IM 平台。这如同拿到了一辆可改装的赛车底盘引擎是厂商的但悬挂、空力套件、座椅全由用户自己装配。Claude Managed Agent托管共建按需定制。第二层 Agent 能力层被极简化为三个核心原语Environment环境、Session会话和 Events事件。与 OpenClaw 不同的是这个极简的第二层由 Anthropic 基于用户需求来定制化构建。第三层同样支持浏览器和 IM 多端。就像请了一位顶级的赛车工程团队帮用户把一切调到最佳状态。Agent 的构建在变轻Agent 的架构在变薄Manus 的第二层是一个完整的能力栈。记忆系统、系统提示词、知识库、Workflow 编排、MCP 工具协议……它几乎把让 AI 可靠工作所需要的一切都包裹在了 Agent 能力层。这种“厚 Agent”策略在早期模型不够智能的情况下完全合理。例如之前提到的“技术债指数级放大”和“上下文腐烂”问题根源都在于模型在面对泛化需求的自主能力有限需要厚重的 Harness 来弥补。OpenClaw 的第二层开始收敛。从五六种不同类型的能力模块记忆、知识库、Workflow……收敛为一组结构化的文本协议Agent.md、Soul.md、User.md再通过热插拔的 Skills就能构建出一个高度定制化的 Agent。甚至可以把“品味”编码为自动化规则来约束。因此Agent 的行为复杂度被降维了从工程复杂度降到了文本复杂度。这背后反映的是我们对模型和 Agent 的认知在提升与其设计复杂的编排系统来弥补模型的不足不如设计简洁的约束环境来发挥模型的能力。Claude Managed Agent 则是把第二层压缩到了极致。只剩三个核心原语Environment 定义执行环境Session 管理会话状态Events 处理事件驱动。没有显式的记忆模块、没有知识库、没有 Workflow 编排。这些能力都被“下沉”到了模型层在一个极简的 Agent 能力框架内自主规划、推理和执行。多 Agent 协作在变厚轻和薄只是故事的一半Agent 与 Agent 之间的协作正在迅速变厚。复杂任务推动 Agent Team 的涌现。我们交给 Agent 的任务正在从“输出一张图片”升级为“帮我诊断一个线上故障”。复杂和长程任务单体 Agent 越来越力不从心例如出现上下文会腐烂、Skills 污染等情况。多 Agent 既能对上下文、技能起到隔离的作用还能让主 Agent 负责规划子 Agent 在隔离的上下文中执行具体任务各司其职。例如 HiClaw 采用的 Manager - Workers 架构就是典型的 Agent Team 范式但多智能体协作的范式没有银弹取决于场景。下方列举了 Manager - Worker管理者 - 执行者、Sequential / Pipeline顺序链式、Peer - to - Peer / Decentralized去中心化对等协作三种常见的协作范式。Manager - Worker管理者 - 执行者这种范式的核心能力是“分而治之”最擅长的是那些任务可以被明确拆分为独立子任务、且最终需要汇总的场景。深度研究与报告生成是最典型的场景。比如要做一份行业竞品分析报告Manager 把任务拆成“调研公司 A 的产品线”、“调研公司 B 的财务数据”、“调研公司 C 的技术栈”三个 Worker 并行去做最后 Manager 汇总成一份完整报告。每个子任务之间几乎没有依赖关系并行效率很高。复杂软件项目的任务分配也是常见用法。Manager 理解了整体需求后把前端、后端、数据库设计分别交给不同的专家 Agent。不过这里有个微妙之处如果子任务之间有强依赖比如后端接口定义影响前端实现纯 Manager - Worker 就会吃力需要 Manager 做更多的协调。简单说只要任务满足“可拆分、子任务独立、需要汇总”这三个条件Manager - Worker 就是首选。Sequential / Pipeline顺序链式Pipeline 擅长的是有明确阶段性、后一步依赖前一步输出的任务。它的思维模型就是流水线原料进去成品出来每一站做一道加工。数据分析管道是经典场景。数据清洗 → 特征工程 → 模型推理 → 结果可视化每一步都建立在前一步的基础上ETL 流程天然就是 Pipeline 结构。还有代码生成与测试场景。需求理解 → 代码编写 → 单元测试生成 → 代码审查 → 修复。每个 Agent 专注一个环节职责边界非常清楚出了问题也容易定位是哪个环节的 Agent 表现不佳。Pipeline 的核心优势是可解释性和可调试性。能清楚地看到每一步的中间结果。但它的局限也很明显一旦某个环节需要回溯修改前面的输出纯线性结构就很尴尬需要加入反馈回路才能处理。Peer - to - Peer / Decentralized去中心化对等协作P2P 范式的独特之处在于没有中心控制者每个 Agent 都是自主的它们通过协商、广播、共享信息来协作。这种架构最擅长的是那些没有预定义流程、需要动态涌现协作模式的场景。社会模拟与仿真是 P2P 最经典的应用。比如 Generative Agents [1]斯坦福“AI 小镇”实验。25 个 Agent 各自有自己的记忆、目标和日程它们在虚拟环境中自主行动、互相对话、形成关系。没有任何 Manager 在指挥谁该做什么所有的社会行为都是从对等交互中涌现出来的。另外多方谈判与博弈也天然适合 P2P 范式。比如模拟一场商业谈判买方、卖方、中介方各自有自己的利益和策略它们需要互相试探、出价、让步。这种场景不存在一个正确的中心调度逻辑博弈结果取决于各方的动态交互。自组织的工作流优化也是一个前沿方向。多个 Agent 在执行任务时发现瓶颈自主调整分工------比如某个 Agent 发现自己任务轻主动从负载重的 Agent 那里分担工作。这种动态负载均衡在 Manager - Worker 架构中需要 Manager 来做但在 P2P 中可以自发实现。但是 P2P 的代价是协调复杂度高、行为难以预测。在生产环境中纯 P2P 通常需要配合良好的通信协议和终止条件设计否则容易陷入无限循环或信息爆炸。群体智能已在从实验走向应用从另一维度推动 Agent Team 的共鸣。当单个 Agent 变薄到足够轻量养一群 Agents 的成本就变得可以接受。这催生了一种全新的玩法群体智能。HiClaw 的 700 万豪车汽车设计 [2] 就是一个典型群体智能的案例。多个不同角色的 Agent 进行 100 轮讨论输出综合结论。再例如最近爆火的 AI Hedge Fund [3] 。该项目构建一个了 19 位传奇投资人组成的 Agent 军团包括巴菲特 Agent 专注价值投资和护城河分析芒格 Agent 擅长逆向思维和跨学科模型木头姐 Agent 聚焦颠覆式创新和长期科技趋势。当多个风格迥异的投资大师 Agent 组成军团、相互碰撞时涌现出的洞察就不再是任何单一 Agent 能达到的。这就是群体智能的价值个体效率的提升是线性的而群体智能的涌现是指数级的。Agent Team 恰好和互联网的发展逻辑一致。终端设备从大型机变成了手机越来越轻薄但基于互联网的人类协作越来越多样化发挥无与伦比的群体智慧。那么未来 Agent 的发展还会带来哪些惊喜呢