有个需求把用户上传的一篇长文先翻译成中文再提炼成三句话摘要最后按固定格式生成一张卡片。一开始我想用一个万能 Agent 把这仨活全包了写了一大坨 Prompt结果它经常顾此失彼——翻译对了摘要跑偏摘要好了格式又乱。后来换思路一个 Agent 只干一件事干净利落然后在我自己的代码里把它们串起来。三个专职 Agent我用讯飞星辰分别搭了三个智能体各自职责单一每个都发布成了 API翻译 Agent只管把外文准确译成中文Prompt 里只约束翻译质量别的不管。摘要 Agent输入中文输出三句话核心摘要。排版 Agent输入摘要按固定 JSON 结构输出卡片字段。每个单独调试都很容易因为职责窄出问题一眼能定位是哪一环。在代码里编排串联的逻辑放在我自己的服务里本质就是顺序调用三个 API把上一个的输出喂给下一个text await callAgent(TRANSLATE, raw)brief await callAgent(SUMMARY, text)card await callAgent(LAYOUT, brief)中间想加缓存、加重试、加并发比如一次处理多篇都在代码里控制比把所有逻辑塞进一个大 Prompt 灵活太多。取舍多了几次网络往返整体变慢对延迟敏感的场景要权衡或者把能并行的步骤并行掉。每环的输出格式要约定死否则下一环接不住。我让每个 Agent 严格输出结构化结果省去解析的麻烦。把复杂任务拆成几个专职 Agent 接力可维护性比一个巨型 Agent强一个量级。编排那段代码我放评论区了。你们是堆一个大的还是拆成小的