Agent SkillLINUX DO · AI·1 小时前

Claude大师厘清Agent与Workflow：核心区别在于谁决定流程

原标题：Claude大师为我答疑，让我懂了agent和workflow

速览

本文记录了一次关于AI Agent与Workflow概念辨析的深度对话。Claude指出两者的核心分界线在于“谁决定流程”：Workflow由人预先编排固定步骤，而Agent由模型在运行时临场决策。文章澄清了多LLM协作不等于多Agent，并强调真实系统多为混合架构，旨在帮助开发者理清认知误区，正确设计AI应用。

AI 深度解读

背景

在准备一门关于“同事如何用 AI”的课程时，作者在与 Claude 进行头脑风暴的过程中，发现自身对 AI 应用形态的认知受到了“行业陋习”的污染。作者原本将课程分为四节，其中第三节侧重于 AI 应用实操，第四节侧重于 AI 应用工程化与质量控制。但在梳理大纲时，作者意识到第三节内容略显虚浮，且与第四节界限模糊。

作者原计划在第四节讲解目前流行的 AI-Agent 应用，但在与 Claude 的深入探讨中，通过厘清“工作流（Workflow）”与“智能体（Agent）”的本质区别，解决了课程结构的困惑。这次对话不仅明确了课程大纲，更揭示了当前 AI 应用开发中一个极易混淆的核心概念：控制权究竟在谁手中。

核心内容

1. 区分工作流与 Agent 的唯一轴线：谁决定流程？

Claude 指出，区分第三节（工作流型）和第四节（Agent 型）最锋利的一根轴是：谁来决定下一步做什么？

工作流型（Workflow）：
- 决策者： 人（开发者）。
- 形态： 固定流水线。步骤、逻辑分支（if-else）均由代码预先写死。
- 比喻： 自动售货机或流水线。
- 示例： AI 文案生成平台、自动分类/抽取系统。
- 质控重点： 结构化输出、质检、返工机制。
Agent 型（Agent）：
- 决策者： AI（LLM）。
- 形态： 临场决定。给定目标和工具箱，AI 根据每一步的结果自主决定下一步动作，直到完成任务。
- 比喻： 能自主办事的助理。
- 示例： 自动调研 Agent、能自主查库调接口的客服。
- 质控重点： 护栏（Guardrails）、终止条件、人工审核、可观测性。

一句话总结： 第三节是“人编排，AI 执行”；第四节是“AI 自己编排”。

2. 常见误区纠偏：多角色不等于多 Agent

作者曾构建一个 AI 学习平台，包含多个 LLM 角色（如大纲生成、内容填充、配音、配图），并认为这是多 Agent 协作。Claude 指出，这在技术上依然是一个工作流。

原因： “先出大纲 → 再并行做内容/配音/配图 → 结束”这一流程图是作者画的，而非 AI 临场决定的。那些 LLM 只是按预定工位干活的“工人”，而非“决策者”。
判断标准： 只要流程图的箭头是你画的，就是工作流；如果箭头是模型在运行时自己挑的，才是 Agent。
误区澄清： “用了多个 LLM 角色” ≠ Multi-Agent。真正的 Multi-Agent 是指多个能各自决策的 Agent 进行协同。

3. Agent 的本质定义与判别方法

定义： Agent 是一个 LLM 在循环中，自己决定下一步做什么（包括调用什么工具），看完结果后再决定下一步，直到它判断任务完成。
判别金句： “下一步做什么，是你画的流程图/if-else 决定的，还是模型看着当前结果临场决定的？”
- 代码决定 → 工作流
- 模型决定 → Agent

案例对比：

Claude Code： 标准 Agent。用户说“修好这个 bug”，代码自己决定先读哪个文件、grep 什么、跑测试、看到失败后改哪一行。这一系列动作没有一步是提前排好的，全是临场决定。
AI 学习平台（原设计）： 工作流。流程固定，不可变。
AI 学习平台（Agent 化改造）： 如果加入一个“总编 Agent”，它看完主题后自己决定分几节、要不要配图；或加入一个“质检 Agent”，看了 Slide 觉得太弱就打回重做，循环直到合格。那个“要不要再来一轮”的决定权交给模型，才具备 Agent 特性。

4. 何时使用 Agent？场景与选型建议

Agent 并非万能，也不是二选一的问题，而是一条光谱。

Agent 成熟的土壤： Coding（环境纯文字、工具齐全、反馈即时客观）。
通用配方： 目标 + 工具 + 反馈 + 需要随机应变的多步任务。
典型 Agent 场景：
- 深度调研： 路径不固定，需根据搜索结果决定下一步查什么。
- 客服工单： 每张工单处理路径不同，需自主决定查订单、翻政策、看库存等。
- 数据归因： 发现异常后钻取细分数据，验证假设，路径动态变化。
选型口诀：
- 流程你能提前画出来 → 用 Workflow（更可靠、可预测、成本低）。
- 流程你根本没法提前画（下一步取决于上一步看到啥） → 才上 Agent。

5. 澄清误区：Agent 不只是对话流

作者困惑于除 Coding 外找不到 Agent 场景，且认为 Agent 只能是对话形式。Claude 指出这是将“决策逻辑”与“交互形式”混淆了。

两根轴：
1. 谁定流程？（人定=Workflow，模型定=Agent）
2. 怎么触发/谁在回路？（人来聊=对话式，事件触发=自动化）
被忽视的领域： 事件触发的自主 Agent（无人对话）。
HR 部门 Agent 案例：
1. 入职协调 Agent（自动触发，无对话）：
  - 触发： 新人 Offer 签署，状态变为“待报到”。
  - 自主决策： 根据岗位、城市、级别，自主决定开权限、配电脑、约培训、指派 Buddy 等。若某项卡住（如电脑未到货），自主决定催采购或升级给 HRBP。
  - 价值： 每个新人路径不同，且需多日跟踪，无法画出固定流程图。
2. HR 事务 Agent（对话式，但核心是办事）：
  - 触发： 员工提问（如陪产假）。
  - 自主决策： 根据问题内容，自主决定查政策、查地区、查工龄、算工资，甚至直接提交申请。
  - 区别： 不同于只会念政策的 FAQ 机器人，Agent 能结合个人数据给出针对性答案并执行动作。

关键要点

核心判别标准： 区分 Workflow 和 Agent 的唯一标准是控制权。如果流程图的箭头是开发者画的，是 Workflow；如果箭头是 LLM 在运行时根据结果临场决定的，是 Agent。
循环不等于 Agent： 带有“生成→评估→返工”循环的系统（Evaluator-Optimizer 模式）依然是 Workflow，因为循环结构和判断逻辑（if-else）是代码写死的，LLM 只是其中的一个环节。
多角色不等于多 Agent： 多个 LLM 角色串联在固定流程中，整体仍是 Workflow。只有当多个组件具备独立决策能力并协同工作时，才是 Multi-Agent。
Agent 的本质： Agent = 目标 + 工具箱 + 反馈循环 + 自主决策。关键在于模型能否自主决定“下一步做什么”以及“何时完成任务”。
选型建议： 不要为了做 Agent 而做 Agent。对于需要稳定、可复现、可控的场景（如课程生成、标准化审批），Workflow 是更好的选择。只有在流程无法预先定义、具有高度不确定性时，才使用 Agent。
Agent 的形态多样性： Agent 不一定是对话形式。它可以是事件触发的自动化系统（如入职协调、数据监控），全程无对话，但具备自主决策和执行能力。
混合架构： 真实系统往往是混合的。外层固定骨架（Workflow）保证可靠性，内部关键节点（如内容生成、质检

查看原文 →linux.do