← 返回信息流
Agent SkillLINUX DO · AI·1 小时前

Claude大师厘清Agent与Workflow:核心区别在于谁决定流程

原标题:Claude大师为我答疑,让我懂了agent和workflow

速览

本文记录了一次关于AI Agent与Workflow概念辨析的深度对话。Claude指出两者的核心分界线在于“谁决定流程”:Workflow由人预先编排固定步骤,而Agent由模型在运行时临场决策。文章澄清了多LLM协作不等于多Agent,并强调真实系统多为混合架构,旨在帮助开发者理清认知误区,正确设计AI应用。

AI 深度解读

背景

在准备一门关于“同事如何用 AI”的课程时,作者在与 Claude 进行头脑风暴的过程中,发现自身对 AI 应用形态的认知受到了“行业陋习”的污染。作者原本将课程分为四节,其中第三节侧重于 AI 应用实操,第四节侧重于 AI 应用工程化与质量控制。但在梳理大纲时,作者意识到第三节内容略显虚浮,且与第四节界限模糊。

作者原计划在第四节讲解目前流行的 AI-Agent 应用,但在与 Claude 的深入探讨中,通过厘清“工作流(Workflow)”与“智能体(Agent)”的本质区别,解决了课程结构的困惑。这次对话不仅明确了课程大纲,更揭示了当前 AI 应用开发中一个极易混淆的核心概念:控制权究竟在谁手中。

核心内容

1. 区分工作流与 Agent 的唯一轴线:谁决定流程?

Claude 指出,区分第三节(工作流型)和第四节(Agent 型)最锋利的一根轴是:谁来决定下一步做什么?

  • 工作流型(Workflow):
    • 决策者: 人(开发者)。
    • 形态: 固定流水线。步骤、逻辑分支(if-else)均由代码预先写死。
    • 比喻: 自动售货机或流水线。
    • 示例: AI 文案生成平台、自动分类/抽取系统。
    • 质控重点: 结构化输出、质检、返工机制。
  • Agent 型(Agent):
    • 决策者: AI(LLM)。
    • 形态: 临场决定。给定目标和工具箱,AI 根据每一步的结果自主决定下一步动作,直到完成任务。
    • 比喻: 能自主办事的助理。
    • 示例: 自动调研 Agent、能自主查库调接口的客服。
    • 质控重点: 护栏(Guardrails)、终止条件、人工审核、可观测性。

一句话总结: 第三节是“人编排,AI 执行”;第四节是“AI 自己编排”。

2. 常见误区纠偏:多角色不等于多 Agent

作者曾构建一个 AI 学习平台,包含多个 LLM 角色(如大纲生成、内容填充、配音、配图),并认为这是多 Agent 协作。Claude 指出,这在技术上依然是一个工作流

  • 原因: “先出大纲 → 再并行做内容/配音/配图 → 结束”这一流程图是作者画的,而非 AI 临场决定的。那些 LLM 只是按预定工位干活的“工人”,而非“决策者”。
  • 判断标准: 只要流程图的箭头是你画的,就是工作流;如果箭头是模型在运行时自己挑的,才是 Agent。
  • 误区澄清: “用了多个 LLM 角色” ≠ Multi-Agent。真正的 Multi-Agent 是指多个能各自决策的 Agent 进行协同。

3. Agent 的本质定义与判别方法

  • 定义: Agent 是一个 LLM 在循环中,自己决定下一步做什么(包括调用什么工具),看完结果后再决定下一步,直到它判断任务完成。
  • 判别金句: “下一步做什么,是你画的流程图/if-else 决定的,还是模型看着当前结果临场决定的?”
    • 代码决定 → 工作流
    • 模型决定 → Agent

案例对比:

  • Claude Code: 标准 Agent。用户说“修好这个 bug”,代码自己决定先读哪个文件、grep 什么、跑测试、看到失败后改哪一行。这一系列动作没有一步是提前排好的,全是临场决定。
  • AI 学习平台(原设计): 工作流。流程固定,不可变。
  • AI 学习平台(Agent 化改造): 如果加入一个“总编 Agent”,它看完主题后自己决定分几节、要不要配图;或加入一个“质检 Agent”,看了 Slide 觉得太弱就打回重做,循环直到合格。那个“要不要再来一轮”的决定权交给模型,才具备 Agent 特性。

4. 何时使用 Agent?场景与选型建议

Agent 并非万能,也不是二选一的问题,而是一条光谱。

  • Agent 成熟的土壤: Coding(环境纯文字、工具齐全、反馈即时客观)。
  • 通用配方: 目标 + 工具 + 反馈 + 需要随机应变的多步任务。
  • 典型 Agent 场景:
    • 深度调研: 路径不固定,需根据搜索结果决定下一步查什么。
    • 客服工单: 每张工单处理路径不同,需自主决定查订单、翻政策、看库存等。
    • 数据归因: 发现异常后钻取细分数据,验证假设,路径动态变化。
  • 选型口诀:
    • 流程你能提前画出来 → 用 Workflow(更可靠、可预测、成本低)。
    • 流程你根本没法提前画(下一步取决于上一步看到啥) → 才上 Agent

5. 澄清误区:Agent 不只是对话流

作者困惑于除 Coding 外找不到 Agent 场景,且认为 Agent 只能是对话形式。Claude 指出这是将“决策逻辑”与“交互形式”混淆了。

  • 两根轴:
    1. 谁定流程?(人定=Workflow,模型定=Agent)
    2. 怎么触发/谁在回路?(人来聊=对话式,事件触发=自动化)
  • 被忽视的领域: 事件触发的自主 Agent(无人对话)。
  • HR 部门 Agent 案例:
    1. 入职协调 Agent(自动触发,无对话):
      • 触发: 新人 Offer 签署,状态变为“待报到”。
      • 自主决策: 根据岗位、城市、级别,自主决定开权限、配电脑、约培训、指派 Buddy 等。若某项卡住(如电脑未到货),自主决定催采购或升级给 HRBP。
      • 价值: 每个新人路径不同,且需多日跟踪,无法画出固定流程图。
    2. HR 事务 Agent(对话式,但核心是办事):
      • 触发: 员工提问(如陪产假)。
      • 自主决策: 根据问题内容,自主决定查政策、查地区、查工龄、算工资,甚至直接提交申请。
      • 区别: 不同于只会念政策的 FAQ 机器人,Agent 能结合个人数据给出针对性答案并执行动作。

关键要点

  • 核心判别标准: 区分 Workflow 和 Agent 的唯一标准是控制权。如果流程图的箭头是开发者画的,是 Workflow;如果箭头是 LLM 在运行时根据结果临场决定的,是 Agent。
  • 循环不等于 Agent: 带有“生成→评估→返工”循环的系统(Evaluator-Optimizer 模式)依然是 Workflow,因为循环结构和判断逻辑(if-else)是代码写死的,LLM 只是其中的一个环节。
  • 多角色不等于多 Agent: 多个 LLM 角色串联在固定流程中,整体仍是 Workflow。只有当多个组件具备独立决策能力并协同工作时,才是 Multi-Agent。
  • Agent 的本质: Agent = 目标 + 工具箱 + 反馈循环 + 自主决策。关键在于模型能否自主决定“下一步做什么”以及“何时完成任务”。
  • 选型建议: 不要为了做 Agent 而做 Agent。对于需要稳定、可复现、可控的场景(如课程生成、标准化审批),Workflow 是更好的选择。只有在流程无法预先定义、具有高度不确定性时,才使用 Agent。
  • Agent 的形态多样性: Agent 不一定是对话形式。它可以是事件触发的自动化系统(如入职协调、数据监控),全程无对话,但具备自主决策和执行能力。
  • 混合架构: 真实系统往往是混合的。外层固定骨架(Workflow)保证可靠性,内部关键节点(如内容生成、质检
查看原文 →linux.do