一文读懂AI Agent生态核心概念:从MCP到Skill
原标题:我想想目前,大家经常说的名词有哪些啊,agent, MCP, tools, Plugin, Prompt, workflow,Hook,skill,harness,memory/context大概就是这些吧,为了方便大家理解,和大佬指正错误,我将按名词进行解释:
速览
本文系统梳理了AI Agent生态中的关键术语,包括智能体(Agent)、模型上下文协议(MCP)、工具(Tools)、提示词(Prompt)及工作流(Workflow)等。文章深入辨析了Agent与Workflow的动态决策差异,以及Context与Memory的数据持久化区别。同时解释了MCP作为标准协议如何打通外部资源,以及Skill和Plugin在能力封装中的作用。旨在帮助开发者准确理解各组件在构建AI应用中的定位与协作方式。
AI 深度解读
背景
随着人工智能技术从单纯的“大模型”对话向更复杂的“智能体(Agent)”系统演进,开发者社区中涌现出大量新的架构概念和术语。为了厘清这些名词之间的关系,避免概念混淆,本文基于 LINUX DO · AI 社区的一次深度讨论,对 Agent、MCP、Tools、Plugin、Prompt、Workflow、Hook、Skill、Harness 等核心概念进行了系统性的梳理与解读。
此次讨论不仅涵盖了基础定义的澄清,还深入探讨了大模型的技术本质(如 Token、Embedding、Transformer 架构),以及 Anthropic 等前沿机构对 Agent 与 Workflow 区别的最新定义。其目的在于帮助开发者和爱好者建立一套标准化的认知框架,理解 AI 应用是如何通过模块化组件构建起来的。
核心内容
1. 基础概念辨析
- Agent(智能体): Agent 并非孤立的概念,而是 AI 具象化的高级形态。它本质上是配置了 Instructions(指令)、Tools(工具)以及可选运行行为的 LLM(大语言模型)。与被动响应不同,Agent 具备根据任务目标动态决定流程和使用工具的能力。
- MCP(Model Context Protocol,模型上下文协议): MCP 是一种标准化的 AI 上下文协议,旨在解决 AI 与外部世界交互的通用性问题。它定义了 AI 如何调用外部服务器并获取固定格式信息的规则。通过 MCP,不同企业数据库和 AI 应用之间无需编写私有接口,即可实现标准化的数据交互。MCP Server 可以向 AI 应用暴露 Resources(资源)、Prompts(提示)和 Tools(工具)。
- Tools(工具): 泛指 AI 可调用的外部能力或函数。Tools 与 MCP 紧密相连,但遵循的协议未必是 MCP。Tool 是一个具体的能力单元,而 MCP Tool 则是通过 MCP 协议暴露出来的 Tool。
- Plugin(插件): 一种通用的扩展包概念,不仅限于 AI。在 AI 语境下,Plugin 是“打包和分发能力”的方式。一个 Plugin 内部可以包含 Skill、Agent、Hook、MCP Server 等多种内容,类似于浏览器插件或应用扩展。
- Prompt(提示词): 用于引导大模型行为的指令。由于大模型本质上是基于统计学的概率预测,通过 Prompt 设定人物、任务范围和目标,可以缩小模型的预测范围,降低“幻觉”(Hallucination),使其输出更符合预期。
- Workflow(工作流): 针对特定任务设计的、步骤固定且路径清晰的工作流程。Workflow 强调可控性,通常由人或程序提前写好执行路径(如:读取订单 -> 判断规则 -> 调用接口 -> 发送通知)。Anthropic 指出,Workflow 是 LLM 和工具通过预定义代码路径编排的,其路径主要由外部逻辑决定。
- Hook(钩子): 一种生命周期触发器。当执行到特定情况或涉及特殊判断时,Hook 会被触发,从而勾住工作流,保证进程的稳定性和顺利执行。
- Skill(技能): 可复用的模块化能力包。Anthropic 将其描述为包含 Instructions(指令)、Metadata(元数据)和可选资源(如 Scripts、Templates)的文件夹。Skill 让大模型能够按照预设的说明文档或模板执行特定任务。
- Harness(工作台/执行外壳): 一个综合性的运行框架或工作台。它提供了自由搭配的环境,用户可以在此组合 Plugin、Tools、Prompt、Workflow、Hook、Skill 以及设定好的 Agent,以构建完整的 AI 应用。
2. 大模型的技术本质与数据流
- 大模型的构成: 大模型(LLM、VLM、MLLM 等)是 AI 的具象化产品。其技术基础是 Transformer 架构。模型本身不具备人类意义上的主观意识、反思能力或动态进化能力,而是一个通过海量文档向量化训练出来的、具备无数维度的数学矩阵。
- 数据处理流程:
- Tokenization:文本被分词器(Tokenizer)切分为 Token(词元)。
- Mapping:Token 被映射为 Token ID(数字编号)。
- Embedding:Token ID 转换为向量表示(Embedding)。
- Inference:向量进入 Transformer 网络,通过注意力机制和多层神经网络,结合上下文预测后续 Token。
- 关键参数概念:
- Parameter(参数):模型训练出来的权重和偏置,决定了模型的能力上限。
- Context Window(上下文窗口):一次输入/输出能处理的 Token 上限。
- Training Tokens:训练时看过的数据 Token 总数。
- Vocabulary Size:分词器支持的 Token 种类数量。
- 注意:参数量与输入 Token 数不是同一概念,但输入 Token 的数量会影响推理成本和响应速度。
3. Context 与 Memory 的区别
- Context(上下文): 指当前任务或对话中临时放入的信息,包括用户问题、系统指令、聊天历史、检索到的文档、工具返回结果等。它是模型当前“看到”的信息。
- Memory(记忆): 指跨会话保存、以后还能被取出来的信息,如用户偏好、项目背景、历史决策等。Memory 并非模型参数本身发生了变化,而是系统将在需要时将相关历史信息重新塞回 Context 中。
4. Agent 与 Workflow 的核心区别
Anthropic 对两者的区别有清晰界定:
- Workflow:路径主要由人或程序提前写好,强调步骤固定、可控性强。LLM 在其中更多是作为执行环节的一部分。
- Agent:路径由 LLM 动态决定。Agent 根据目标和中间结果,自主决定下一步该调用什么工具或执行什么操作。
关键要点
- 层级关系:Harness 是顶层框架,包含 Plugin;Plugin 是打包分发单元,可包含 Agent、Skill、Tool 等;Agent 是核心智能单元,依赖 Prompt、Context、Memory 和 Tools 运行。
- 标准化趋势:MCP 协议的提出旨在统一 AI 与外部系统(数据库、API)的交互标准,降低集成成本。
- 大模型局限性:大模型本质是统计学矩阵,无主观意识。其“智能”表现源于训练数据、Prompt 工程、Context 管理以及工具调用的综合结果。
- 动态 vs 静态:Workflow 是静态的、预定义的路径编排;Agent 是动态的、由模型自主决策的流程。
- 记忆机制:Memory 是系统层面的持久化存储,通过回填 Context 来模拟模型的长期记忆,而非改变模型权重。
- 模块化设计:Skill 和 Hook 提供了细粒度的能力复用和流程控制手段,使得 AI 应用更加灵活和稳定。
意义与影响
此次对 AI 生态术语的系统梳理,标志着 AI 开发正从“单一大模型调用”迈向“复杂智能体系统构建”的新阶段。
- 降低开发门槛:通过 MCP 等标准化协议,开发者无需为每个 AI 应用重新编写接口,促进了 AI 与现有企业系统的无缝集成。
- 明确架构边界:厘清 Agent、Workflow、Skill 等概念的界限,有助于开发者根据业务需求选择合适的架构模式(是需要固定流程的 Workflow,还是需要自主决策的 Agent)。
- 提升应用可靠性:理解 Context、Memory 和 Prompt 工程的重要性,有助于通过技术手段降低大模型的幻觉,提高 AI 应用在关键业务场景中的稳定性和准确性。
- 推动生态繁荣:Plugin 和 Harness 的概念表明,AI 应用正在形成类似传统软件生态的插件市场,这将加速 AI 能力的模块化和复用,促进创新。
总之,掌握这些核心概念和它们之间的协作关系,是构建下一代智能应用的基础。
查看原文 →linux.do
