Agent SkillLINUX DO · AI·1 小时前

一文读懂AI Agent生态核心概念：从MCP到Skill

原标题：我想想目前，大家经常说的名词有哪些啊，agent, MCP, tools, Plugin, Prompt, workflow，Hook，skill，harness，memory/context大概就是这些吧，为了方便大家理解，和大佬指正错误，我将按名词进行解释：

速览

本文系统梳理了AI Agent生态中的关键术语，包括智能体（Agent）、模型上下文协议（MCP）、工具（Tools）、提示词（Prompt）及工作流（Workflow）等。文章深入辨析了Agent与Workflow的动态决策差异，以及Context与Memory的数据持久化区别。同时解释了MCP作为标准协议如何打通外部资源，以及Skill和Plugin在能力封装中的作用。旨在帮助开发者准确理解各组件在构建AI应用中的定位与协作方式。

AI 深度解读

背景

随着人工智能技术从单纯的“大模型”对话向更复杂的“智能体（Agent）”系统演进，开发者社区中涌现出大量新的架构概念和术语。为了厘清这些名词之间的关系，避免概念混淆，本文基于 LINUX DO · AI 社区的一次深度讨论，对 Agent、MCP、Tools、Plugin、Prompt、Workflow、Hook、Skill、Harness 等核心概念进行了系统性的梳理与解读。

此次讨论不仅涵盖了基础定义的澄清，还深入探讨了大模型的技术本质（如 Token、Embedding、Transformer 架构），以及 Anthropic 等前沿机构对 Agent 与 Workflow 区别的最新定义。其目的在于帮助开发者和爱好者建立一套标准化的认知框架，理解 AI 应用是如何通过模块化组件构建起来的。

核心内容

1. 基础概念辨析

Agent（智能体）： Agent 并非孤立的概念，而是 AI 具象化的高级形态。它本质上是配置了 Instructions（指令）、Tools（工具）以及可选运行行为的 LLM（大语言模型）。与被动响应不同，Agent 具备根据任务目标动态决定流程和使用工具的能力。
MCP（Model Context Protocol，模型上下文协议）： MCP 是一种标准化的 AI 上下文协议，旨在解决 AI 与外部世界交互的通用性问题。它定义了 AI 如何调用外部服务器并获取固定格式信息的规则。通过 MCP，不同企业数据库和 AI 应用之间无需编写私有接口，即可实现标准化的数据交互。MCP Server 可以向 AI 应用暴露 Resources（资源）、Prompts（提示）和 Tools（工具）。
Tools（工具）：泛指 AI 可调用的外部能力或函数。Tools 与 MCP 紧密相连，但遵循的协议未必是 MCP。Tool 是一个具体的能力单元，而 MCP Tool 则是通过 MCP 协议暴露出来的 Tool。
Plugin（插件）：一种通用的扩展包概念，不仅限于 AI。在 AI 语境下，Plugin 是“打包和分发能力”的方式。一个 Plugin 内部可以包含 Skill、Agent、Hook、MCP Server 等多种内容，类似于浏览器插件或应用扩展。
Prompt（提示词）：用于引导大模型行为的指令。由于大模型本质上是基于统计学的概率预测，通过 Prompt 设定人物、任务范围和目标，可以缩小模型的预测范围，降低“幻觉”（Hallucination），使其输出更符合预期。
Workflow（工作流）：针对特定任务设计的、步骤固定且路径清晰的工作流程。Workflow 强调可控性，通常由人或程序提前写好执行路径（如：读取订单 -> 判断规则 -> 调用接口 -> 发送通知）。Anthropic 指出，Workflow 是 LLM 和工具通过预定义代码路径编排的，其路径主要由外部逻辑决定。
Hook（钩子）：一种生命周期触发器。当执行到特定情况或涉及特殊判断时，Hook 会被触发，从而勾住工作流，保证进程的稳定性和顺利执行。
Skill（技能）：可复用的模块化能力包。Anthropic 将其描述为包含 Instructions（指令）、Metadata（元数据）和可选资源（如 Scripts、Templates）的文件夹。Skill 让大模型能够按照预设的说明文档或模板执行特定任务。
Harness（工作台/执行外壳）：一个综合性的运行框架或工作台。它提供了自由搭配的环境，用户可以在此组合 Plugin、Tools、Prompt、Workflow、Hook、Skill 以及设定好的 Agent，以构建完整的 AI 应用。

2. 大模型的技术本质与数据流

大模型的构成：大模型（LLM、VLM、MLLM 等）是 AI 的具象化产品。其技术基础是 Transformer 架构。模型本身不具备人类意义上的主观意识、反思能力或动态进化能力，而是一个通过海量文档向量化训练出来的、具备无数维度的数学矩阵。
数据处理流程：
1. Tokenization：文本被分词器（Tokenizer）切分为 Token（词元）。
2. Mapping：Token 被映射为 Token ID（数字编号）。
3. Embedding：Token ID 转换为向量表示（Embedding）。
4. Inference：向量进入 Transformer 网络，通过注意力机制和多层神经网络，结合上下文预测后续 Token。
关键参数概念：
- Parameter（参数）：模型训练出来的权重和偏置，决定了模型的能力上限。
- Context Window（上下文窗口）：一次输入/输出能处理的 Token 上限。
- Training Tokens：训练时看过的数据 Token 总数。
- Vocabulary Size：分词器支持的 Token 种类数量。
- 注意：参数量与输入 Token 数不是同一概念，但输入 Token 的数量会影响推理成本和响应速度。

3. Context 与 Memory 的区别

Context（上下文）：指当前任务或对话中临时放入的信息，包括用户问题、系统指令、聊天历史、检索到的文档、工具返回结果等。它是模型当前“看到”的信息。
Memory（记忆）：指跨会话保存、以后还能被取出来的信息，如用户偏好、项目背景、历史决策等。Memory 并非模型参数本身发生了变化，而是系统将在需要时将相关历史信息重新塞回 Context 中。

4. Agent 与 Workflow 的核心区别

Anthropic 对两者的区别有清晰界定：

Workflow：路径主要由人或程序提前写好，强调步骤固定、可控性强。LLM 在其中更多是作为执行环节的一部分。
Agent：路径由 LLM 动态决定。Agent 根据目标和中间结果，自主决定下一步该调用什么工具或执行什么操作。

关键要点

层级关系：Harness 是顶层框架，包含 Plugin；Plugin 是打包分发单元，可包含 Agent、Skill、Tool 等；Agent 是核心智能单元，依赖 Prompt、Context、Memory 和 Tools 运行。
标准化趋势：MCP 协议的提出旨在统一 AI 与外部系统（数据库、API）的交互标准，降低集成成本。
大模型局限性：大模型本质是统计学矩阵，无主观意识。其“智能”表现源于训练数据、Prompt 工程、Context 管理以及工具调用的综合结果。
动态 vs 静态：Workflow 是静态的、预定义的路径编排；Agent 是动态的、由模型自主决策的流程。
记忆机制：Memory 是系统层面的持久化存储，通过回填 Context 来模拟模型的长期记忆，而非改变模型权重。
模块化设计：Skill 和 Hook 提供了细粒度的能力复用和流程控制手段，使得 AI 应用更加灵活和稳定。

意义与影响

此次对 AI 生态术语的系统梳理，标志着 AI 开发正从“单一大模型调用”迈向“复杂智能体系统构建”的新阶段。

降低开发门槛：通过 MCP 等标准化协议，开发者无需为每个 AI 应用重新编写接口，促进了 AI 与现有企业系统的无缝集成。
明确架构边界：厘清 Agent、Workflow、Skill 等概念的界限，有助于开发者根据业务需求选择合适的架构模式（是需要固定流程的 Workflow，还是需要自主决策的 Agent）。
提升应用可靠性：理解 Context、Memory 和 Prompt 工程的重要性，有助于通过技术手段降低大模型的幻觉，提高 AI 应用在关键业务场景中的稳定性和准确性。
推动生态繁荣：Plugin 和 Harness 的概念表明，AI 应用正在形成类似传统软件生态的插件市场，这将加速 AI 能力的模块化和复用，促进创新。

总之，掌握这些核心概念和它们之间的协作关系，是构建下一代智能应用的基础。

查看原文 →linux.do