浅谈 Prompt、Skills、MCP、Agent 之间的关系

这四个词在 AI 圈子里出现频率越来越高，但很多朋友跟我说——"好像都差不多？都是让 AI 干活的东西？"

不是差不多。它们各自在不同层级上解决问题，而且配合起来才真正强大。我试着用生活化的比喻把它们串起来。

一句话区分

概念	一句话
Prompt	你对 AI 说的一句话
Skills	你教 AI 的一套固定流程
MCP	AI 连接外部世界的 USB 接口
Agent	能自己规划、执行、反思的 AI

Prompt - 你给AI发一条消息

Prompt 是最基础的东西。你就把它理解成：你对 AI 说了一句话。

"帮我写一个上传功能"
"把这段代码重构一下，用 async/await"

每一次和 AI 的对话，都在发 Prompt。它简单、直接、一次性的。

Prompt 的问题也正在于此——太简单了。你没办法通过一句话把一整套复杂的流程教给 AI。就像你没法用一条微信让一个新人完全掌握你的工作。

于是有了 Skills。

Skills - 你给 AI 写的一份 SOP

Skills 本质上是一组预制好的 Prompt 和规则的集合。

Skills 的核心价值，就是把这些隐性规则变成显性的文档（SOP），让 AI 能够自主阅读、理解并执行

举个生活例子。你家楼下咖啡馆的新员工培训：

没有 SOP：老板说"你去招呼客人"——新人不知所措
有 SOP：老板写了一个流程——"客人进门说欢迎光临 → 问几个人 → 引到空位 → 递菜单 → 问要不要推荐今日特调"

这个 SOP 就是 Skill。

在 AI 世界里，Skill 把你常用的、重复的工作流程固化下来。从结构上看，Skill 很简单，核心就是一个 SKILL.md 文件，包含元数据（描述什么时候用）和正文（具体的执行 SOP）。

设计上的亮点是“渐进式披露”：

元数据常驻上下文，AI 知道有哪些技能可用。正文按需加载，只有触发时才读取，避免挤占 Token。复杂点的 Skill，还会有附加的资源目录、脚本和参考文档。Skill 的完整目录结构是这样的：


skill-name/
├── SKILL.md          # 必需：元数据（何时使用）+ 正文（指令、流程、示例）
├── scripts/          # 可选：可执行脚本（Python/Bash），按需调用
├── references/       # 可选：参考文档，按需读取
└── assets/           # 可选：模板、图片等资源

有了这个 Skill，你不用每次都从零开始写 Prompt。一句"帮我写周报"，AI 就知道该怎么做。

Prompt 是单条消息，Skill 是一套流程。Skill 里面包含了很多 Prompt。Skils中的这些流程完全可以包含调用多个 MCP 工具

MCP — AI 的外接设备接口

Prompt 和 Skill 解决的是"怎么说"的问题。但还有一个更根本的问题：AI 能接触到什么信息？

默认情况下，AI 能看到的只有你发给它的文字。它不知道今天的天气，不知道你的 GitHub 仓库长什么样，不知道数据库里有什么。

MCP（Model Context Protocol）就是解决这个的。你可以把它理解成 USB 接口：

你的电脑 ──USB── 键盘
        ──USB── 鼠标
        ──USB── U盘

同理：

AI ──MCP── 连接 GitHub
   ──MCP── 连接数据库
   ──MCP── 连接日历
   ──MCP── 连接文件系统

MCP 是一个标准协议，定义了 AI 怎么和外部工具/数据源通信。在 MCP 之前，每个 AI 应用都要自己写一套对接逻辑。MCP 出来之后，就像 USB 统一了外设接口一样——一套标准，所有设备都能用。

MCP 不写流程，不写提示词。它只管一件事：让 AI 能"看到"和"操作"外面的世界。

Agent — 能自己拿主意的 AI

Prompt 是你告诉 AI 每一步做什么。Skill 是预制好的流程。MCP 是 AI 的手和眼睛。

那 Agent 是什么？

Agent 是有了手和眼睛之后，能自己规划、执行、反思的 AI。

用搬家来比喻：

层级	类比
Prompt	"帮我把这个箱子搬到车上"
Skill	"搬家标准流程：打包→搬箱→装车→清洁"
MCP	你给了 AI 一个搬运机器人（能搬东西）+ 一把车钥匙（能开车）
Agent	AI 自己看了一圈屋子，说："先把书装进小箱子，大衣柜太重最后搬，沙发拆成三块运，车太小得分两趟——我现在开始。"

Agent 不需要你一步步指挥。你给它一个目标，它自己：

拆解任务——"要搬完这个屋子，需要先做什么、后做什么"
选择工具——"搬书用小箱子，拆沙发需要螺丝刀"
执行——调用 Skills + MCP 工具完成任务
检查 + 调整——"第一次装不下？那我重新规划路线"

四者关系：一张图说清楚

Agent（大脑）
 ├─ 想问题：分解任务、制定计划
 ├─ 调用 Skills（经验）
 │   ├─ Skill A：周报流程
 │   ├─ Skill B：代码审查流程
 │   └─ Skill C：部署流程
 │
 └─ 调用 MCP（手脚）
     ├─ 连接 GitHub：读代码、提 PR
     ├─ 连接数据库：查数据
     └─ 连接文件系统：读写文件

所有 Skill 由多个 Prompt 组成
所有 MCP 连接由 Agent 调配

一层层往上走：

Prompt  → 一句话
Skill   → 用 Prompt 组装出的流程
MCP     → 让 AI 能碰到外部世界
Agent   → 用 Skill 和 MCP，自己思考和执行

理解了这个关系，再去看 Claude Code、Cursor、Copilot 这些工具，它们的架构就一目了然了。