这四个词在 AI 圈子里出现频率越来越高,但很多朋友跟我说——"好像都差不多?都是让 AI 干活的东西?"
不是差不多。它们各自在不同层级上解决问题,而且配合起来才真正强大。我试着用生活化的比喻把它们串起来。
一句话区分
| 概念 | 一句话 |
|---|---|
| Prompt | 你对 AI 说的一句话 |
| Skills | 你教 AI 的一套固定流程 |
| MCP | AI 连接外部世界的 USB 接口 |
| Agent | 能自己规划、执行、反思的 AI |
Prompt - 你给AI发一条消息
Prompt 是最基础的东西。你就把它理解成:你对 AI 说了一句话。
"帮我写一个上传功能"
"把这段代码重构一下,用 async/await"
每一次和 AI 的对话,都在发 Prompt。它简单、直接、一次性的。
Prompt 的问题也正在于此——太简单了。你没办法通过一句话把一整套复杂的流程教给 AI。就像你没法用一条微信让一个新人完全掌握你的工作。
于是有了 Skills。
Skills - 你给 AI 写的一份 SOP
Skills 本质上是一组预制好的 Prompt 和规则的集合。
Skills 的核心价值,就是把这些隐性规则变成显性的文档(SOP),让 AI 能够自主阅读、理解并执行
举个生活例子。你家楼下咖啡馆的新员工培训:
- 没有 SOP:老板说"你去招呼客人"——新人不知所措
- 有 SOP:老板写了一个流程——"客人进门说欢迎光临 → 问几个人 → 引到空位 → 递菜单 → 问要不要推荐今日特调"
这个 SOP 就是 Skill。
在 AI 世界里,Skill 把你常用的、重复的工作流程固化下来。从结构上看,Skill 很简单,核心就是一个 SKILL.md 文件,包含元数据(描述什么时候用)和正文(具体的执行 SOP)。
设计上的亮点是“渐进式披露”:
元数据常驻上下文,AI 知道有哪些技能可用。正文按需加载,只有触发时才读取,避免挤占 Token。复杂点的 Skill,还会有附加的资源目录、脚本和参考文档。Skill 的完整目录结构是这样的:
skill-name/
├── SKILL.md # 必需:元数据(何时使用)+ 正文(指令、流程、示例)
├── scripts/ # 可选:可执行脚本(Python/Bash),按需调用
├── references/ # 可选:参考文档,按需读取
└── assets/ # 可选:模板、图片等资源
有了这个 Skill,你不用每次都从零开始写 Prompt。一句"帮我写周报",AI 就知道该怎么做。
Prompt 是单条消息,Skill 是一套流程。Skill 里面包含了很多 Prompt。Skils中的这些流程完全可以包含调用多个 MCP 工具
MCP — AI 的外接设备接口
Prompt 和 Skill 解决的是"怎么说"的问题。但还有一个更根本的问题:AI 能接触到什么信息?
默认情况下,AI 能看到的只有你发给它的文字。它不知道今天的天气,不知道你的 GitHub 仓库长什么样,不知道数据库里有什么。
MCP(Model Context Protocol)就是解决这个的。你可以把它理解成 USB 接口:
你的电脑 ──USB── 键盘
──USB── 鼠标
──USB── U盘
同理:
AI ──MCP── 连接 GitHub
──MCP── 连接数据库
──MCP── 连接日历
──MCP── 连接文件系统
MCP 是一个标准协议,定义了 AI 怎么和外部工具/数据源通信。在 MCP 之前,每个 AI 应用都要自己写一套对接逻辑。MCP 出来之后,就像 USB 统一了外设接口一样——一套标准,所有设备都能用。
MCP 不写流程,不写提示词。它只管一件事:让 AI 能"看到"和"操作"外面的世界。
Agent — 能自己拿主意的 AI
Prompt 是你告诉 AI 每一步做什么。Skill 是预制好的流程。MCP 是 AI 的手和眼睛。
那 Agent 是什么?
Agent 是有了手和眼睛之后,能自己规划、执行、反思的 AI。
用搬家来比喻:
| 层级 | 类比 |
|---|---|
| Prompt | "帮我把这个箱子搬到车上" |
| Skill | "搬家标准流程:打包→搬箱→装车→清洁" |
| MCP | 你给了 AI 一个搬运机器人(能搬东西)+ 一把车钥匙(能开车) |
| Agent | AI 自己看了一圈屋子,说:"先把书装进小箱子,大衣柜太重最后搬,沙发拆成三块运,车太小得分两趟——我现在开始。" |
Agent 不需要你一步步指挥。你给它一个目标,它自己:
- 拆解任务——"要搬完这个屋子,需要先做什么、后做什么"
- 选择工具——"搬书用小箱子,拆沙发需要螺丝刀"
- 执行——调用 Skills + MCP 工具完成任务
- 检查 + 调整——"第一次装不下?那我重新规划路线"
四者关系:一张图说清楚
Agent(大脑)
├─ 想问题:分解任务、制定计划
├─ 调用 Skills(经验)
│ ├─ Skill A:周报流程
│ ├─ Skill B:代码审查流程
│ └─ Skill C:部署流程
│
└─ 调用 MCP(手脚)
├─ 连接 GitHub:读代码、提 PR
├─ 连接数据库:查数据
└─ 连接文件系统:读写文件
所有 Skill 由多个 Prompt 组成
所有 MCP 连接由 Agent 调配
一层层往上走:
Prompt → 一句话
Skill → 用 Prompt 组装出的流程
MCP → 让 AI 能碰到外部世界
Agent → 用 Skill 和 MCP,自己思考和执行
理解了这个关系,再去看 Claude Code、Cursor、Copilot 这些工具,它们的架构就一目了然了。