一文讲透MCP的原理及实践

复制
全文

下载
全文

一文讲透 MCP 的原理及实践

MCP (Model Context Protocol) 代表了 AI 与外部工具和数据交互的标准建立。也是 AI 领域

最近非常火热的一个技术词，通过这篇内容，我们可以了解到 MCP 的本质、价值、使用

与开发。

MCP 是什么？

MCP 是 Anthropic (Claude) 主导发布的一个开放的、通用的、有共识的协议标准。

• MCP 是一个标准协议，就像给 AI 大模型装了一个 “万能接口”，让 AI 模型能够与不同

的数据源和工具进行无缝交互。它就像 USB-C 接口一样，提供了一种标准化的方

法，将 AI 模型连接到各种数据源和工具。

• MCP 旨在替换碎片化的 Agent 代码集成，从而使 AI 系统更可靠，更有效。通过建立

通用标准，服务商可以基于协议来推出它们自己服务的 AI 能力，从而支持开发者更

快的构建更强大的 AI 应用。开发者也不需要重复造轮子，通过开源项目可以建立强

大的 AI Agent 生态。

• MCP 可以在不同的应用 / 服务之间保持上下文，增强整体自主执行任务的能力。

640

MCP 的架构

MCP 遵循客户端 - 服务器架构，包含以下几个核心部分：

• MCP 主机（MCP Hosts）：发起请求的 AI 应用程序，比如聊天机器人、AI 驱动的

IDE 等。

• MCP 客户端（MCP Clients）：在主机程序内部，与 MCP 服务器保持 1:1 的连接。

• MCP 服务器（MCP Servers）：为 MCP 客户端提供上下文、工具和提示信息。

• 本地资源（Local Resources）：本地计算机中可供 MCP 服务器安全访问的资源，如

文件、数据库。

• 远程资源（Remote Resources）：MCP 服务器可以连接到的远程资源，如通过 API

提供的数据。

640

为什么需要 MCP 呢？

举个例子，例如我们目前还不能同时通过某个 AI 应用来做到联网搜索、发送邮件、发布

自己的博客等等，这些功能单个实现都不是很难，但是如果要全部集成到一个系统里面，

就会变得遥不可及。可以想象一下日常开发中，有一个 IDE ，我们可以通过 IDE 的 AI 来

完成下面这些工作。

• 询问 AI 来查询本地数据库已有的数据来辅助开发

• 询问 AI 搜索 Github Issue 来判断某问题是不是已知的 bug

• 通过 AI 将某个 PR 的意见发送给同事的即时通讯软件 (例如 Slack) 来 Code Review

• 通过 AI 查询甚至修改当前 AWS、Azure 的配置来完成部署

那有了 MCP 呢？其他服务都遵循 MCP 标准的话，就像万能接口一样，让我们开发更高效

了。

640

假设你正在使用一个 AI 编程助手来帮助你写代码。这个 AI 助手就是一个 MCP 主机。它

需要访问一些外部资源，比如代码库、文档或者调试工具。MCP 服务器就像是一个中

介，它连接了这些资源和 AI 助手。

• 当你需要查找某个函数的用法时，AI 助手通过 MCP 客户端向 MCP 服务器发送请求。

• MCP 服务器接收到请求后，去代码库或文档中查找相关信息。

• 找到信息后，MCP 服务器将结果返回给 AI 助手。

• AI 助手根据返回的信息，生成一段代码或解释，展示给你。

使用 MCP 后，你直接对 AI 说：“帮我查一下最近数学考试的平均分，把不及格的同学名

档，更新值日表。整个过程不需要你手动操作，数据也不会离开你的设备，安全又高效。

单独给 AI 做接口，现在 MCP 统一了标准，就像所有电器都用 USB-C 充电口，AI 一个接

口就能连接所有工具。而且，数据不用上传到云端，AI 直接在本地处理。比如你的成绩

单只存在自己电脑里，AI 通过 MCP 读取分析，但数据不会外泄。

MCP 会让 AI 更 “懂” 上下文，比如你让 AI “总结上周班会的重点”，它能自动调取会议录

音、聊天记录、笔记文档，综合这些信息给你答案，而不是凭空编造。所以，MCP 为 AI

应用提供了一个强大的工具，使其能够更灵活、更安全地与外部世界交互。

MCP 原理

MCP 的诞生标志着 prompt engineering 进入了一个新的发展阶段，它通过提供更结构化

的上下文信息，显著提升了模型的能力。在设计 prompt 时，我们的目标是能够将更加具

体的信息（如本地文件、数据库内容或网络实时数据等）集成进来，从而使模型能够更好

地理解和解决实际问题。

回顾没有 MCP 的时代，为了解决复杂问题，我们不得不手动从数据库中筛选信息或使用

工具来检索相关信息，并将其逐一添加到 prompt 中。处理简单问题时如需要大模型做归

纳总结这种方法很奏效，但随着问题复杂度的增加，这种方法变得越来越难以应对。

为了克服这些挑战，许多大型语言模型（LLM）平台（例如 OpenAI 和 Google）引入了

function call 功能。这一机制允许模型根据需要调用预定义函数以获取数据或执行特定操

作，大大提高了自动化程度。然而，function call 也有其局限性，包括对平台的高度依赖

以及不同 LLM 平台间 API 实现的差异，这使得开发者在切换模型时必须重写代码，增加

了开发成本。此外，还存在安全性和交互性等方面的挑战。

实际上，数据和工具一直都在那里，关键在于如何更智能、更统一地将它们与模型连接起

来。Anthropic 基于这样的需求设计了 MCP，作为 AI 模型的“万能适配器”，让 LLM 能够

轻松访问数据或调用工具。具体而言，MCP 的优势体现在以下几个方面：

• 生态系统：MCP 提供了丰富的插件库，使您的 AI 应用可以直接利用。所有的服务提

供商都可以按 MCP 协议进行接入，开者可以直接使用。可以预见，这个生态会越来

越庞大，生态越庞大，AI 的能力越强。

• 兼容性：大家只要遵循一套协议，都可以实现“万物互联”。不限于特定的 AI 模型，

任何支持 MCP 的模型都能灵活切换使用。

模型如何智能选择 Agent/工具

MCP 是核心是让我们能方便地调用多个工具，那随之而来的问题是 LLM（模型）是在什

么时候确定使用哪些工具的呢？ Anthropic 为我们提供了详细的解释，当用户提出一个问

题时：

• 客户端（Claude Desktop / Cursor）将问题发送给 LLM。

• LLM 分析可用的工具，并决定使用哪一个（或多个）。

• 客户端通过 MCP Server 执行所选的工具。

• 工具的执行结果被送回给 LLM。

• LLM 结合执行结果，归纳总结后生成自然语言展示给用户！

640

先理解第一步模型如何确定该使用哪些工具？我们可以参考 MCP 官方提供的 client

example 为讲解示例，并对相关代码进行了简化处理（移除了不影响逻辑理解的异常控制

代码部分）。通过分析这段代码，可以看出模型是依靠 prompt 来识别当前可用的工具有

哪些。具体做法是，我们将各个工具的使用描述以文本形式传递给模型，从而使模型能够

了解有哪些工具可供选择，并基于实时情况做出最佳选择。参考代码中的注释部分：

class Tool:

"""Represents a tool with its properties and formatting."""

def __init__(self, name: str, description: str, input_schema: dict[str, Any]) ->

None:

self.name: str = name

self.description: str = description

self.input_schema: dict[str, Any] = input_schema

def format_for_llm(self) -> str:

"""Format tool information for LLM.

Returns:

A formatted string describing the tool.

"""

args_desc = []

if "properties" in self.input_schema:

for param_name, param_info in self.input_schema["properties"].items():

arg_desc = f"- {param_name}: {param_info.get('description', 'No

description')}"

if param_name in self.input_schema.get("required", []):

arg_desc += " (required)"

args_desc.append(arg_desc)

return f"""Tool: {self.name}

Description: {self.description}

Arguments:

{chr(10).join(args_desc)}

"""

async def start(self):

# 初始化所有的 MCP server

for server in self.servers:

await server.initialize()

# 获取所有工具

all_tools = []

for server in self.servers:

tools = await server.list_tools()

all_tools.extend(tools)

# 格式化工具说明给 LLM 使用

tools_description = "n".join([tool.format_for_llm() for tool in all_tools])

# 生成 System Prompt

system_message = (

"You are a helpful assistant with access to these tools:nn"

f"{tools_description}n"

"Choose the appropriate tool based on the user's question. "

"If no tool is needed, reply directly.nn"

"IMPORTANT: When you need to use a tool, you must ONLY respond with "

"the exact JSON object format below, nothing else:n"

"{n"

' "tool": "tool-name",n'

' "arguments": {n'

' "argument-name": "value"n'

" }n"

"}nn"

"After receiving a tool's response:n"

"1. Transform the raw data into a natural, conversational responsen"

"2. Keep responses concise but informativen"

"3. Focus on the most relevant informationn"

"4. Use appropriate context from the user's questionn"

"5. Avoid simply repeating the raw datann"

"Please use only the tools that are explicitly defined above."

)

messages = [{"role": "system", "content": system_message}]

while True:

# 处理用户输入（假设 user_input 已获取）

messages.append({"role": "user", "content": user_input})

# 获取 LLM 响应

llm_response = self.llm_client.get_response(messages)

# ... 省略后续逻辑

那 tool 的描述和代码中的 input_schema 是从哪里来的呢？通过进一步分析 MCP 的

Python SDK 源代码可以发现：大部分情况下，当使用装饰器 @mcp.tool() 来装饰函数

时，对应的 name 和 description 等其实直接源自用户定义函数的函数名以及函数的

docstring 等。这里仅截取一小部分片段，想了解更多请参考原始代码。

@classmethod

def from_function(

cls,

fn: Callable,

name: str | None = None,

description: str | None = None,

context_kwarg: str | None = None,

) -> "Tool":

"""

Create a Tool from a function.

Args:

fn: The Python function to wrap.

name: Optional name to override the function name.

description: Optional description; defaults to docstring of the function.

context_kwarg: If specified, this argument will be omitted from the tool

signature (e.g. for LLM context injection).

Returns:

Tool: An instance of Tool based on the function.

"""

func_name = name or fn.__name__

if func_name == "<lambda>":

raise ValueError("You must provide a name for lambda functions")

func_doc = description or fn.__doc__ or ""

is_async = inspect.iscoroutinefunction(fn)

# 提取函数参数签名（排除 context_kwarg）

sig = inspect.signature(fn)

properties = {}

required = []

for param_name, param in sig.parameters.items():

if context_kwarg and param_name == context_kwarg:

continue

param_type = str(param.annotation) if param.annotation !=

inspect.Parameter.empty else "string"

param_desc = "No description"

properties[param_name] = {

"type": param_type,

"description": param_desc

}

if param.default == inspect.Parameter.empty:

required.append(param_name)

input_schema = {

"type": "object",

"properties": properties,

"required": required

}

return cls(

name=func_name,

description=func_doc,

input_schema=input_schema

)

总结：模型是通过 prompt engineering，即提供所有工具的结构化描述和 few-shot 的

example 来确定该使用哪些工具。另一方面，Anthropic 肯定对 Claude 做了专门的训练，

毕竟是自家协议，Claude 更能理解工具的 prompt 以及输出结构化的 tool call json 代码。

工具执行与结果反馈机制

工具的执行就比较简单和直接了。承接上一步，我们把 system prompt（指令与工具调用

描述）和用户消息一起发送给模型，然后接收模型的回复。当模型分析用户请求后，它会

决定是否需要调用工具：

• 无需工具时：模型直接生成自然语言回复。

• 需要工具时：模型输出结构化 JSON 格式的工具调用请求。

如果回复中包含结构化 JSON 格式的工具调用请求，则客户端会根据这个 json 代码执行对

应的工具。具体的实现逻辑都在 process_llm_response 中，代码、逻辑非常简单。

如果模型执行了 tool call，则工具执行的结果 result 会和 system prompt 和用户消息一起

重新发送给模型，请求模型生成最终回复。如果 tool call 的 json 代码存在问题或者模型

产生了幻觉怎么办呢？通过阅读代码发现，我们会 skip 掉无效的调用请求。执行相关的

代码与注释如下：

async def start(self):

# ... 上面代码略，包括初始化工具、生成 system_message 等

while True:

# 假设这里你已经处理好了用户输入 user_input

messages.append({"role": "user", "content": user_input})

# 发送给 LLM 获取回复（可能是普通对话，也可能是工具调用）

llm_response = self.llm_client.get_response(messages)

# 尝试执行工具调用（如果有）

result = await self.process_llm_response(llm_response)

# 判断是否执行了工具调用：如果执行了，llm_response 与 result 不同

if result != llm_response:

# 把工具调用的原始请求结果添加回消息流中

messages.append({"role": "assistant", "content": llm_response})

# 把工具调用后的实际执行结果，也传递给 LLM 作为 system 消息

messages.append({"role": "system", "content": result})

# 再次调用 LLM 让它根据工具调用结果生成自然语言回复

final_response = self.llm_client.get_response(messages)

logging.info("nFinal response: %s", final_response)

# 记录最终回复到消息历史中

messages.append({"role": "assistant", "content": final_response})

else:

# 如果没有执行 tool call，直接添加回复到消息历史

messages.append({"role": "assistant", "content": llm_response})

根据上述原理分析，可以看出工具文档至关重要。模型依赖于工具描述文本来理解和选择

适用的工具，这意味着精心编写的工具名称、文档字符串（docstring）以及参数说明显

得尤为重要。鉴于 MCP 的选择机制基于 prompt 实现，理论上任何模型只要能够提供相应

的工具描述就能与 MCP 兼容使用。

MCP Server 开发实践

对绝大部分 AI 开发者来说，除了了解 MCP 的原理，我们更关心 Server 的实现。因此，我

这里准备通过一个最简单的示例来介绍如何实现一个 MCP Server。MCP servers 可以提供

三种主要类型的功能：

• Tools（工具）：可以被 LLM 调用的函数或外部服务接口，需要用户授权后执行。

• Resources（资源）：提供类似文件的结构化数据，供 LLM 读取和分析。如本地文件

内容、远程 api 返回的 json 数据、数据库查询结果等。

• Prompts（提示）：预先编写的模板，帮助用户完成特定任务

本教程将主要关注工具（Tools）。

1、使用 LLM 构建 MCP 的最佳实践

在开始之前，Anthropic 为我们提供了一个基于 LLM 的 MCP Server 的最佳开发实践

（https://modelcontextprotocol.io/tutorials/building-mcp-with-llms），Guide 里面特意

提到了，该实践是基于 Claude，也可以基于其它 LLM。总结如下：

1.引入 domain knowledge （说人话就是，告诉他一些 MCP Server 开发的范例和资料）

• 访问 https://modelcontextprotocol.io/llms-full.txt 并复制完整的文档文本。（实测这

个太长了，可以忽略）

• 导航到 MCP TypeScript SDK 或 Python SDK Github 项目中并复制相关内容。

• 把这些作为 prompt 输入到你的 chat 对话中（作为 context）。

2.描述你的需求

• 你的服务器会开放哪些资源

• 它会提供哪些工具

• 它应该给出哪些引导或建议

• 它需要跟哪些外部系统互动

给出一个 example prompt:

... （这里是已经引入的 domain knowledge）

打造一个 MCP 服务器，它能够：

- 连接到我公司的 PostgreSQL 数据库

- 将表格结构作为资源开放出来

- 提供运行只读 SQL 查询的工具

- 包含常见数据分析任务的引导

剩下的部分也很重要，但是偏重于方法论，实践性较弱，这里就不展开了，推荐直接看链

接：https://modelcontextprotocol.io/tutorials/building-mcp-with-llms。

2、手动实践

本节内容主要参考了官方文档：Quick Start: For Server Developers

（https://modelcontextprotocol.io/quickstart/server）。这里准备了一个简单的示例，

使用 Python 实现一个 MCP Server，用来统计当前桌面上的 txt 文件数量和获取对应文件

的名字（你可以理解为一点用都没有，但是它足够简单，主要是为了难以配置环境的读者

提供一个足够短的实践记录）。以下实践均运行在我的 MacOS 系统上。

Step1. 前置工作

• 安装 Claude Desktop。

• Python 3.10+ 环境

• Python MCP SDK 1.2.0+

Step2. 环境配置

# 1. 安装 uv（类似 pip + virtualenv 的现代工具，速度更快）

curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. 创建项目目录

uv init txt_counter

cd txt_counter

# 3. 设置 Python 版本（推荐 Python 3.10+）

echo "3.11" > .python-version

# 4. 创建虚拟环境并激活

uv venv

source .venv/bin/activate

# 5. 安装依赖（包含 mcp[cli] 和 httpx）

uv add "mcp[cli]" httpx

# 6. 创建主程序入口文件

touch txt_counter.py

Question: 什么是 uv 呢和 conda 比有什么区别？

Answer: 一个用 Rust 编写的超快速 (100x) Python 包管理器和环境管理工具，由

Astral 开发。定位为 pip 和 venv 的替代品，专注于速度、简单性和现代 Python

工作流。

Step3. 构造一个 prompt

"""...（这里是已经引入的 domain knowledge）"""

打造一个 MCP 服务器，它能够：

- 功能：

- 统计当前桌面上的 txt 文件数量

- 获取对应文件的名字

要求：

- 不需要给出 prompt 和 resource 相关代码。

- 你可以假设我的桌面路径为 /Users/{username}/Desktop

Domain Knowledge 复制于 MCP Python SDK 的 README 文件

（https://raw.githubusercontent.com/modelcontextprotocol/python-sdk/refs/heads/

main/README.md）

Step4. 实现 MCP Server

以下代码由 Claude 3.7 直接生成。当然这里主要是因为需求足够简单，当需要实现一个复

杂的 MCP Server 时，可能需要多步的引导和 Debug 才能得到最终的代码。

import os

from pathlib import Path

from mcp.server.fastmcp import FastMCP

# 创建 MCP Server

mcp = FastMCP("桌面 TXT 文件统计器")

@mcp.tool()

def count_desktop_txt_files() -> int:

"""Count the number of .txt files on the desktop."""

# Get the desktop path

username = os.getenv("USER") or os.getenv("USERNAME")

desktop_path = Path(f"/Users/{username}/Desktop")

# Count .txt files

txt_files = list(desktop_path.glob("*.txt"))

return len(txt_files)

@mcp.tool()

def list_desktop_txt_files() -> str:

"""Get a list of all .txt filenames on the desktop."""

# Get the desktop path

username = os.getenv("USER") or os.getenv("USERNAME")

desktop_path = Path(f"/Users/{username}/Desktop")

# Get all .txt files

txt_files = list(desktop_path.glob("*.txt"))

# Return the filenames

if not txt_files:

return "No .txt files found on desktop."

# Format the list of filenames

file_list = "n".join([f"- {file.name}" for file in txt_files])

return f"Found {len(txt_files)} .txt files on desktop:n{file_list}"

if __name__ == "__main__":

# Initialize and run the server

mcp.run()

任务非常简单，只需要调用非常基本的 os 就可以完成。

Step5. 测试 MCP Server

$ mcp dev txt_counter.py

Starting MCP inspector...

Proxy server listening on port 3000

MCP Inspector is up and running at http://localhost:5173

之后进入到给出的链接中，你大概能按下图进行操作：

640

Step6. 接入 Claude

最后一步就是把我们写好的 MCP 接入到 Claude Desktop 中。流程如下：

# 打开 claude_desktop_config.json (MacOS / Linux)# 如果你用的是 cursor 或者 vim 请

更换对应的命令 code ~/Library/Application

Support/Claude/claude_desktop_config.json

在配置文件中添加以下内容，记得替换相关路径为实际路径。

{

"mcpServers": {

"txt_counter": {

"command": "/opt/homebrew/bin/uv",

"args": [

"--directory",

"/Users/yangfan/mcp/txt_counter",

"run",

"txt_counter.py"

]

}

uv 最好是绝对路径，推荐使用 which uv 获取。

配置好后重启 Claude Desktop，如果没问题就能看到对应的 MCP Server 了。

640

Step7. 实际使用

接下来，我们通过一个简单的 prompt 进行实际测试：

能推测我当前桌面上 txt 文件名的含义吗？

它可能会请求你的使用权限，如图一所示，你可以点击 Allow for This Chat

640

看起来我们 MCP Server 已经正常工作了！

3、MCP Server Debug

Debug 是一个非常复杂的话题，这里直接推荐官方的教程：

• Official Tutorial: Debugging：https://modelcontextprotocol.io/docs/tools/debugging

• Official Tutorial: Inspector：https://modelcontextprotocol.io/docs/tools/inspector

总结

MCP (Model Context Protocol) 代表了 AI 与外部工具和数据交互的标准建立。通过本文，

我们可以了解到：

• MCP 的本质：它是一个统一的协议标准，使 AI 模型能够以一致的方式连接各种数据

源和工具，类似于 AI 世界的“USB-C”接口。

• MCP 的价值：它解决了传统 function call 的平台依赖问题，提供了更统一、开放、安

全、灵活的工具调用机制，让用户和开发者都能从中受益。

• 使用与开发：对于普通用户，MCP 提供了丰富的现成工具，用户可以在不了解任何

技术细节的情况下使用；对于开发者，MCP 提供了清晰的架构和 SDK，使工具开发

变得相对简单。

MCP 还处于发展初期，但其潜力巨大。更重要的是生态，基于统一标准下构筑的生态也

会正向的促进整个领域的发展。我们可以看看 MCP 工具平台：https://mcp.so/

640

一文讲透MCP的原理及实践

相关文章