MCP的出现到底解决了什么问题?本文从非技术视角讲解MCP是什么、它的出现带来的价值及其对Agent的关键意义。

从顶层架构视角回顾AI Agent,了解MCP概念的位置

在之前的基础概念科普文章中我们曾经梳理过,一个AI应用产品的顶层层次架构角度,自底向上可以分为基础层、模型层、应用层和用户层。我们基于这些层次,分层解释了算力、算法、模型、AI Agent等概念及其之间的关系。

下面这张图非常全面地总结了这些AI基础概念和他们之间的关系。我们从一个顶层视角看,AI Agent在「应用层」的位置。

img

图片为作者原创梳理

关于AI Agent,这里我们也简单回顾一下概念。**AI Agent(人工智能体)**是能够感知环境、自主规划、进行决策和执行动作以实现目标的智能体。简单来说,相比只有LLM ,Al Agent 可以独立思考,并做出行动。在AI Agent的工作原理中,调用外部数据源、工具是AI Agent能够一站式完成复杂任务的关键。MCP则在模型调用这些外部各类资源和工具中发挥作用,它提供了一种高效标准化的调用方式。因此,MCP是在解决Agent应用的开发问题。

从API到MCP,MCP带来了什么变化?

MCP全称为Model Context Protocol,即模型上下文协议,用于标准化应用程序向大语言模型提供上下文的方式。就像 USB-C 为设备连接各种外设和配件提供了标准化方式一样,MCP 为 AI 模型连接不同的数据源和工具提供了一种标准化方式。

在 MCP出现之前,AI Agent 与外部工具的“握手”主要依赖直接API调用。然而不同工具的API设计千差万别(认证方式、输入输出格式、错误处理),适配器代码复杂且易出错,Agent 本体需要嵌入或管理大量特定工具的调用逻辑,变得庞大且难以管理。MCP的核心思想是在AI Agent和外部工具之间建立一个标准化的、通用的“通信层”。让智能体与外部工具、数据源及API资源的连接问题变得更加简单。

我们通过一个具象的场景来具体解释MCP的作用。“扣子”是字节跳动基于豆包大模型打造的AI应用开发平台,我们可以在这个平台中利用大模型、自定义工作流来零代码搭建一个智能体应用。进入到扣子的开发平台可以看到,它提供了丰富的“插件”供我们搭建智能体时进行调用。比如我们要搭建一个专用于提供旅游规划方案的智能体,那么搭建过程中就需要调用天气数据查询、路线规划相关的外部工具接口。

img

图片来源:截图自扣子平台的插件商店功能

这些插件可以以API的方式供用户调用。然而,不同工具的API设计并不相同(认证方式、输入输出格式、错误处理)。而MCP则让所有的API、工具、数据源能够按照统一的协议“改造”,只要经过一次“改造”,这些工具都可以被开发者直接调用。

下面是使用MCP对智能体搭建者和插件工具的提供者带来的显著变化对比。

img

img

值得提一下的是,MCP的出现并不代表着API的方式就失去意义。在不同的情况下,两者具有不同的优势。更加丰富的交互需求下MCP更合适。

MCP架构

MCP 主要由三个核心组件组成:主机(Host)、客户端(Client)和 服务器(Server)。

img

图片来源:ailydoseofds

  • **主机:**任何提供 AI 交互环境的应用程序,它能访问工具和数据,并运行 MCP 客户端。

  • **MCP 客户端:**在主机内运行,用于与 MCP 服务器直接通信。

  • **MCP 服务器:**暴露特定功能并提供数据访问,例如:工具(使 LLM 能通过服务器执行操作)、资源(向 LLM 公开服务器中的数据和内容)、提示(创建可重用的提示模板和工作流)。

我们可以用一个场景看MCP组件是如何发挥作用的:

  1. 用户触发请求 (Host):你在 VS Code 中右键点击 api_service.py → 选择 “Claude: 解释此代码如何工作”。Claude 插件 (Host)捕获到操作指令:解释代码 ,目标文件:[绝对路径]/project/src/api_service.py (Host 不尝试读取文件内容,仅将结构化请求发送给 Claude 模型)。
  2. Claude 模型收到请求,判断“要解释代码,必须先读取文件内容。但模型自身无权访问用户本地文件系统。”模型主动生成MCP 工具调用指令。
  3. 插件内的MCP Client被激活,根据指令定位和调用预配置的本地代码分析 MCP Server。
  4. Server 按指令执行受限操作,将代码原始文件内容通过 Client 返回至 Claude 模型,模型接收原始数据并分析代码生成结果。
  5. 分析最终结果通过 Host 展示 (用户界面)。

MCP对AI Agent的关键意义

MCP的出现对Agent开发者和整个生态都有着关键意义:

  • **提升开发效率:**Agent 开发者摆脱了为每个工具编写适配器的苦差事。只需学习 MCP 标准,即可调用所有兼容 MCP 的工具。
  • 降低维护成本: 工具API变更时,只需更新其对应的 MCP 客户端适配器,无需修改所有依赖它的 Agent。
  • **提升灵活性:**Agent 的能力不再受限于预先集成的工具。在运行时,它可以动态发现并调用任何注册在 MCP 网络上的新工具,实现“即插即用”的工具扩展。
  • **简化Agent设计:**Agent 本体变得轻量化和通用化。它只需专注于核心的规划、决策和推理逻辑,复杂的工具调用细节由 MCP 层处理。
  • **提升兼容性与互操作性:**MCP 作为通用协议,屏蔽了底层工具的异构性。不同团队开发的 Agent 和工具,只要遵循 MCP 标准,就能无缝协作。
  • **生态繁荣:**新工具接入生态的成本大幅降低,鼓励更多工具提供者开发 MCP 适配器,形成丰富的“工具市场”,反哺 Agent 能力的爆炸式增长。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐