引言

在文中,我将展示一个超快速教程,教你如何使用 Pydantic AI、MCP 和高级网页抓取技术,构建一个强大的智能聊天机器人,适用于商业或个人用途。

MCP 逐渐被接受,因为它是一个开放标准。我制作了一些非常酷的视频,你一定会喜欢。在 AI 项目开发中,AI 模型的集成非常复杂,现有框架如 LangGraph 和 Pydantic AI Tools 存在一些问题。LangGraph 和 Pydantic AI 的代码抽象度高,且过于商业化。

MCP 的优势在于,开放标准便于服务提供商开发 API,避免开发者重复造轮子,并允许他们使用现有的 MCP 服务来增强智能代理的功能。

最近,DeepSeek 发布了一个新的开源模型 DeepSeek-V3,这是一个拥有 6710 亿参数的专家混合模型(MoE),其中每个 token 激活 370 亿参数。训练仅耗时两个月,成本不到 600 万美元,足以与 ChatGPT 竞争,并震撼全球 AI 社区。

DeepSeek-V3 的完整训练仅需 278.8 万 GPU 小时。假设 H800 GPU 的租赁价格为每 GPU 小时 2 美元,DeepSeek-V3 的总训练成本仅为 557.6 万美元。

Pydantic AI 是一个我在多个视频中介绍过的框架,因此这里不再详细描述。但其应用非常易于理解。

接下来,我将通过一个实时聊天机器人演示,向你展示我的意思。

演示

我将提出两个问题:“搜索有关人工智能的最新新闻”和“创建一个柱状图,展示全球五大城市的人口”。你也可以提出任何你想问的问题。

聊天机器人使用模型控制协议(MCP),其中不同工具协同工作以完成任务。Python 工具由 FastMCP 驱动,可以安全地运行 Python 代码,并使用 PythonREPL 类创建可视化内容。它包含两个工具:python_repl(code: str) 用于运行代码,data_visualization(code: str) 用于生成 Matplotlib 图表。

网页搜索工具使用 Exa API 获取搜索结果,配置 FastMCP 作为 API 客户端,默认返回五个搜索结果,并以 Markdown 格式返回答案。

AI 代理连接到两个 MCP 服务器,必要时进行重试,并执行多步骤任务,如使用 exa_search.py 查找气候变化数据或使用 python_tools.py 创建柱状图。

免责声明:本文仅用于研究为目的。我们不鼓励任何人抓取网站,特别是那些可能有条款和条件禁止此类行为的网页。

DeepSeek V3 是如何训练的?

DeepSeek 能够在两年内以仅 557 万美元的成本开发出高性能 AI 模型,这得益于以下创新技术:

精确激活部分“脑细胞”

DeepSeek-V3 采用了“混合专家架构”设计。简单来说,它只在需要时激活部分“脑细胞”,而不是全部,从而大大降低了计算资源消耗。训练模型仅使用了 2048 个 NVIDIA H800 GPU。

数据处理与节能创新

DeepSeek 开发了内部工具来生成高质量训练数据,并使用“蒸馏技术”进一步压缩计算资源。训练过程中使用了 FP8 技术,这种低精度数据格式可以显著降低显存需求,同时提高效率。FP8 技术将显存需求降至传统 FP16 技术的一半,同时保持相同的计算性能。

开始编码

我们通过以下方式初始化代码:

MCPServerStdio:以子进程方式运行服务器,并通过 stdio 传输进行连接。•FastMCP:使构建 MCP 服务器变得简单直观。创建工具、公开资源并使用简洁的 Python 代码定义提示。•exa_py:原名 Metaphor,是一个基于大型语言模型的搜索引擎 🔍,允许用户使用完整句子和自然语言进行搜索,还能模拟人们在网络上分享和讨论链接的方式来查询内容。

app.py

import os

exa_search.py

from mcp.server.fastmcp importFastMCP

python_tools.py

from mcp.server.fastmcp importFastMCP

我们定义了一个由 FastMCP 驱动的 Python 工具,用于执行任意 Python 代码并使用 Matplotlib 生成数据可视化。它包括一个 PythonREPL 类,在受限环境中运行 Python 代码,重定向标准输出 sys.stdout 以捕获执行结果,并返回输出或错误堆栈信息。

它提供了两个 MCP 工具:python_repl(code: str) 执行 Python 代码并返回其输出;data_visualization(code: str) 运行 Python 代码,保存 Matplotlib 图表,并将图像返回为 base64 编码字符串,处理可能出现的错误。

使用 FastMCP("python_tools") 定义了一个用于执行 Python 任务的多代理工具,并在直接执行时作为 MCP 服务器运行。

from mcp.server.fastmcp importFastMCP

然后,我们使用 Exa API 在 MCP(模型控制协议)框架内设置了一个网页搜索工具。首先加载环境变量并初始化 FastMCP 及其元数据。

接着,使用环境变量中的 API 密钥(或默认密钥)配置 Exa API 客户端。定义了默认搜索配置,每次搜索默认返回五个结果,除非另有指定。主要函数注册为 MCP 工具,异步查询 Exa API,并以 Markdown 格式返回结果。

format_search_results() 函数结构化输出结果,包括标题、URL、发布日期和摘要(如果可用)。如果直接执行脚本,则运行 MCP 实例。

from mcp.server.fastmcp importFastMCP

我开发了一个 AI 代理,利用 DeepSeek Chat 模型处理请求,同时集成了两个 MCP(模型控制协议)服务器:

exa_search.py:使用 Exa API 处理网页搜索。•python_tools.py:提供基于 Python 的工具,包括数据分析和可视化。

代理通过 agent.run_mcp_servers 定义,连接到这些服务器,并在必要时重试最多三次。主要函数运行 MCP 服务器并执行多步骤任务:

1.搜索近期气候变化统计数据。2.使用 Python 生成一个柱状图,展示过去十年全球气温上升情况。

import os

结论

MCP 不仅仅是一个协议或架构模式,它代表了设计 AI 驱动应用和分布式系统的根本转变。通过有效分离模型、上下文和协议,组织可以创建适应性强、可扩展且易于维护的解决方案。

DeepSeek-V3 体现了这种理念,证明了算法优化和工程创新即使在资源有限的情况下也能生产出顶尖的 AI 模型。

这一突破不仅挑战了传统的 AI 商业模式,还为企业家和开发者打开了大门,让他们能够利用高性能 AI 作为包容性创新的工具。

学习是一个过程,只要你学习,就会有挑战。上帝奖励努力工作,你越努力,就会变得越好。

如果文章对你有用请关注我!🎉

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2025 年 AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享

👇👇扫码免费领取全部内容👇👇

一、学习必备:100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT,帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例?大模型电子书?这份资料帮你站在 “行业高度” 学 AI

1. 100+本大模型方向电子书

在这里插入图片描述

2. 26 份行业研究报告:覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容,涵盖:

  • 职业趋势:《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》;
  • 商业落地:《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》;
  • 领域细分:《AGI 在金融领域的应用报告》《AI GC 实践案例集》;
  • 行业监测:《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT:听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会,包含百度、腾讯、字节等企业的一线实践:

在这里插入图片描述

  • 安全方向:《端侧大模型的安全建设》《大模型驱动安全升级(腾讯代码安全实践)》;
  • 产品与创新:《大模型产品如何创新与创收》《AI 时代的新范式:构建 AI 产品》;
  • 多模态与 Agent:《Step-Video 开源模型(视频生成进展)》《Agentic RAG 的现在与未来》;
  • 工程落地:《从原型到生产:AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看:大厂 AI 岗面试 “弹药库”,300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗?这份面试资料帮你提前 “押题”,拒绝临场慌!

1. 107 道大厂面经:覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景,包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题,每道题都附带思路解析

2. 102 道 AI 大模型真题:直击大模型核心考点

针对大模型专属考题,从概念到实践全面覆盖,帮你理清底层逻辑:

3. 97 道 LLMs 真题:聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案,比如让很多人头疼的 “复读机问题”:


三、路线必明: AI 大模型学习路线图,1 张图理清核心内容

刚接触 AI 大模型,不知道该从哪学起?这份「AI大模型 学习路线图」直接帮你划重点,不用再盲目摸索!

在这里插入图片描述

路线图涵盖 5 大核心板块,从基础到进阶层层递进:一步步带你从入门到进阶,从理论到实战。

img

L1阶段:启航篇丨极速破界AI新时代

L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。

img

L2阶段:攻坚篇丨RAG开发实战工坊

L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

img

L3阶段:跃迁篇丨Agent智能体架构设计

L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。

img

L4阶段:精进篇丨模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

img

L5阶段:专题集丨特训篇 【录播课】

img
四、资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口?别犹豫,这份免费资料就是你的 “起跑线”!

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐