别再为 Claude Code 付费了！LangGraph + MCP，手把手教你搭建自己的免费编码助手！

实践是最好的学习方式。为了深入理解 LangGraph 和模型上下文协议（MCP）服务器的生态，我们来从零开始构建一个 CLI 编码代理。我们的目标是，抛开 Claude Code 那些花里胡哨的功能，看看最基础的编码代理能做到什么程度。

程序猿李巡天

973人浏览 · 2025-12-08 11:03:11

程序猿李巡天 · 2025-12-08 11:03:11 发布

那些商业编码代理往往会添加各种专有的"秘密配方"——特殊的上下文管理、精心设计的提示策略、优化过的工具选择算法。这些技术细节被包装得严严实实，很难搞清楚哪些是必需的，但对于学习来说，那些只是锦上添花。我们这篇文章的目标是验证一个问题：用最简单的方式让 LLM 在无限循环里不断调用工具，这样的"裸机"代理到底行不行？那些复杂的技术栈是真的必要吗，还是过度设计了？

一、核心功能设计

这个代理的设计理念就是极简但实用。整个系统由一个交互式状态图驱动，信息流向很清晰：用户输入 → 模型响应 → 工具调用 → 回到用户，形成持续的对话循环。本地功能实现了文件读取器和 pytest 的封装用于单元测试。MCP 集成覆盖了几个关键场景：Desktop Commander 负责文件系统操作，Pydantic AI 的沙箱 Python MCP 跑在 Deno Docker 容器里，DuckDuckGo 提供网络搜索，还有官方的 GitHub MCP。为了提升可观测性，还加入了丰富的终端界面和 Mermaid 工作流可视化，可以清楚地看到代理的思考和执行过程。

下面是几个使用示例：

通过 Desktop Commander MCP 的 read_file 工具读取 TypeScript 文件并展示内容

利用 DuckDuckGo 的 MCP 执行网络搜索

二、快速上手

环境准备很简单，只需要对 Docker 和命令行有基本了解就够了。启动主代理的命令：

 
uv run main.py

如果要用沙箱 Python 执行功能，需要先构建 Deno MCP 的 Docker 镜像：

 
docker build -t deno-docker:latest -f ./mcps/deno/Dockerfile .

启动后可以试试这些指令来体验功能：

“Show me the content of main.py”
“What tools do you have?”
“Read requirements.txt”

三、状态持久化与调试

集成了 langgraph-checkpoint-sqlite 来跟踪对话历史，方便调试。这个基于 SQLite 的检查点机制很适合本地实验场景。可以直接从终端查看代理状态：

 
sqlite3 checkpoints.db "SELECT * from writes LIMIT 2"

sqlite3 checkpoints.db "SELECT * from checkpoints LIMIT 2"

四、Pytest 集成

传统做法是写完代码手动跑测试，而现在代理会自动执行这个流程。体验提升非常明显：只需要说"X 功能有问题"，代理就会跑测试套件，定位失败的测试用例，分析错误信息，然后给出针对性的修复方案。这彻底省掉了盯着测试日志发呆或者把终端输出复制到 ChatGPT 的繁琐操作，代理拿到的上下文信息足够精确，诊断效率大幅提高。

五、代码实现

这套代码基于 LangChain 框架，使用 Claude 3 Sonnet 作为核心模型来处理代码库的维护和开发任务。整个系统采用 StateGraph 工作流，包含三个关键节点：user_input、model_response 和 tool_use。

流程在节点间流转，模型响应决定下一步是调用工具还是回到用户输入环节。AgentState 负责维护状态，跟踪完整的消息历史。

核心工作流的实现代码：

 
# Key workflow setup from the Agent class

def __init__(self):

    self.workflow = StateGraph(AgentState)

    # Register the three main nodes

    self.workflow.add_node("user_input", self.user_input)

    self.workflow.add_node("model_response", self.model_response)

    self.workflow.add_node("tool_use", self.tool_use)

    # Define the flow

    self.workflow.set_entry_point("user_input")

    self.workflow.add_edge("user_input", "model_response")

    self.workflow.add_edge("tool_use", "model_response")

    # Conditional routing based on tool usage

    self.workflow.add_conditional_edges(

        "model_response",

        self.check_tool_use,

        {

            "tool_use": "tool_use",

            "user_input": "user_input",

        },

    )

代理同时加载本地工具（比如单元测试）和运行在 Docker 容器里的 MCP 工具。工具设计上返回结构化的 ToolMessages，让 StateGraph 能够正确路由响应回模型。这些工具支持运行 Python 代码、搜索 DuckDuckGo、与 GitHub 交互等操作。状态在交互间通过 SQLite 检查点机制保持。

六、LangGraph 的状态架构解析

StateGraph 工作流机制值得单独拿出来细说，因为它是整个代理模式的基础支撑。LangGraph 的 StateGraph 实现了带持久化状态管理的有向图工作流。架构分解如下：

状态管理

 
class AgentState(BaseModel):

    messages: Annotated[Sequence[BaseMessage], add_messages]

AgentState 类基于 Pydantic 的 BaseModel，维护完整对话历史，在图遍历过程中追踪所有消息类型（系统消息、用户消息、助手消息和工具消息）。

图结构设计

工作流由三个节点构成有向图：

用户输入节点：入口点，收集用户输入
模型响应节点：用 Claude 处理输入并决策下一步行动
工具使用节点：响应模型请求执行具体工具

图的配置代码：

 
# Core graph structure

workflow = StateGraph(AgentState)

# Node registration

workflow.add_node("user_input", self.user_input)

workflow.add_node("model_response", self.model_response)

workflow.add_node("tool_use", self.tool_use)

# Edge connections

workflow.set_entry_point("user_input")

workflow.add_edge("user_input", "model_response")

workflow.add_edge("tool_use", "model_response")

流程控制逻辑

图通过 check_tool_use 实现条件路由：

user_input → model_response（固定路径）
model_response → tool_use（存在工具调用时）
model_response → user_input（无工具调用时）
tool_use → model_response（固定路径）

持久化机制

通过 AsyncSqliteSaver 使用 SQLite 做检查点：

 
db_path = os.path.join(os.getcwd(), "checkpoints.db")

self._checkpointer_ctx = AsyncSqliteSaver.from_conn_string(db_path)

self.checkpointer = await self._checkpointer_ctx.__aenter__()

self.agent = self.workflow.compile(checkpointer=self.checkpointer)

这套机制让对话状态能跨会话保持遇到中断也能恢复。整个工作流构成一个持续循环，代理可以处理用户输入、生成响应、按需调用工具，在整个交互过程中保持上下文连贯性。

七、MCP 服务器的模块化实践

MCP 的配置用到了 LangChain 的 mcp-adapters 库，调用 get_tools 方法。某些工具需要在系统提示词里补充描述信息，确保检索准确性。把 MCP 服务器打包成容器解决了环境冲突和依赖管理，用户直接跑容器就行，不用折腾安装配置。

Desktop Commander MCP 提供的能力和 Claude Code 基本重合：完整的文件系统操作、代码编辑、审计日志。通过 Docker bind mount 配置把访问范围限制在测试文件夹，保持严格隔离。这种方式让实验变得安全，不用担心搞坏实际文件系统。

Pydantic AI 的 run-python MCP 基于 Deno 容器创建沙箱 Python 执行环境。Deno 在 WebAssembly 沙箱里跑 Pyodide，阻止 LLM 在系统上执行危险代码或任意操作。虽然本地安装 Deno 也相对安全，但这会让本地环境变得臃肿。

DuckDuckGo MCP 提供互联网搜索能力，需要实时信息检索时调用。

官方 GitHub MCP 负责代码仓库搜索和管理功能。

八、实践中的几个关键问题

安全性和可配置性。 对代理的访问权限必须有精细控制。可以给 MCPs 做 Docker 化并设置特定权限——比如 GitHub MCP 用只读标志运行来保护仓库。文件系统访问权限需要有简单的开关机制。，用 gh CLI 工具替代 GitHub MCP 可能更合理，能减少 token 消耗，和 Desktop Commander MCP 的终端访问配合也更流畅。随着 Claude Skills 推出和 CLI 工具链成熟，现在有更好的方案来防止上下文污染且保持功能完整。

工具过载是个要注意的问题。 MCPs 加载所有工具及其描述至少两次：初始化代理时一次，每次用户查询时又一次。如果各种 MCPs 加起来有 40 多个工具，LLM 上下文很快就被塞满了。必须仔细检查每个 MCP 的工具命名，避免不同来源的函数名冲突。

MCP 资源使用是事件驱动的。 MCPs 按需启动，资源消耗呈现尖峰特征，但在 MacBook Pro 上不算过分。编码代理需要从 MCP 客户端调用工具时，会用指定命令生成 MCP 进程——通常是 docker run，也可能是 npx 或 Python 命令。容器运行时长刚好够执行工具调用，然后自行终止和清理，释放 CPU 资源给下一个操作。这种按需架构让代理保持轻量，同时能访问丰富的工具生态。

MCP 分发方式。 很多 MCPs 提供预配置的 Docker 镜像，可以快速集成到编码代理里，方便维护隔离性。不过很多 MCPs 也有 Python 库版本，想要更紧密的集成且不需要额外安全层的话可以本地安装。

langchain-mcp 还不错。 用 langchain-mcp-adapters 库可以把 MCPs 桥接到 LangGraph，和 FastMCP 库的类似功能差不多水平。但它提供了平滑的接口，把 MCP 工具转换成 LangChain/LangGraph 兼容的工具，改动代码不多。

工具调用前的用户许可机制需要完善。 代理执行工具不会提前征求许可，感觉风险挺大。可以在工具调用前加入人机交互环节能解决这个问题，但代价是会打断代理的执行流程。

九、后续改进方向

几个增强功能值得考虑。跨个人笔记的综合 RAG 工具——覆盖 Notion、Obsidian、文本文件、markdown——能让代理访问多年积累的知识和研究资料。加入 Confluence MCP 或内部文档 CLI 可以快速搜索公司特定的实践规范。如前面提到的，换成 gh CLI 替代 GitHub MCP 能节省 token。最后在每次工具调用前实现人机交互中断会增加关键的安全层，不过希望做成可配置的，避免在可信操作时频繁打断代理。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla