从零实战：DeepAgents构建MySQL数据分析助手，附完整代码+可视化调试指南！

本文详细介绍如何使用LangChain团队推出的DeepAgents框架构建MySQL数据分析助手。文章阐述了DeepAgents的核心能力（任务规划、工具调用等）及在数据分析中的优势，深入解析了基于会话的分层架构设计和工具调用实现原理，包括获取表名、表结构、执行SQL等核心功能。通过完整的环境配置、代码实现和Agent Chat UI可视化调试指南，帮助开发者快速搭建企业级数据分析助手，实现从查

Python-搬运工

598人浏览 · 2025-12-14 08:15:00

Python-搬运工 · 2025-12-14 08:15:00 发布

简介

DeepAgents 是 LangChain 团队重磅推出的 Python 框架，专为构建「深度代理」而生——基于 LLM 驱动，具备任务规划、子代理委托、文件系统访问、持久化内存四大核心能力，能轻松应对复杂多步骤任务。而数据分析恰好是这类框架的绝佳应用场景：从查表结构、写SQL，到分析结果，每个环节都是可拆解的步骤，且需要工具与数据的深度交互。

今天这篇文章，不仅带你从零搭建基于DeepAgents的MySQL数据分析助手，更会深度拆解工具调用的核心实现——从工具函数封装、安全校验，到智能体注册调用，每个环节都附代码块分析，让你不仅会用，还懂底层逻辑！

核心优势：为什么选DeepAgents做数据分析？

1.工具调用原生支持：无需额外封装，框架自带工具注册、参数解析能力，轻松集成数据库、文件系统等工具；2.任务规划能力：通过System Prompt定义思维链（CoT），强制AI按步骤调用工具，避免跳跃执行；3.会话与内存持久化：支持会话级上下文管理，工具调用结果、中间状态自动缓存，无需重复操作；4.工作区隔离：每个会话拥有独立文件目录，工具执行（如SQL结果保存、文件上传）互不干扰，安全可控。

企业级架构设计（4层架构+工具调用核心）

系统采用「基于会话（Session-based）」的分层架构，工具调用贯穿核心流程。

重点聚焦：认知执行层的工具调用设计

这是整个系统的核心，工具调用的「定义-注册-执行-反馈」全流程都在这里实现：

2.1 工具集设计原则

•单一职责：每个工具只做一件事（如查表名、查结构、执行SQL），便于AI理解和调用；•安全可控：工具内置权限校验（如SQL仅允许查询）、参数校验（如表名合法性）；•返回友好：工具返回结果格式统一（文本/Markdown），便于LLM读取和分析。

工具调用核心实现（代码块+逐行分析）

下面我们逐一拆解4个核心工具的实现，以及如何注册到DeepAgents智能体中——这是搭建助手的关键步骤，建议收藏对照代码实操！

3.1 工具1：获取数据库所有表名（get_all_tables）

作用：让AI快速了解数据库全貌，为后续表筛选提供基础。

def get_all_tables() -> str:
"""Show all tables in the database"""
try:
conn = get_db_connection()  # 复用数据库连接函数
with conn.cursor() as cursor:
cursor.execute(f"SHOW TABLES FROM {DB_NAME}")
tables = cursor.fetchall()
# 提取表名（适配DictCursor返回格式）
table_names = [list(row.values())[0] for row in tables]
return f"Tables in {DB_NAME}:\n" + "\n".join(table_names)
except Exception as e:
return f"Error fetching tables: {str(e)}"
finally:
# 确保连接关闭，避免资源泄露
if 'conn' in locals() and conn.open:
conn.close()

代码分析：

•连接复用：通过get_db_connection()统一管理数据库连接，降低冗余；•结果格式化：返回清晰的表名列表，LLM无需解析复杂字典结构；•异常处理：捕获数据库连接、查询错误，返回友好提示，避免程序崩溃。

3.2 工具2：获取表结构定义（get_table_definition）

作用：让AI了解目标表的字段名、类型、注释，为写SQL提供依据。

def get_table_definition(table_name: str) -> str:
"""Get the CREATE TABLE statement for a specific table"""
try:
# 核心安全校验：防止SQL注入（表名仅允许字母、数字、点、下划线）
if not table_name.isidentifier() and not table_name.replace('.', '').isidentifier():
return f"Error: Invalid table name '{table_name}'"
conn = get_db_connection()
with conn.cursor() as cursor:
# 执行SHOW CREATE TABLE，获取完整表结构（含注释）
cursor.execute(f"SHOW CREATE TABLE {DB_NAME}.{table_name}")
result = cursor.fetchone()
if result:
return f"Table Definition for '{table_name}':\n{result['Create Table']}"
return f"Table '{table_name}' not found."
except Exception as e:
return f"Error fetching table definition: {str(e)}"
finally:
if 'conn' in locals() and conn.open:
conn.close()

代码分析：

•注入防护：通过isidentifier()校验表名合法性，杜绝table_name="user; DROP TABLE user;"这类恶意输入；•信息完整：返回CREATE TABLE语句，包含字段类型、注释、主键等关键信息，帮助AI准确理解表结构。

3.3 工具3：执行SQL查询（run_sql_query）

作用：AI生成SQL后，通过该工具执行并返回格式化结果（核心工具）。

def run_sql_query(query: str) -> str:
"""Execute a SQL query and return results as markdown table"""
try:
# 核心安全限制：仅允许查询类SQL，杜绝删改操作
allowed_prefixes = ["SELECT", "SHOW", "DESCRIBE"]
if not any(query.strip().upper().startswith(prefix) for prefix in allowed_prefixes):
return "Error: Only SELECT, SHOW, and DESCRIBE queries are allowed for analysis."
conn = get_db_connection()
with conn.cursor() as cursor:
cursor.execute(query)
results = cursor.fetchall()
if not results:
return "Query executed successfully. No results returned."
# 结果格式化：转为Markdown表格，LLM易读，用户直观
df = pd.DataFrame(results)
return df.to_markdown(index=False)
except Exception as e:
return f"Error executing SQL query: {str(e)}"
finally:
if 'conn' in locals() and conn.open:
conn.close()

代码分析：

•操作限制：通过前缀校验，仅允许查询类SQL，从根源避免误删/改数据；•结果优化：用Pandas将字典列表转为Markdown表格，解决LLM难以解析原始数据的问题；•异常捕获：捕获SQL语法错误、字段不存在等问题，返回具体错误信息，帮助AI修正SQL。

3.4 工具4：执行Shell命令（run_shell_command）

作用：辅助操作（如查看文件、数据预处理），扩展助手能力边界。

def run_shell_command(command: str) -> str:
"""Execute a shell command and return stdout/stderr"""
try:
result = subprocess.run(
command,
shell=True,
capture_output=True,
text=True,
timeout=60  # 超时控制：防止命令长时间阻塞
)
output = result.stdout
error = result.stderr
if error:
return f"Output:\n{output}\n\nError:\n{error}"
return output if output else "Command executed successfully (no output)."
except Exception as e:
return f"Error executing command: {str(e)}"

代码分析：

•超时控制：设置60秒超时，避免ping等无限循环命令占用资源；•输出完整：同时返回stdout和stderr，便于AI排查命令执行失败原因。

3.5 工具注册：将工具集成到DeepAgents智能体

工具定义后，需注册到DeepAgents智能体中，LLM才能自主调用。核心代码如下：

# 在DataAnalysisSession类的__init__方法中
def __init__(self, config: AppSessionConfig):
# ... 其他初始化逻辑（工作区、模型配置等）...
# 系统提示词：明确工具调用流程（思维链引导）
system_prompt = """你是专业的MySQL数据分析助手，必须通过以下步骤和工具完成任务：
1. 用write_todos拆解任务（如：1. 查所有表；2. 查用户表结构；3. 统计注册量）；
2. 用get_all_tables获取所有表名，筛选相关表；
3. 用get_table_definition查看目标表结构（重点看字段注释）；
4. 用run_sql_query执行SQL（仅查询类），获取数据；
5. 分析Markdown结果，生成自然语言总结。
工具调用失败时，根据错误信息修正后重试（如表名错误、SQL语法错误）。
"""
# 核心：注册工具到DeepAgents智能体
self.agent = create_deep_agent(
model=self.model,  # 已配置的LLM（如qwen3-coder）
backend=self.backend,  # 文件系统后端（工作区访问）
tools=[get_all_tables, get_table_definition, run_sql_query, run_shell_command],  # 工具列表
system_prompt=system_prompt  # 思维链引导
)

代码分析：

•工具注册：直接将函数列表传入tools参数，DeepAgents会自动解析函数参数、生成调用格式；•思维链引导：通过System Prompt强制AI按步骤调用工具，避免跳过关键环节（如未查表结构就写SQL）；•后端绑定：FilesystemBackend与会话工作区关联，工具（如run_shell_command）的文件操作会限制在会话专属目录。

工具调用工作流（从用户提问到结果返回）

1.用户输入：“统计2025年每月注册用户数”；2.会话初始化：DataAnalysisSession创建独立工作区，初始化智能体；3.AI规划与工具调用：

•第一步：AI调用write_todos生成任务列表（“1. 查所有表；2. 查用户表结构；3. 生成SQL统计每月注册量”）；•第二步：AI调用get_all_tables，返回数据库中所有表名（如user_info、order）；•第三步：AI调用get_table_definition("user_info")，获取字段（如id、register_time、username）；•第四步：AI生成SQL（SELECT DATE_FORMAT(register_time, '%Y-%m') AS month, COUNT(*) AS count FROM user_info WHERE YEAR(register_time)=2025 GROUP BY month），调用run_sql_query；

•工具执行：校验SQL为SELECT类型，执行后返回Markdown表格；

•第五步：AI读取Markdown表格，生成总结（“2025年1-3月注册用户数分别为800、1000、1200，呈逐月增长趋势”）；

4.结果返回：将AI总结通过LangGraph返回给用户。

手把手实操：从0到1搭建部署

第一步：环境准备

# 创建虚拟环境
python -m venv deepagents-env
# 激活环境（Windows）
deepagents-env\Scripts\activate
# 激活环境（Mac/Linux）
source deepagents-env/bin/activate
# 安装依赖（含DeepAgents、LangGraph、数据库驱动等）
pip install pandas pymysql langchain-openai langgraph deepagents

第二步：核心配置修改

# 1. 数据库配置（替换为你的MySQL信息）
DB_HOST = "你的MySQL地址"  # 如127.0.0.1
DB_USER = "用户名"  # 如root
DB_PASSWORD = "密码"  # 如123456
DB_NAME = "数据库名"  # 如user_data
# 2. LLM配置（对接本地/远程模型）
os.environ["OPENAI_API_BASE"] = "http://你的模型地址:端口/v1"  # 如http://127.0.0.1:18080/v1
os.environ["OPENAI_API_KEY"] = "dummy"  # 本地模型填占位符

第三步：本地测试（工具调用验证）

async def main():
# 会话配置
config = AppSessionConfig(
session_id="test_session_001",
workspace_base=os.path.join(BASE_DIR, "sessions")
)
session = DataAnalysisSession(config)
# 测试查询（触发工具调用流程）
query = "1. 显示数据库所有表；2. 查看user_info表结构；3. 统计2025年每月注册用户数"
response = await session.send_message(query)
# 打印结果（含工具调用过程和最终总结）
for msg in response:
print(msg.content)
if __name__ == "__main__":
asyncio.run(main())

可视化调试：用Agent Chat UI对接智能体

Agent Chat UI 是 LangChain 官方开发的 基于 Next.js 的可视化聊天工具，专为 LangGraph 代理设计——支持工具调用流程可视化、会话历史管理、错误日志查看，比命令行测试更直观，是调试智能体的绝佳选择！

6.1 Agent Chat UI 核心优势

1.可视化工具调用：清晰展示AI调用了哪些工具、参数是什么、返回结果如何；2.会话持久化：自动保存聊天记录，支持多轮对话上下文连贯；3.错误排查：工具调用失败时，可查看完整错误日志，快速定位问题；4.零代码对接：只需配置LangGraph服务地址，即可连接智能体。

6.2 部署与配置步骤

第一步：安装Agent Chat UI

# 1. 克隆官方仓库（需提前安装Git）
git clone https://github.com/langchain-ai/agent-chat-ui.git
cd agent-chat-ui
# 2. 安装依赖（需提前安装Node.js 18+）
npm install

第二步：配置LangGraph服务地址

1.打开Agent Chat UI配置文件：agent-chat-ui/app/config.ts2.修改langGraphEndpoint为你的LangGraph服务地址（本地默认是http://localhost:22204）：

// agent-chat-ui/app/config.ts
export const config = {
// 核心配置：对接你的LangGraph服务
langGraphEndpoint: "http://localhost:22204", // 本地LangGraph服务地址
// 可选配置：设置API密钥（如果你的服务需要认证）
apiKey: "dummy", // 本地服务无需认证，填占位符即可
// 其他配置保持默认
title: "DeepAgents MySQL数据分析助手",
description: "基于DeepAgents的可视化数据分析工具",
};

第三步：启动LangGraph服务（后端）

回到你的智能体代码目录，启动LangGraph服务：

# 确保已激活Python虚拟环境
langgraph dev --host 0.0.0.0 --port 22204

此时后端服务会在http://localhost:22204运行，等待Agent Chat UI连接。

第四步：启动Agent Chat UI（前端）

在agent-chat-ui目录下执行：

# 启动前端服务（默认端口3000）
npm run dev

第五步：开始可视化调试

1.浏览器访问：http://localhost:3000，即可看到聊天界面；

2.输入测试查询（如“统计2025年每月注册用户数”），点击发送；3.查看工具调用流程：

•左侧：聊天输入/输出区域，展示最终结果；•右侧：工具调用日志，可展开查看每个工具的调用参数、返回结果；•若工具调用失败（如表名错误、SQL语法错误），右侧会显示完整错误信息，便于调试。

6.3 调试示例：查看工具调用详情

当你输入“统计2025年每月注册用户数”后，Agent Chat UI右侧会显示完整的工具调用链路：

1. 调用write_todos → 返回任务列表
2. 调用get_all_tables → 返回数据库表名列表
3. 调用get_table_definition("user_info") → 返回表结构
4. 调用run_sql_query → 返回Markdown格式的统计结果

点击每个工具调用项，可展开查看：

•工具名称和参数；•执行状态（成功/失败）；•完整返回结果。

总结：DeepAgents+Agent Chat UI的高效开发组合

1.DeepAgents：负责底层智能体逻辑、工具调用、任务规划，让你无需关注复杂的代理架构，聚焦业务工具开发；2.Agent Chat UI：负责前端可视化调试，让工具调用流程、错误信息一目了然，大幅提升调试效率；3.LangGraph：作为中间层，连接智能体与UI，提供稳定的API服务，支持多用户并发访问。

借助LangChain生态的这套“组合拳”，我们能以极低的成本搭建企业级数据分析助手——既保证了底层架构的稳定性、安全性，又通过可视化工具降低了开发调试门槛。无论是个人开发者快速验证想法，还是团队落地生产级应用，这套方案都能完美适配！

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

😝 一直在更新，更多的大模型学习和面试资料已经上传带到CSDN的官方了，有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

在这里插入图片描述

👉AI大模型学习路线汇总👈

大模型学习路线图，整体分为7个大的阶段：（全套教程文末领取哈）

第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

在这里插入图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求： 大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能， 学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力： 大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉获取方式：

😝 一直在更新，更多的大模型学习和面试资料已经上传带到CSDN的官方了，有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇
在这里插入图片描述

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

Chess用户界面设计：Tailwind CSS样式系统和组件库

GitHub推荐项目精选中的ch/chess是一个类似chess.com的多人在线象棋平台，它采用现代化的前端技术栈构建，尤其在用户界面设计上通过Tailwind CSS样式系统和组件库实现了优雅且功能丰富的交互体验。本文将深入探讨该项目如何利用Tailwind CSS打造一致的设计语言和高效的组件系统，为象棋爱好者提供沉浸式的游戏界面。## 🎨 Tailwind CSS样式系统：构建统一视

火山引擎 ADG 社区

终极指南：GPT-Engineer如何通过AI自动发现代码问题并提升质量

GPT-Engineer是一款强大的AI驱动代码工具，它能帮助开发者自动检测潜在代码问题、优化代码质量，让编程效率提升3倍以上。无论是新手还是资深开发者，都能通过这款工具轻松发现代码中的隐藏缺陷，减少调试时间，释放更多精力在创造性工作上。## 一键发现代码问题：GPT-Engineer的AI审查魔力GPT-Engineer的核心能力在于其内置的智能代码分析系统。通过集成Python代码格式

火山引擎 ADG 社区

SatDump中的纠错编码技术：从RS码到Turbo码的完整实现指南

在卫星数据传输过程中，信号往往会受到各种干扰，导致数据错误。SatDump作为一款通用卫星数据处理软件，集成了多种先进的纠错编码技术，确保从卫星接收到的数据能够准确解码。本文将深入解析SatDump中从Reed-Solomon（RS）码到Turbo码的实现细节，帮助读者理解这些技术如何保障卫星通信的可靠性。## 为什么纠错编码对卫星数据至关重要？卫星与地面站之间的通信链路面临着空间辐射、大