别再只玩AutoGPT了！手把手教你用Python+LangChain从零搭建一个ReAct智能体（附完整代码）

weixin_33688840

504人浏览 · 2026-05-31 16:45:18

weixin_33688840 · 2026-05-31 16:45:18 发布

从零构建ReAct智能体：Python+LangChain实战指南

在AI技术快速迭代的今天，AutoGPT等现成工具固然方便，但真正理解智能体工作原理的方式莫过于亲手搭建一个。本文将带你用Python和LangChain框架，从零开始构建一个具备ReAct能力的智能体原型。不同于单纯调用API，我们将深入架构设计、核心逻辑实现和调试技巧，让你获得第一手的开发经验。

1. 环境准备与基础架构

构建智能体的第一步是搭建开发环境。我们推荐使用Python 3.9+版本，这是目前与主流AI框架兼容性最好的版本。以下是需要安装的核心依赖：

pip install langchain==0.1.0 openai==1.12.0 python-dotenv==1.0.0

关键组件选择考量 ：

LangChain：提供了智能体开发所需的模块化组件
OpenAI API：作为底层语言模型驱动推理能力
python-dotenv：安全管理API密钥等敏感信息

在项目根目录创建 .env 文件存储API密钥：

OPENAI_API_KEY=your_api_key_here

基础架构设计上，一个典型的ReAct智能体包含以下模块：

class ReActAgent:
    def __init__(self):
        self.memory = []  # 存储历史交互记录
        self.tools = []   # 可用工具集
        self.llm = None   # 语言模型实例
        
    def think(self, observation):
        """生成推理和行动"""
        pass
        
    def act(self, action):
        """执行具体行动"""
        pass
        
    def run(self, task):
        """主循环控制"""
        pass

2. 核心ReAct循环实现

ReAct的核心在于"推理-行动-观察"的循环机制。让我们用Python实现这个关键流程：

def react_cycle(agent, initial_observation, max_steps=5):
    observation = initial_observation
    for _ in range(max_steps):
        # 推理阶段
        thought, action = agent.think(observation)
        print(f"Thought: {thought}")
        
        # 行动阶段
        if action == "FINISH":
            return "Task completed"
        observation = agent.act(action)
        print(f"Observation: {observation}")
    
    return "Max steps reached"

循环控制要点 ：

每轮循环包含完整的Think-Act-Observe三阶段
设置最大步数防止无限循环
明确终止条件（如返回FINISH动作）

实现思考生成函数时，Prompt设计尤为关键。以下是经过优化的Prompt模板：

REACT_PROMPT = """你是一个智能体，正在尝试解决以下任务：
{task}

你可以使用这些工具：
{tools}

之前的交互记录：
{history}

当前观察：
{observation}

请按以下格式响应：
Thought: 你的推理过程
Action: 要执行的动作（必须是提供的工具之一或FINISH）"""

3. 工具集成与功能扩展

智能体的实用性取决于其工具集。让我们实现几个常用工具：

from langchain.tools import BaseTool

class WebSearchTool(BaseTool):
    name = "search"
    description = "执行网络搜索，输入应为搜索关键词"
    
    def _run(self, query: str) -> str:
        # 实际实现会调用搜索引擎API
        return f"关于'{query}'的搜索结果摘要..."

class CalculatorTool(BaseTool):
    name = "calculate"
    description = "执行数学计算，输入应为数学表达式"
    
    def _run(self, expression: str) -> str:
        try:
            result = eval(expression)
            return str(result)
        except:
            return "计算失败"

工具注册到智能体的示例代码：

agent = ReActAgent()
agent.tools = [WebSearchTool(), CalculatorTool()]

工具设计最佳实践 ：

每个工具应有明确的名称和描述
输入输出格式要标准化
包含错误处理逻辑
描述要足够详细以便LLM理解使用场景

4. 记忆机制与上下文管理

有效的记忆系统是智能体持续学习的关键。我们实现一个简单的滚动窗口记忆：

class RollingMemory:
    def __init__(self, window_size=3):
        self.window_size = window_size
        self.memories = []
        
    def add(self, thought, action, observation):
        self.memories.append((thought, action, observation))
        if len(self.memories) > self.window_size:
            self.memories.pop(0)
            
    def get_context(self):
        return "\n".join(
            f"Thought: {t}\nAction: {a}\nObservation: {o}"
            for t, a, o in self.memories
        )

记忆系统优化策略 ：

关键信息提取：只保留最相关的记忆片段
重要性加权：给重要事件分配更高权重
情感标记：标注成功/失败经历以供参考
定期摘要：将多个记忆合并为概括性描述

5. 调试与性能优化

开发过程中常见的挑战及解决方案：

问题1：智能体陷入循环

# 检测重复模式
def has_loop(memory, threshold=3):
    recent = [m[1] for m in memory.memories]  # 提取动作序列
    return any(recent.count(a) >= threshold for a in set(recent))

问题2：低质量推理 优化Prompt的实用技巧：

添加推理示例
明确限制条件（"不要假设未提供的信息"）
要求逐步验证（"在得出结论前验证每个步骤"）

性能评估指标 ：

def evaluate_agent(agent, test_cases):
    results = []
    for task, expected in test_cases:
        start = time.time()
        output = agent.run(task)
        elapsed = time.time() - start
        success = output == expected
        results.append((task, success, elapsed))
    return results

6. 实战案例：旅行规划助手

让我们构建一个能实际解决复杂任务的智能体。这个旅行规划助手需要：

查询目的地信息
比较交通选项
考虑用户预算
生成合理行程

travel_agent = ReActAgent()
travel_agent.tools = [
    WebSearchTool(),
    CalculatorTool(),
    FlightSearchTool(),  # 假设已实现
    HotelSearchTool()    # 假设已实现
]

task = "规划一次预算5000元的北京三日游，包含机票和酒店"
result = travel_agent.run(task)

处理流程示例 ：

搜索"北京三日游推荐行程"
查询当前机票价格
计算剩余酒店预算
查找符合预算的酒店
验证总费用不超预算
生成最终行程方案

7. 进阶开发方向

完成基础实现后，可以考虑以下增强功能：

多智能体协作 ：

class MultiAgentSystem:
    def __init__(self, agents):
        self.agents = agents  # 不同角色的智能体
        
    def coordinate(self, task):
        # 实现智能体间的任务分配与协调
        pass

实时学习机制 ：

def online_learning(agent, feedback):
    # 根据用户反馈调整策略
    if feedback.positive:
        agent.reinforce(feedback.action_sequence)
    else:
        agent.adjust(feedback.error_point)

可视化监控界面 ：

import matplotlib.pyplot as plt

def plot_decision_process(agent):
    thoughts = [t for t, _, _ in agent.memory]
    plt.figure(figsize=(10, 4))
    plt.plot(thoughts, marker='o')
    plt.title("智能体思考路径")
    plt.ylabel("思考内容")
    plt.xlabel("步数")
    plt.show()

构建ReAct智能体的过程充满挑战，但也极具启发性。当看到自己创建的智能体能够自主分解任务、合理使用工具并最终解决问题时，那种成就感远超过单纯使用现成工具。建议从简单任务开始，逐步增加复杂度，并在每个阶段都进行充分测试和优化。

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

硬核拆解 DeepSeek DSpark：半自回归 + 置信度调度，如何把投机解码的「又快、又准、又省」三难做成一个能上生产的系统

智能体开发者社区

烧了几百亿Token重写网关之后，他说：AI的能力早就溢出了，跟不上的是人

2026年春节，API7.ai创始人温铭团队在Apache APISIX上撞了一个怎么也复现不了的bug。读了几轮代码无果后，他们把问题现象描述给了一个AI Agent——不到10分钟，仅靠静态代码分析和现象描述，Agent就准确指出了问题所在。"那一刻，真的把我惊艳到了。"温铭在InfoQ上发表的文章中回忆道。但这只是他个人AI实验的序幕。此后一两个月，他烧掉了几百亿Token，用AI从零重写了

智能体开发者社区

每周AI新动态：GLM 5.2、gpt-oss与Qwen-AgentWorld发布

智谱推出GLM 5.2开源混合专家大模型，拥有7440亿总参数、400亿激活参数，原生支持100万tokens超长上下文，MIT开源协议允许企业完全私有化部署。提供BF16、FP8、Q4_K_M、UD-IQ2四大量化版本，可搭配vLLM/SGLang推理框架部署，适配Hermes/OpenClaw等主流智能体后端。OpenAI发布gpt-oss-20b和gpt-oss-120b两款推理模型，这是自