开源机器人智能体openpi完整使用指南：从入门到实战

openpi是由Physical Intelligence团队发布的开源机器人智能体项目，它包含了三种先进的视觉-语言-动作（VLA）模型，为机器人学研究提供了强大的基础。该项目提供了经过10,000+小时机器人数据预训练的基础模型检查点，以及用于开箱即用或微调到您自己数据集的示例。🚀## 为什么选择openpi机器人智能体？openpi项目代表了当前机器人学习领域的最新进展，它让研究人

薄正胡Plains

741人浏览 · 2025-12-17 15:12:51

薄正胡Plains · 2025-12-17 15:12:51 发布

开源机器人智能体openpi完整使用指南：从入门到实战

【免费下载链接】openpi 项目地址: https://gitcode.com/GitHub_Trending/op/openpi

openpi是由Physical Intelligence团队发布的开源机器人智能体项目，它包含了三种先进的视觉-语言-动作（VLA）模型，为机器人学研究提供了强大的基础。该项目提供了经过10,000+小时机器人数据预训练的基础模型检查点，以及用于开箱即用或微调到您自己数据集的示例。🚀

为什么选择openpi机器人智能体？

openpi项目代表了当前机器人学习领域的最新进展，它让研究人员和开发者能够：

快速启动：使用预训练模型立即进行推理，无需从零开始训练
灵活微调：基于自己的数据集对基础模型进行定制化训练
多平台支持：支持DROID、ALOHA、LIBERO等多种机器人平台
远程部署：支持模型在远程服务器运行，通过WebSocket向机器人发送动作

环境准备与快速安装

在开始使用openpi之前，确保您的系统满足以下基本要求：

操作系统：Ubuntu 22.04（经过测试）
GPU：NVIDIA GPU，至少8GB内存用于推理
软件依赖：需要安装uv来管理Python依赖

克隆项目仓库

首先获取项目代码和必要的子模块：

git clone --recurse-submodules https://gitcode.com/GitHub_Trending/op/openpi.git

如果已经克隆了仓库但未更新子模块，可以运行：

git submodule update --init --recursive

安装项目依赖

使用uv来管理Python依赖环境：

GIT_LFS_SKIP_SMUDGE=1 uv sync
GIT_LFS_SKIP_SMUDGE=1 uv pip install -e .

重要提示：环境变量GIT_LFS_SKIP_SMUDGE=1对于正确拉取LeRobot依赖至关重要。

Docker安装方案

如果系统配置遇到问题，openpi提供了Docker安装方案来简化环境配置。具体安装指南可以参考官方文档。

核心模型架构解析

openpi目前提供三种主要的模型类型：

π₀模型 - 流式扩散模型

基于流匹配的视觉-语言-动作模型，提供了稳定的推理性能。

π₀-FAST模型 - 自回归模型

基于FAST动作标记器的自回归VLA模型，在推理速度上有所优化。

π₀.₅模型 - 升级版本

π₀的升级版本，通过知识绝缘技术训练，具有更好的开放世界泛化能力。

模型检查点详解

基础模型检查点

这些检查点经过大规模机器人数据预训练，适合作为微调的起点：

模型	用途	检查点路径
π₀	微调	`gs://openpi-assets/checkpoints/pi0_base`
π₀-FAST	微调	`gs://openpi-assets/checkpoints/pi0_fast_base`
π₀.₅	微调	`gs://openpi-assets/checkpoints/pi05_base`

微调专家模型

这些模型针对特定机器人平台和任务进行了优化：

模型	用途	描述
π₀-FAST-DROID	推理	在DROID数据集上微调，支持广泛的桌面操作任务
π₀-DROID	微调	推理速度更快，但语言指令跟随能力稍弱
π₀-ALOHA-towel	推理	专门用于叠毛巾任务
π₀-ALOHA-tupperware	推理	用于打开食品容器任务
π₀.₅-LIBERO	推理	在LIBERO基准测试上达到最先进性能

实战演练：运行预训练模型推理

以下是一个使用π₀.₅-DROID模型进行推理的完整示例：

from openpi.training import config as _config
from openpi.policies import policy_config
from openpi.shared import download

# 加载配置和检查点
config = _config.get_config("pi05_droid")
checkpoint_dir = download.maybe_download("gs://openpi-assets/checkpoints/pi05_droid")

# 创建训练好的策略
policy = policy_config.create_trained_policy(config, checkpoint_dir)

# 准备输入数据并运行推理
example = {
    "observation/exterior_image_1_left": "您的图像数据",
    "observation/wrist_image_left": "您的图像数据",
    "prompt": "拿起叉子"
}
action_chunk = policy.infer(example)["actions"]

远程推理部署

openpi支持将模型运行在远程服务器上，通过WebSocket连接向机器人发送动作。这种方式可以让您在更强大的GPU上运行模型，同时保持机器人和策略环境的分离。

优势：

充分利用服务器端计算资源
简化机器人端硬件要求
便于模型更新和维护

自定义数据微调全流程

第一步：数据格式转换

将您的数据转换为LeRobot数据集格式。项目提供了LIBERO数据转换的示例脚本：

# 参考 examples/libero/convert_libero_data_to_lerobot.py

您可以根据自己的数据格式修改此脚本，实现自定义数据的转换。

第二步：训练配置与执行

定义数据处理和训练配置，openpi提供了详细的示例配置：

数据映射：在src/openpi/policies/libero_policy.py中定义
训练参数：在src/openpi/training/config.py中配置

在开始训练前，需要计算训练数据的归一化统计信息：

uv run scripts/compute_norm_stats.py --config-name pi05_libero

然后启动训练过程：

XLA_PYTHON_CLIENT_MEM_FRACTION=0.9 uv run scripts/train.py pi05_libero --exp-name=my_experiment --overwrite

训练优化技巧：

设置XLA_PYTHON_CLIENT_MEM_FRACTION=0.9以充分利用GPU内存
使用多个GPU时配置fsdp_devices参数
监控训练进度和损失曲线

第三步：策略服务器部署

训练完成后，启动策略服务器：

uv run scripts/serve_policy.py policy:checkpoint --policy.config=pi05_libero --policy.dir=checkpoints/pi05_libero/my_experiment/20000

服务器将在端口8000上监听，等待观察数据的发送。

PyTorch支持新特性

openpi现在提供了π₀和π₀.₅模型的PyTorch实现，为熟悉PyTorch生态的开发者提供了更多选择。

JAX模型转PyTorch

将JAX模型检查点转换为PyTorch格式：

uv run examples/convert_jax_model_to_pytorch.py \
    --checkpoint_dir /path/to/jax/checkpoint \
    --config_name <config name> \
    --output_path /path/to/converted/pytorch/checkpoint

PyTorch训练模式

支持多种训练配置：

# 单GPU训练
uv run scripts/train_pytorch.py debug --exp_name pytorch_test

# 多GPU训练（单节点）
uv run torchrun --standalone --nnodes=1 --nproc_per_node=2 scripts/train_pytorch.py pi0_aloha_sim --exp_name pytorch_ddp_test

常见问题与解决方案

依赖冲突问题

如果uv sync失败，尝试删除虚拟环境目录后重新运行。

GPU内存不足

调整JAX内存分配比例，启用FSDP并行训练。

归一化统计缺失

确保在训练前运行归一化统计计算脚本。

项目生态与发展前景

openpi项目正在快速发展，其生态系统涵盖了：

多种机器人平台：从桌面操作到复杂环境
多样化任务：从物体操作到语言指令跟随
持续优化：模型性能不断提升，支持更多应用场景

通过使用openpi项目，您可以加速在机器人学习领域的研究和开发工作，快速构建智能机器人应用。🎯

无论您是机器人学研究人员、开发者，还是对AI机器人感兴趣的学习者，openpi都为您提供了一个强大而灵活的平台。开始您的机器人智能之旅吧！

【免费下载链接】openpi 项目地址: https://gitcode.com/GitHub_Trending/op/openpi

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

智能体开发者社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

智能体开发者社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla