保姆级教程：在WSL2的Ubuntu 22.04上，用Conda一键部署LLaMA-Factory微调平台

没伞请奔跑i

355人浏览 · 2026-06-13 15:53:42

没伞请奔跑i · 2026-06-13 15:53:42 发布

保姆级教程：在WSL2的Ubuntu 22.04上，用Conda一键部署LLaMA-Factory微调平台

当大模型技术从实验室走向实际应用，微调（Fine-tuning）已成为开发者必备的核心技能。但对于Windows用户而言，在本地搭建微调环境往往面临双重挑战：既要跨越操作系统的藩篱，又要处理复杂的依赖关系。本文将带你用最优雅的方式——通过WSL2和Conda的组合，在个人电脑上快速构建LLaMA-Factory微调平台，无需昂贵硬件即可开启大模型定制之旅。

1. 环境准备：打造Linux开发环境

1.1 启用WSL2与Ubuntu安装

Windows Subsystem for Linux（WSL）是微软为开发者提供的革命性工具，它允许你在Windows系统中运行原生Linux环境。以下是配置步骤：

以管理员身份打开PowerShell，执行启用命令：
```
wsl --install -d Ubuntu-22.04
```
安装完成后，通过开始菜单启动Ubuntu终端，系统将自动完成初始化设置

建议分配至少20GB磁盘空间给WSL，可通过 wsl --shutdown 后修改 .wslconfig 文件实现：

[wsl2]
memory=8GB
swap=4GB
localhostForwarding=true

1.2 系统基础配置

首次进入Ubuntu环境后，建议立即执行以下优化操作：

sudo apt update && sudo apt upgrade -y
sudo apt install -y build-essential git curl

这些命令会更新软件源并安装开发必备工具链。若遇到下载速度慢的问题，可考虑替换为国内镜像源：

sudo sed -i 's@archive.ubuntu.com@mirrors.aliyun.com@g' /etc/apt/sources.list

2. Conda环境管理：构建Python隔离空间

2.1 Miniconda安装与配置

相比体积庞大的Anaconda，Miniconda更适合资源有限的开发环境：

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b
echo 'export PATH="$HOME/miniconda3/bin:$PATH"' >> ~/.bashrc
source ~/.bashrc

验证安装成功后，建议立即配置conda清华镜像加速：

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes

2.2 创建专用虚拟环境

为LLaMA-Factory创建独立环境能有效避免依赖冲突：

conda create -n llama_factory python=3.10 -y
conda activate llama_factory

环境激活后，命令行提示符前会出现 (llama_factory) 标记

3. LLaMA-Factory部署实战

3.1 源码获取与准备

使用git克隆项目仓库（建议在SSD磁盘分区操作）：

git clone https://github.com/hiyouga/LLaMA-Factory --depth=1
cd LLaMA-Factory

对于国内用户，若遇到GitHub连接问题，可尝试以下替代方案：

git clone https://ghproxy.com/https://github.com/hiyouga/LLaMA-Factory

3.2 依赖安装加速技巧

项目依赖安装是最大耗时环节，采用组合加速策略可节省90%时间：

pip install -e .[metrics] -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn

常见问题解决方案：

CUDA相关错误 ：确认已安装NVIDIA驱动和CUDA Toolkit
gcc编译失败 ：执行 sudo apt install -y g++ 安装编译工具
内存不足 ：添加 --no-cache-dir 参数减少内存占用

4. 平台启动与调优

4.1 WebUI服务部署

启动开发服务器（默认占用7860端口）：

llamafactory-cli webui

若端口冲突，可通过参数指定新端口：

llamafactory-cli webui --port 8860

4.2 浏览器访问配置

在Windows端访问WSL服务需要特殊处理：

在Ubuntu中执行 hostname -I 获取WSL2的IP地址
浏览器访问 http://<WSL_IP>:7860
若出现连接拒绝，检查防火墙设置：
```
sudo ufw allow 7860
```

4.3 性能优化建议

针对消费级硬件的调优策略：

export PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:32
python -m llama_factory.webui --load_in_4bit

关键参数说明：

--load_in_4bit ：启用4位量化减少显存占用
--device_map auto ：自动分配计算设备
--trust_remote_code ：允许加载自定义模型

5. 模型管理与微调入门

5.1 模型下载方案对比

方式	速度	稳定性	适用场景
官方HuggingFace	慢	高	需要最新模型
国内镜像站	快	中	基础模型下载
离线导入	最快	高	已有模型文件

推荐使用modelscope加速下载：

from modelscope import snapshot_download
model_dir = snapshot_download('baichuan-inc/Baichuan2-7B-Chat')

5.2 最小化微调示例

在Web界面完成第一个微调任务：

选择"Create New Project"
设置基础参数：
- Model: LLaMA-2-7b
- Dataset: alpaca_gpt4_zh
- Method: LoRA (rank=8)
高级设置保持默认
点击"Start Training"

训练过程监控技巧：

watch -n 1 nvidia-smi  # 实时查看GPU状态
tail -f train.log      # 跟踪训练日志

6. 故障排查指南

6.1 常见错误解决方案

问题1：CUDA out of memory

解决方案：减小 per_device_train_batch_size 参数
替代方案：启用梯度检查点 --gradient_checkpointing

问题2：ImportError: libcudart.so.11.0

修复命令：

sudo apt install -y cuda-toolkit-11-8
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc

问题3：WSL2 DNS解析失败

永久修复：

sudo bash -c 'echo "[network]" > /etc/wsl.conf'
sudo bash -c 'echo "generateResolvConf = false" >> /etc/wsl.conf'
sudo rm /etc/resolv.conf
sudo bash -c 'echo "nameserver 8.8.8.8" > /etc/resolv.conf'

6.2 资源监控与优化

实时监控工具安装：

sudo apt install -y htop nvtop

关键指标阈值参考：

GPU利用率：>70%为理想状态
GPU温度：<85℃为安全范围
内存占用：预留1GB余量防崩溃

7. 进阶使用技巧

7.1 自定义数据集准备

标准数据集格式示例（JSON）：

[
  {
    "instruction": "解释神经网络原理",
    "input": "",
    "output": "神经网络是模仿生物神经系统的计算模型..."
  }
]

格式转换工具推荐：

python scripts/convert_dataset.py --format alpaca --input raw_data.json

7.2 训练参数调优策略

关键参数影响分析：

参数	训练速度	显存占用	模型质量
batch_size增大	↑↑	↑↑↑	→
learning_rate降低	↓↓	→	↑↑
num_epochs增加	↓↓↓	→	↑↑↑

实验记录建议：

python -m llama_factory.train \
  --experiment_name my_exp1 \
  --log_with wandb

7.3 模型导出与部署

生成可部署的LoRA适配器：

python export_adapters.py \
  --model_name_or_path ./output \
  --adapter_name my_lora \
  --output_dir ./deploy

与vLLM推理引擎集成示例：

from vllm import LLM, SamplingParams
llm = LLM(
  model="meta-llama/Llama-2-7b-hf",
  enable_lora=True,
  adapter_path="./deploy"
)

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

如何下载安装claude code以及接入deepseek

使用，首先得安装它的环境，一步步按照下面的步骤来，即可安装成功。

智能体开发者社区

基于大模型的简历筛选与匹配系统，多版本简历管理模块、多维条件职位检索与收藏模块、基于DeepSeek大语言模型API的简历智能分析与优化

智能体开发者社区

从零到一：用 AI Agent 辅助在 6GB 显卡上本地部署大模型实战

智能体开发者社区

所有评论(0)

查看更多评论

没伞请奔跑i

@weixin_33940469

已为社区贡献1条内容

保姆级教程：在WSL2的Ubuntu 22.04上，用Conda一键部署LLaMA-Factory微调平台

没伞请奔跑i

保姆级教程：在WSL2的Ubuntu 22.04上，用Conda一键部署LLaMA-Factory微调平台

1. 环境准备：打造Linux开发环境

1.1 启用WSL2与Ubuntu安装

1.2 系统基础配置

2. Conda环境管理：构建Python隔离空间

2.1 Miniconda安装与配置

2.2 创建专用虚拟环境

3. LLaMA-Factory部署实战

3.1 源码获取与准备

3.2 依赖安装加速技巧

4. 平台启动与调优

4.1 WebUI服务部署

4.2 浏览器访问配置

4.3 性能优化建议

5. 模型管理与微调入门

5.1 模型下载方案对比

5.2 最小化微调示例

6. 故障排查指南

6.1 常见错误解决方案

6.2 资源监控与优化

7. 进阶使用技巧

7.1 自定义数据集准备

7.2 训练参数调优策略

7.3 模型导出与部署

所有评论(0)

温馨提示：您尚未绑定手机号

没伞请奔跑i