1. 前置条件

  • Windows 版本:Windows 11(或 Win10 2004+),WSL2 已启用

  • WSL 发行版:推荐 Ubuntu 22.04/24.04

  • Windows 侧驱动:确保已安装最新版 AMD Adrenalin 显卡驱动(Windows 侧负责提供 D3D12/GPU 支持,WSL 内不需要安装 AMD Linux 驱动)

检查 WSL 版本:

wsl -l -v

2. 安装/更新 Mesa(关键:需包含 Dozen 驱动)

Ubuntu 官方仓库的 mesa-vulkan-drivers 默认不包含 WSL2 所需的 dozen (dzn) 驱动。 推荐使用 kisak-mesa PPA 获取包含 Dozen 驱动的最新 Mesa:

sudo add-apt-repository -y ppa:kisak/kisak-mesa
sudo apt update
sudo apt upgrade -y

验证 Dozen 驱动是否安装成功:

dpkg -L mesa-vulkan-drivers | grep dzn

应输出类似:

/usr/lib/x86_64-linux-gnu/libvulkan_dzn.so
/usr/share/vulkan/icd.d/dzn_icd.json

3.同时安装 Vulkan 工具用于验证:

sudo apt install -y vulkan-tools

4. 验证 Vulkan 是否调用到 GPU

vulkaninfo --summary

deviceName能看到显卡型号就说明成功

5.集成llama.cpp

Vulkan 后端需要 glslc(SPIR-V 编译器)和 Vulkan 头文件。

sudo apt update
sudo apt install -y build-essential cmake libvulkan-dev glslc spirv-headers

用git拉去llama.cpp项目(这里用国内gitcode加速地址)

git clone https://gitcode.com/GitHub_Trending/ll/llama.cpp.git

进入llama.cpp根目录

# 清理之前的构建文件
rm -rf build

# 配置 CMake,启用 Vulkan 后端
cmake -B build \
  -DCMAKE_BUILD_TYPE=Release \
  -DGGML_VULKAN=ON \
  -DGGML_NATIVE=ON \
  -DLLAMA_BUILD_SERVER=ON

# 编译(使用所有 CPU 核心)
cmake --build build --config Release -j$(nproc)

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐