Ollama GPU 加速推理支持指南
核心要求:GPU 计算能力(Compute Capability)需 ≥ 5.0,可通过验证显卡兼容性。nvidia-smi。
Ollama GPU 加速推理支持指南
一、NVIDIA GPU 支持
1. 支持条件
-
核心要求:GPU 计算能力(Compute Capability)需 ≥ 5.0,可通过 NVIDIA 官方查询工具 验证显卡兼容性。
-
驱动要求:需安装对应显卡的 NVIDIA 官方驱动,确保 CUDA 环境正常(验证命令:
nvidia-smi)。
2. 支持的 GPU 型号(按计算能力分类)
| 计算能力 | 显卡系列 / 类别 | 具体型号 |
|---|---|---|
| 9.0 | NVIDIA 数据中心级 | H200、H100 |
| 8.9 | GeForce RTX 40xx 系列 | RTX 4090、RTX 4080 SUPER、RTX 4080、RTX 4070 Ti SUPER 等 |
| 8.9 | NVIDIA 专业卡 | L4、L40、RTX 6000 |
| 8.6 | GeForce RTX 30xx 系列 | RTX 3090 Ti、RTX 3090、RTX 3080 Ti 等 |
| 8.6 | NVIDIA 专业卡 | A40、RTX A6000、RTX A5000、A10、A16 等 |
| 8.0 | NVIDIA 数据中心级 | A100、A30 |
| 7.5 | GeForce GTX/RTX 系列 | GTX 1650 Ti、TITAN RTX、RTX 2080 Ti、RTX 2060 等 |
| 7.5 | NVIDIA 专业卡 / Quadro | T4、RTX 5000、Quadro RTX 8000 等 |
| 7.0 | NVIDIA 高端卡 | TITAN V、V100、Quadro GV100 |
| 6.1 | NVIDIA TITAN/GeForce GTX | TITAN Xp、GTX 1080 Ti、GTX 1060、GTX 1050 等 |
| 6.1 | Quadro/Tesla | P6000、P40、P4 |
| 6.0 | NVIDIA 数据中心级 | Tesla P100、Quadro GP100 |
| 5.2 | GeForce GTX 900 系列 | GTX 980 Ti、GTX 980、GTX 970、GTX 960 等 |
| 5.2 | Quadro/Tesla | M6000、M40 |
| 5.0 | GeForce GTX 700 系列 | GTX 750 Ti、GTX 750、NVS 810 |
| 5.0 | Quadro | K2200、K1200、M1200 等 |
3 驱动安装 / 更新(Windows 示例)
-
查看显卡信息:按下
Win+R输入DxDiag,在「显示」标签中获取显卡型号; -
下载驱动:访问 NVIDIA 驱动官网,选择显卡型号、系统版本下载对应驱动;
-
安装验证:运行安装包完成安装并重启电脑,终端输入
nvidia-smi查看驱动版本(如 461.09)和 CUDA 版本(需≥11.8)
(3)驱动安装 / 更新(Windows 示例)
-
运行安装包完成安装并重启电脑;
-
打开 Windows 命令提示符(CMD)或 PowerShell,输入命令
nvidia-smi; -
成功信息:命令执行后,会显示 GPU 型号、驱动版本、CUDA 版本等信息,示例如下:
Wed Jan 20 11:01:36 2021
NVIDIA-SMI 461.09 Driver Version: 461.09 CUDA Version: 11.2
\| GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC |
|=====|=================|================|================|======================|
\| 0 GeForce GTX 1060 WDDM | 00000000:01:00.0 On | N/A |
\| Memory-Usage | GPU-Util | Compute M. |
|==================|==========|============|
\| Total: 6144MiB | 0% | Default |
\| Used: 191MiB | | |
-
若需验证 CUDA 编译器环境,输入命令
nvcc --version; -
成功信息:显示 CUDA 编译工具版本,示例如下:
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2023 NVIDIA Corporation
Built on Tue\_Jul\_11\_03:10:21\_Pacific\_Daylight\_Time\_2023
Cuda compilation tools, release 12.2, V12.2.128
Build cuda\_12.2.r12.2/compiler.33053471\_0
参考链接:
https://ollama.cadn.net.cn/gpu.html
https://developer.nvidia.com/cuda-gpus https://blog.csdn.net/qq_44703886/article/details/112859392
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)