尝试很多教程中的命令后仍无法实现,后续在此网址发现自己修改ollama.service文件时少复制了一行参数  。网址如下:ollama部署deepseek, 多显卡负载均衡 - ForLivetoLearn - 博客园

尝试以下方法

  1. Environment="CUDAVISIBLEDEVICES=0,1,2,3"

Environment="OLLAMA_HOST=0.0.0.0"

Environment="OLLAMA_ORIGINS=*"

  1. export CUDAVISIBLEDEVICES=0,1,2,3

多种尝试后仍无法同时使用四块GPU

命令 sudo nano /etc/systemd/system/ollama.service 打开 ollama.service 文件

Environment="OLLAMASCHEDSPREAD=1"

Environment="OLLAMAKEEPALIVE=-1"

Environment="OLLAMA_HOST=0.0.0.0"

Environment="OLLAMA_ORIGINS=*"

前边加上 Environment="CUDAVISIBLEDEVICES=0,1,2,3"

实现多显卡负载均衡

注释:ollama.service:这是一个特定的服务单元文件名称。在 Systemd 中,每个服务通常对应一个 .service 文件,里面包含服务的启动命令、环境变量、依赖关系等配置。

sudo nano /etc/systemd/system/ollama.service
sudo systemctl daemon-reload
sudo systemctl start ollama.service
 

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐