背景

想要让bge-3m永久加载,通过使用api接口发现出现异常 does not support generate

curl http://localhost:11434/api/generate -d '{"model": "bge-m3:latest", "keep_alive": -1}'
{"error":"\"bge-m3:latest\" does not support generate"}

解决方案

通过在环境变量中增加OLLAMA_KEEP_ALIVE 解决

# cat /etc/systemd/system/ollama.service
[Unit]
Description=Ollama Service
After=network-online.target

[Service]
ExecStart=/usr/local/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Environment="PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin"
Environment="OLLAMA_HOST=0.0.0.0:11434"
Environment="CUDA_VISIBLE_DEVICES=1"
Environment="OLLAMA_KEEP_ALIVE=-1"
[Install]
WantedBy=default.target

sudo systemctl daemon-reload

sudo systemctl restart ollama

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐