ollama bge-m3 Embending模型永久加载 does not support generate
摘要 在尝试让bge-m3模型永久加载时,使用API接口时出现"does not support generate"错误。解决方案是通过修改Ollama服务配置文件,在环境变量中添加OLLAMA_KEEP_ALIVE=-1参数。具体步骤包括:编辑/etc/systemd/system/ollama.service文件,添加保持连接的环境变量,然后重新加载并重启Ollama服务。
·
背景
想要让bge-3m永久加载,通过使用api接口发现出现异常 does not support generate
curl http://localhost:11434/api/generate -d '{"model": "bge-m3:latest", "keep_alive": -1}'
{"error":"\"bge-m3:latest\" does not support generate"}
解决方案
通过在环境变量中增加OLLAMA_KEEP_ALIVE 解决
# cat /etc/systemd/system/ollama.service
[Unit]
Description=Ollama Service
After=network-online.target
[Service]
ExecStart=/usr/local/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Environment="PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin"
Environment="OLLAMA_HOST=0.0.0.0:11434"
Environment="CUDA_VISIBLE_DEVICES=1"
Environment="OLLAMA_KEEP_ALIVE=-1"
[Install]
WantedBy=default.target
sudo systemctl daemon-reload
sudo systemctl restart ollama
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)