Ollama命令使用手册：本地大语言模型管理指南

本文提供了`Ollama`的完整命令使用手册，涵盖模型管理、API集成、自定义配置和故障排除等方面。通过学习这些命令，用户可以高效地在本地运行和管理大语言模型，为开发项目添加AI能力。

Yant224

799人浏览 · 2025-08-30 15:43:52

Yant224 · 2025-08-30 15:43:52 发布

一、简介

Ollama是一个强大的开源工具，允许用户在本地计算机上运行、管理和与大语言模型（如Llama、Mistral等）交互。本文提供完整的Ollama命令使用手册，涵盖从基础安装到高级功能的全面指南，帮助开发者高效利用本地AI能力。

二、基础模型管理命令

2.1 拉取和运行模型

# 拉取模型（默认最新版本）
ollama pull llama2

# 拉取特定版本
ollama pull llama2:13b

# 运行模型交互式会话
ollama run llama2

# 运行单次查询(提示词方式)
ollama run llama2 "解释量子计算的基本概念"

2.2 模型列表与管理

# 查看已安装的模型
ollama list

# 删除模型
ollama rm llama2

# 复制模型
ollama cp llama2 llama2-backup

# 显示模型信息
ollama show llama2

三、高级使用命令

3.1 多模型管理

# 同时运行多个模型
ollama run llama2 & ollama run mistral

# 切换不同模型对话
# 在交互模式中使用 /switch 命令
/switch mistral

3.2 自定义模型配置

创建Modelfile自定义模型：

# 创建Modelfile
cat > Modelfile << EOF
FROM llama2
PARAMETER temperature 0.7
PARAMETER num_ctx 4096
SYSTEM "你是一个有帮助的AI助手"
EOF

# 创建自定义模型
ollama create my-model -f Modelfile

# 运行自定义模型
ollama run my-model

3.3 模型参数调整

# 运行模型时调整参数
ollama run llama2 --temperature 0.8 --num_predict 100

# 批量处理文件
ollama run llama2 -f input.txt > output.txt

四、API与集成命令

4.1 REST API访问

# 查询API端点
curl http://localhost:11434/api/tags

# 生成文本
curl http://localhost:11434/api/generate -d '{
  "model": "llama2",
  "prompt": "为什么天空是蓝色的？"
}'

# 聊天接口
curl http://localhost:11434/api/chat -d '{
  "model": "llama2",
  "messages": [
    { "role": "user", "content": "你好" }
  ]
}'

4.2 编程语言集成

Python集成示例：

import requests

response = requests.post(
    "http://localhost:11434/api/generate",
    json={
        "model": "llama2",
        "prompt": "解释机器学习"
    }
)
print(response.json()["response"])

五、实用技巧与示例

5.1 常用工作流程

# 1. 拉取所需模型
ollama pull codellama

# 2. 运行代码生成任务
ollama run codellama "写一个Python函数计算斐波那契数列"

# 3. 保存对话历史
ollama run llama2 --history history.json

5.2 批量处理示例

# 处理多个查询
for question in "问题1" "问题2" "问题3"; do
    ollama run llama2 "$question" >> answers.txt
done

# 使用jq处理API输出
curl http://localhost:11434/api/generate -d '{
  "model": "llama2",
  "prompt": "写一首诗"
}' | jq -r '.response'

六、故障排除与优化

6.1 常见问题解决

# 检查服务状态
ollama --help

# 查看日志
tail -f ~/.ollama/logs/server.log

# 重启服务
ollama serve --restart

# 清理缓存
ollama prune

6.2 性能优化命令

# 指定GPU运行（如果可用）
ollama run llama2 --gpu

# 限制内存使用
OLLAMA_NUM_GPU=1 ollama run llama2

# 设置主机和端口
ollama serve --host 0.0.0.0 --port 11435

七、环境配置与高级功能

7.1 环境变量配置

# 设置模型存储路径
export OLLAMA_MODELS=/path/to/models

# 设置GPU数量
export OLLAMA_NUM_GPU=2

# 设置主机绑定
export OLLAMA_HOST=0.0.0.0:11435

7.2 模型优化选项

# 量化模型运行
ollama run llama2:7b-q4_0

# 使用特定参数集
ollama run llama2 --verbose --temperature 0.5 --top_p 0.9

八、总结

Ollama提供了一个简单而强大的命令行界面，用于在本地运行和管理大语言模型。通过掌握这些命令，开发者可以轻松集成AI能力到各种应用中，从简单的文本生成到复杂的多模型工作流。

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla