这是本地模型和云端模型(如 OpenAI、通义千问、Claude)最大的区别之一。


✅ 一、核心区别:本地 vs 云端

对比项 本地大模型(Ollama) 云端大模型(OpenAI / Qwen / Claude)
是否需要 API Key ❌ 不需要 ✅ 必须提供 API Key
数据是否外传 ❌ 不外传,完全本地运行 ✅ 请求会发到厂商服务器
是否收费 ✅ 免费(只消耗你的电和算力) ✅ 按调用次数/Token 收费
网络要求 ✅ 只需一次下载模型,之后离线可用 ✅ 必须联网
延迟 ✅ 快(本地响应) ⚠️ 受网络影响
模型大小 ✅ 可运行 7B、14B 甚至 32B 模型 ✅ 通常只提供 API,不开放本地部署

✅ 二、你当前的情况(Ollama)

你运行的是:

ollama run qwen3:1.7b

Ollama 默认会启动一个本地 API 服务,监听:

http://localhost:11434

你可以通过这个地址调用模型,完全不需要 API Key


✅ 三、如何调用本地 Ollama 的 API?

1. 使用 curl 测试

curl http://localhost:11434/api/generate -d '{
  "model": "qwen3:1.7b",
  "prompt": "你好,你是谁?"
}'

✅ 无需任何认证,直接返回 AI 回复。


2. 使用 Python 调用

import requests

response = requests.post(
    "http://localhost:11434/api/generate",
    json={
        "model": "qwen3:1.7b",
        "prompt": "请写一首关于春天的诗"
    }
)

print(response.json())

✅ 同样不需要 API Key。


3. 使用 OpenAI 兼容模式(高级)

Ollama 还支持模拟 OpenAI 的 API 格式,你可以用 openai-python SDK 调用:

from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:11434/v1",
    api_key="not-needed"  # 可以填任意值,因为本地不需要
)

response = client.completions.create(
    model="qwen3:1.7b",
    prompt="你好",
    max_tokens=100
)

print(response.choices[0].text)

🔔 注意:api_key="not-needed" 只是为了满足 SDK 的要求,实际不会验证。


✅ 四、为什么本地模型不需要 API Key?

原因 说明
🏠 你拥有模型和服务器 模型运行在你自己的电脑上,你是“服务商”
🔐 安全靠网络隔离 默认只监听 localhost,外部无法访问(除非你主动暴露)
💡 设计目标是易用性 本地开发、测试、私有部署,强调“开箱即用”

✅ 五、什么时候需要“类 API Key”?

虽然 Ollama 默认不需要,但在以下场景可以手动启用认证

场景:你想把 Ollama 暴露到外网(如 http://your-ip:11434

这时为了安全,你可以:

  • 使用反向代理(如 Nginx)加 Basic Auth
  • 或自己写个中间层,验证 token

但这不是 Ollama 内置的,而是你自己加的安全层。


✅ 六、总结

调用本地大模型(如 Ollama)不需要 API Key!

✅ 你可以直接通过:

  • http://localhost:11434/api/generate
  • 或 curl / Python / SDK 调用

无需认证、无需联网、无需付费。


📌 一句话记住:

  • 云端模型 → 要钱、要网、要 API Key
  • 本地模型 → 要电、要显卡、不要 API Key

你现在已经在本地运行了 qwen3:1.7b,可以放心调用,完全自由、安全、免费!🎉

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐