DeepSeek总是崩？教你本地部署离线DeepSeek R1，保姆级教程

在电脑本地部署DeepSeek有很多的好处，不用担心线上模型掉线、数据隐私安全，还可以做很多定制化的应用，比如本地客服、培训教育、企业文档等有很多场景，大家可以多多探索。

朱卫军Python

4700人浏览 · 2025-02-03 21:11:50

朱卫军Python · 2025-02-03 21:11:50 发布

最近DeepSeek由于受到大量DDOS攻击，加上访问过热，总是会出现服务器繁忙、无法加载的情况，于是乎我测试在本地电脑部署DeepSeek R1模型，居然测试成功了，而且速度并不比APP慢。

下面会讲到部署本地LLM（大模型）需要的软件，以及相应的电脑配置，这里以DeepSeeK R1各种版本为例。

软件配置

我选择了Ollama作为本地运行LLM的工具，这是一个非常出名的开源软件，Github上有12万Star，主要用来在本地电脑设备下载、部署和使用LLM。

Ollama提供了丰富的LLM库用于下载，比如llama、qwen、mistral以及这次要使用的deepseek r1，而且有不同的参数规模用于选择，适配不同性能的电脑设备。

Ollama虽然支持直接使用LLM，但是仅能在命令行来对话，交互功能不尽人意，所以我会使用Cherry-studio来作为前端交互，以Ollama作为后台，来和LLM对话，这就和日常使用的DeepSeek APP类似了。

Ollama交互界面：

Cherry-studio交互界面：

电脑配置要求

很多人担心在本地部署DeepSeek R1，是不是对电脑性能有很高要求，比如CPU、GPU、内存等。

其实不用担心，不同参数规模的模型对电脑性能要求不一样，部署DeepSeek R1 8B规模以下的模型不需要独显也可以运行。

我部署的是7B模型，电脑系统windows 11，配置CPU Intel® Core™ i7-12650H 2.30 GHz，内存16GB，没有独显。

这里科普下，LLM参数规模是指什么，所谓7B是指该模型大约有 70 亿（7 Billion）个参数，参数代表里模型训练过程中需要学习的数值，参数越多，模型能够理解更复杂的信息，给出的回答也越准确和全面。

以下是基本的要求，可以对号入座。

R1模型版本	CPU	GPU	内存	存储
1.5B	Intel Core i5/AMD Ryzen 5 及以上	无强制要求，有 1GB 及以上显存可提升性能	最低 8GB，推荐 16GB+	至少 10GB，建议留更多缓存空间
7B	Intel Core i7/AMD Ryzen 7 及以上	无强制要求，有 4GB 以上显存更好，推荐 8 - 12GB	最低 16GB，推荐 32GB+	至少 12GB，建议 30GB+
8B	Intel Core i7/AMD Ryzen 7 及以上	无强制要求，有 4.5GB 以上显存更好，推荐 8GB+	最低 16GB，推荐 32GB+	至少 12GB，建议 30GB+
14B	Intel Core i9/AMD Ryzen 9 及以上	8GB 以上，推荐 12GB+，如 RTX 3080 及以上	最低 32GB，推荐 64GB	至少 15GB，建议 50GB+
32B	高端多核，强多线程处理能力	18GB 左右，建议 24GB+，如 NVIDIA A100	32GB+，推荐 64GB+	至少 20GB，建议 80GB+
70B	服务器级 CPU，如 Intel Xeon 系列	40GB 以上，如 NVIDIA H100	64GB+，推荐 128GB+	至少 30GB，建议 200GB+

部署流程

清楚刚刚提到的相关软件和电脑配置后，就可以开始在本地部署DeepSeek R1了。

第一步：下载和安装Ollama

Ollama是运行LLM的软件，可以在Ollama官网下载，网址如下：

https://ollama.com/download

根据对应操作系统下载相应版本，我选择的是windows版。

下载完成后，直接安装即可，安装没有啥配置要求，一路next。

安装好后，电脑上会出现Ollama软件，这里要提示下，打开Ollama后并不会出现传统UI界面，因为Ollama是在后台运行的。

第二步：下载和安装DeepSeek R1

Ollama提供了各种主流开源大模型的资源下载，我这里根据自己电脑配置安装的是DeepSeek R1 7B，如果你电脑配置足够高的话建议安装14B以上的版本，模型性能会远高于7B。

就像一个高中生，其他条件不变情况下，理论上刷过的题越多，考试的分也就越高。

如果你想体验DeepSeek APP上的R1性能，那就需要配置参数671B的版本，这根本无法在个人PC上实现，需要数据中心级别的设备。

下面列举DeepSeek R1模型不同参数规模下的语言理解能力、文本生成质量、推理速度、处理复杂任务能力以及对硬件资源要求，可以参考自己的需求和硬件条件来配置。

模型版本	语言理解能力	文本生成质量	推理速度	处理复杂任务能力	硬件资源需求
1.5B	理解简单语句，复杂语义有局限	基础简单，逻辑连贯一般	快，普通 CPU 可用	仅处理简单常规任务	低
7B	较好理解复杂语句和上下文	质量明显提升，较自然	中等，合适 GPU 满足交互	处理常见任务，复杂任务有不足	适中
8B	理解复杂语义和长文本能力增强	更流畅准确，内容更丰富	与 7B 相近或略慢	应对挑战任务能力提升	稍高于 7B
14B	强，深入理解复杂语境	质量高，接近人类写作	慢，需强 GPU	处理复杂长文本和专业问答	较高
32B	达较高水准，处理极复杂语义	卓越，可生成高质量文档	慢，需高端 GPU	处理各类复杂任务，专业出色	高
70B	顶尖，处理高难度专业任务	顶尖，用于专业创作	极慢，需硬件集群	几乎能处理所有 NLP 任务	极高

Ollama网站展示了DeepSeek R1的信息，软件大小约4.7GB，详情链接如下：

https://ollama.com/library/deepseek-r1

下载和安装DeepSeek R1 7B非常简单，你只需要快捷键Win+R，输入cmd打开命令行。

然后直接输入以下代码串，按回车键即可：

ollama run deepseek-r1

因为ollama已经在后台运行，所以它会直接下载DeepSeek R1 7B模型，并安装好。

当你看到success代表安装成功了（提示下需要科学上网）。

第三步：在ollama上使用DeepSeek R1

安装好DeepSeek R1 7B模型后，还是打开命令行输入以下代码串，就可以在命令行直接和DeepSeek聊天。

ollama run deepseek-r1

以我的电脑配置来看，模型回复的速度还不错，大概2~5秒就会给出答复。如果你能配置更好的GPU，比如RTX 3060，响应速度应该会非常快，基本在1~2秒左右。

咱们让它写段Python代码，看看编程能力怎么样。

提示：请写个Python脚本，实现产品线合格产品和不合格产品的分类模型，请你模拟参数，指标有尺寸、强度

下面是DeepSeek的思考过程。

在这里插入图片描述

然后是给出的回答。

本地部署的DeepSeek回答形式和APP差不多，有思考和正式回答两部分，回答的质量也蛮不错。

但这样的UI界面看着实在是不舒服，不用急，有更好的解决方案。

第四步：在Cherry-studio上使用DeepSeek R1

Cherry-studio是可以运行本地大语言模型并能进行UI交互的桌面客户端，类似于DeepSeek APP，咱们只需要接入刚刚在ollama上配置好的DeepSeek R1模型，就能享受更好用的AI对话界面。

直接在Cherry官网下载软件，一路next安装即可。

https://cherry-ai.com/download

安装好后界面如下。

接下来是配置ollama并选择DeepSeek R1 7B模型。

点击右下角的设置按钮，模型服务选择ollama。

然后选择DeepSeek R1 7B模型，我之前也下载了llama3.1，所以这里都会显示出来。

最后点击检查，没有问题即代表配置成功了。

回到对话框界面，选择DeepSeek R1 7B模型，就可以开始对话。

你可以设置模型对话的配置，比如模型温度、上下文数、长度限制，还有消息显示的设置等等。

这里简单说下模型温度是一个取值通常在 0 到 1 之间（也可大于 1）的超参数，它用于控制模型生成文本时的随机性和创造性程度。

如果是写作创意类对话则数值越大越好，如果是编程和数学推理类的对话则数值越大越好。

Cherry上还有很多高级的配置，比如接入DeepSeek官方API实现线上模型的对话，配置也很简单，输入key即可。

补充：使用LM Studio配置本地大模型

LM Studio也是一款在本地运行大模型的应用，和ollama类似，不过拥有交互式UI界面，相当于ollama+cherry的组合体。

LM Studio可以从HuggingFace存储库下载任何兼容的模型文件，并部署到本地。

简单介绍下HuggingFace，HuggingFace是一个大模型存储平台，提供了大量预训练模型、数据集，其中就包括DeepSeek R1。

最后

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla