1. 什么是 DeepSeek-R1?

DeepSeek-R1 是由中国人工智能公司深度求索(DeepSeek)开发的一款开源推理模型,于2025年1月20日发布,专门用于处理复杂的推理任务。
DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

模型性能对比图

2. 为什么要本地部署?

本地部署的好处:

2.1 数据隐私与安全性

数据本地存储:本地部署确保所有数据都存储在本地计算机,不会上传到云端服务器,从而避免敏感信息泄露和被未经授权的第三方访问。
完全掌控数据:用户可以完全控制数据的使用和存储方式,无需担心数据被云服务提供商收集或用于其他目的。

2.2 成本效益

零额外成本: DeepSeek-R1 本地部署完全免费,无需支付云服务的订阅费用或额外成本。
长期经济性:对于高频调用的场景,本地部署比长期使用云服务更具成本效益。

2.3 灵活性与定制化

模型微调:用户可以根据具体需求对模型进行微调,调整模型参数和功能,以更好地适应特定的业务场景或任务。
集成与扩展:本地部署允许用户将 DeepSeek-R1 与其他工具或系统进行集成,构建自定义的应用程序或界面。

2.4 离线使用与稳定性

无需网络连接:本地部署的 DeepSeek-R1 可以在没有网络连接的情况下运行,适合在旅行、网络不稳定或网络受限的场景中使用。
避免服务器繁忙:用户不再依赖云服务器,避免因服务器繁忙或网络问题导致的卡顿和延迟,确保模型的稳定运行。

2.5 性能优化

资源利用效率:本地部署可以根据本地硬件资源进行优化,充分利用GPU等计算资源,提高模型的推理速度和性能。
低延迟响应:本地运行能够实现更快的响应时间,尤其适合需要低延迟的应用场景,如实时决策和交互。

2.6 未来保障

避免使用限制:本地部署不受云服务提供商未来可能的使用限制或政策变化的影响,用户可以永久免费使用。

总的来说,本地部署 DeepSeek-R1 为用户提供了更高的隐私保护、更强的灵活性、更低的成本以及更稳定的使用体验,特别适合对数据隐私、定制化需求和离线使用有较高要求的用户和企业。

3. GPU和显存要求

DeepSeek-R1 的显存需求取决于模型的大小、参数数量和量化技术等因素。
以下是 DeepSeek-R1 及其精简模型的显存要求,以及推荐的 GPU:
DeepSeek-R1 本地部署设备的GPU和显存要求
(注意:运行本地模型对你的电脑配置有一定要求,包括内存、GPU 等。如果出现卡顿,请尝试降低模型参数大小。)

4、本地化部署

4.1 下载并安装Ollama

访问Ollama官网(https://ollama.com/),下载并安装适合您操作系统的版本。Windows 电脑建议安装在C盘,以避免后续配置环境变量的麻烦。
Ollama软件下载

4.2 查看安装是否成功

Windows 电脑按快捷键 win+X,选择“终端”,输入命令:ollama -v,如果安装成功会显示 ollama 版本号。
查看ollama安装是否成功

4.3 选择模型版本

在Ollama官网的“Models”部分,选择“deepseek-r1”,然后根据您的电脑配置选择合适的参数版本(例如,如果您的电脑配置较低,可以选择1.5B版本)。
Ollama官网模型选择
Ollama官网模型选择

4.4 下载并运行模型

我这里选择的 7b,对应的命令就是:ollama run deepseek-r1:7b,将该命令在之前的终端窗口中执行,就可以直接下载并运行模型了。模型下载并运行
下载完成后,您就可以直接在命令提示符中与模型进行交互了。例如,输入问题:“你是谁?”,并获取模型的回答。

但是在命令行中与模型进行交互多少有点不方便,所以我们需要安装可视化界面。

5. 可视化界面安装

5.1 下载并安装 Chatbox AI

访问 Chatbox AI官网 (https://chatboxai.app/zh#),点击免费下载,下载并安装即可。
Chatbox AI 软件下载

5.2 设置界面的语言

点击界面中的:设置 -> 显示,设置界面的语言为:简体中文。
在这里插入图片描述

5.3 选择并设置模型

点击界面中的:设置 -> 模型,选择模型提供方为:OLLAMA API,选择模型为:deepseek-r1:7b,其他选项可以先保持默认设置,然后点击:保存。
选择并设置模型

5.4 本地测试使用

确保 Chatbox AI 模型设置没有问题,进行聊天测试,就可以正常沟通了。
本地测试使用

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐