RTX 3090 24G单卡部署DeepSeek-OCR

若报错，采用下面方法下载离线包至本地。把一张测试图片放入images内。

菜的抠脚的韦伯

204人浏览 · 2025-11-14 11:17:37

菜的抠脚的韦伯 · 2025-11-14 11:17:37 发布

1. 安装过程

1.1. Cuda-11.8环境

GPU：3090（24G）、cuda驱动13.0
torch==2.6.0,cuda==11.8

export PATH=/usr/local/cuda-11.8/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH

1.2. 拉取DeepSeek-OCR

git clone https://github.com/deepseek-ai/DeepSeek-OCR.git

1.3. torch-2.6.0、python-3.12.9 环境

conda create -n deepseek-ocr python=3.12.9 -y
conda activate deepseek-ocr
pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu118

1.4. vllm-0.8.5

download the vllm-0.8.5 whl

pip install vllm-0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl
pip install -r requirements.txt # 报错没关系

1.5. flash_attn-2.7.3

pip install flash-attn==2.7.3 --no-build-isolation

若报错，采用下面方法下载离线包至本地

wget https://github.com/Dao-AILab/flash-attention/releases/download/v2.7.3/flash_attn-2.7.3+cu11torch2.6cxx11abiFALSE-cp312-cp312-linux_x86_64.whl
pip install flash_attn-2.7.3+cu11torch2.6cxx11abiFALSE-cp312-cp312-linux_x86_64.whl

1.6. vllm配置config.py

cd DeepSeek-OCR-master/DeepSeek-OCR-vllm
mkdir images #存放测试图片
mkdir output
vim config.py

把一张测试图片放入images内，我的是一张户型图

MODEL_PATH = '/model/Deepseek/DeepSeek-OCR/' # 填你自己下载的DeepSeek-OCR模型路径
INPUT_PATH = 'images/test.jpg' 
OUTPUT_PATH = 'output'
PROMPT = '<image>\nDescribe this image in detail.'

1.7. 运行

python run_dpsk_ocr_image.py

PROMPT = '<image>\nDescribe this image in detail.' # 对户型图的描述

PROMPT = '<image>\nLocate <|ref|>小孩房<|/ref|> in the image.' #标注小孩房

识别得不是很准。还有待研究

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

智能体开发者社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

智能体开发者社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla