qwen3本地私有化部署

6.新建python虚拟环境,创建项目,进行api测试。5.浏览器访问localhost:6006/docs。3.Qwen3的部署命令和api调用。4.autodl需要进行端口映射。,选择模型,在linux上下载。windows工具,下载后使用。2.安装vllm，支持高并发。

码上上班

161人浏览 · 2025-10-28 10:00:28

码上上班 · 2025-10-28 10:00:28 发布

1.进入魔搭社区通义千问3-8B · 模型库,选择模型,在linux上下载

pip install modelscope  
modelscope download --model Qwen/Qwen3-8B --local_dir ~/my_models/Qwen3-8B

2.安装vllm，支持高并发

pip install vllm

3.Qwen3的部署命令和api调用

python -m vllm.entrypoints.openai.api_server \
--model /root/autodl-tmp/models/Qwen/Qwen3-8B \
--served-model-name qwen3-8b \
--max-model-len 8k \
--host 0.0.0.0 \
--port 6006 \
- dtype bfloat16 \
--gpu-memory-utilization 0.8 \
--enable-auto-tool-choice \
--tool-call-parser hermes

4.autodl需要进行端口映射

windows工具,下载后使用

https://autodl-public.ks3-cn-beijing.ksyuncs.com/tool/AutoDL-SSH-Tools.zip

ssh代理

ssh -CNg -L 6006:127.0.0.1:6006 root@123.125.240.150 -p 42151

5.浏览器访问localhost:6006/docs

6.新建python虚拟环境,创建项目,进行api测试

pip install openai

from openai import OpenAI
client = OpenAI(base_url="http://localhost:6006/v1", api_key="xxxxx")
resp = client.chat.completions.create(
model='qwen3-8b',
messages=[{'role':'user','content':'请介绍一下什么是深度学习?'}]
temperature=0.8,
presence_penalty=1.5,
#qwen3特有的参数:enable_thinking表示是否开启深度思考
extra_body={'chat_template_kwargs': {'enable_thinking': True}} )

print(resp.choices[0].message.content)

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

Chess用户界面设计：Tailwind CSS样式系统和组件库

GitHub推荐项目精选中的ch/chess是一个类似chess.com的多人在线象棋平台，它采用现代化的前端技术栈构建，尤其在用户界面设计上通过Tailwind CSS样式系统和组件库实现了优雅且功能丰富的交互体验。本文将深入探讨该项目如何利用Tailwind CSS打造一致的设计语言和高效的组件系统，为象棋爱好者提供沉浸式的游戏界面。## 🎨 Tailwind CSS样式系统：构建统一视

火山引擎 ADG 社区

终极指南：GPT-Engineer如何通过AI自动发现代码问题并提升质量

GPT-Engineer是一款强大的AI驱动代码工具，它能帮助开发者自动检测潜在代码问题、优化代码质量，让编程效率提升3倍以上。无论是新手还是资深开发者，都能通过这款工具轻松发现代码中的隐藏缺陷，减少调试时间，释放更多精力在创造性工作上。## 一键发现代码问题：GPT-Engineer的AI审查魔力GPT-Engineer的核心能力在于其内置的智能代码分析系统。通过集成Python代码格式

火山引擎 ADG 社区

SatDump中的纠错编码技术：从RS码到Turbo码的完整实现指南

在卫星数据传输过程中，信号往往会受到各种干扰，导致数据错误。SatDump作为一款通用卫星数据处理软件，集成了多种先进的纠错编码技术，确保从卫星接收到的数据能够准确解码。本文将深入解析SatDump中从Reed-Solomon（RS）码到Turbo码的实现细节，帮助读者理解这些技术如何保障卫星通信的可靠性。## 为什么纠错编码对卫星数据至关重要？卫星与地面站之间的通信链路面临着空间辐射、大