目录

  •  一、DeepSeek 概述与模型家族全景

  •  二、注册与快速上手

  •  三、模型版本全解析与选型指南

  •  四、Web/App 端深度使用技巧

  •  五、API 接口调用实战

  •  六、本地部署实战(Ollama / LM Studio / vLLM)

  •  七、Claude Code / Cursor / VS Code 集成

  •  八、RAG 企业知识库搭建实战

  •  九、DeepSeek + Dify + 微信 智能客服搭建

  •  十、高效办公全场景实战

  •  十一、Prompt 提示词工程与进阶技巧

  •  十二、性能优化与故障排查

  •  十三、热门实操案例精选

  •  十四、FAQ 常见问题解答

  •  十五、总结与展望


一、DeepSeek 概述与模型家族全景

1.1 什么是 DeepSeek

DeepSeek(深度求索)是由中国 AI 公司深度求索(DeepSeek AI)开发的一系列开源大语言模型。自 2024 年底发布 DeepSeek-V3 以来,凭借极致性价比 + 开源开放 + 持续迭代三大核心优势,迅速成为全球开发者社区关注焦点。

核心特点

特点

说明

开源开放

模型权重开源,支持本地部署和二次开发

极致性价比

API 价格仅为 GPT-4 系列的 1/50 ~ 1/10

百万级上下文

V4 系列原生支持 1M tokens 上下文窗口

Anthropic API 兼容

无缝接入 Claude Code、Cursor 等主流工具

持续迭代

从 V3 到 V4,保持每月级别的更新节奏

1.2 模型家族时间线

DeepSeek 已形成两条清晰的产品线——通用/Agent/编码线(V 系列) 和 推理线(R 系列)

2024-12  DeepSeek-V3 ─────────── 通用线起点
2025-01  DeepSeek-R1 ─────────── 推理线起点
2025-05  DeepSeek-R1-0528 ───── 推理线工程化
2025-08  DeepSeek-V3.1 ──────── Hybrid Think/Non-Think
2025-09  DeepSeek-V3.2-Exp ──── Sparse Attention 实验
2025-12  DeepSeek-V3.2 ──────── Thinking + Tool-Use 整合
2026-04  DeepSeek-V4-Pro ───── 旗舰 Agent 编码
2026-04  DeepSeek-V4-Flash ──── 极低成本标配

1.3 阵营全景图

系列

定位

代表模型

核心优势

V 系列(通用)

对话、编码、Agent、办公

V4-Pro, V4-Flash, V3.2

通用能力均衡,场景覆盖广

R 系列(推理)

数学、逻辑、算法、复杂推理

R1, R1-0528

深度推理链,数学/编程竞赛级

Coder 系列

专门代码生成

Coder V4

代码补全、多文件工程、Bug 修复

1.4 核心竞争优势

来自 500+ 小红书用户的实际反馈:

  •  成本优势:V4-Pro 输入 0.435/1Mtokens,输出0.435/1M tokens,输出0.435/1Mtokens,输出0.87/1M tokens,约为 Claude Sonnet 4.5 的 1/17

  •  Agent 能力:V4-Pro 在 Agentic Coding 评测中达到开源模型最佳水平,LiveCodeBench 得分 93.5

  •  本地部署灵活:支持 Ollama、LM Studio、vLLM 等多种框架,消费级显卡即可运行量化版本

  •  国内生态完善:微信公众平台/企业微信接入方案成熟,腾讯云/阿里云/华为云均提供 API 代理

参考来源:DeepSeek 官方文档、4SAPI DeepSeek-V4-Pro 深度评测、小红书用户 500+ 实战分享


二、注册与快速上手

2.1 注册账号

Web 端注册

  1.  打开 DeepSeek 官网

  2.  点击右上角笑脸图标

  3.  使用邮箱或手机号注册(推荐邮箱,方便接收学习资料和通知)

  4.  设置密码建议:大小写字母 + 数字 + 符号,例如 Deep2026@seek

  5.  完成邮箱/手机验证后,建议立即绑定手机号以增强账号安全性

常见问题

问题

解决方案

验证码不显示

刷新页面(成功率 80%),或更换 Chrome/Edge 浏览器

公司网络拦截

检查防火墙/代理设置,切换网络环境

手机号无法接收

尝试邮箱注册,或联系客服

2.2 控制台界面速览

登录后控制台分为三个核心区域:

区域

功能说明

中间区域

对话输入框,操作类似微信聊天,支持@提及文件

左侧区域

历史记录栏,可右键重命名对话,支持搜索历史

右侧区域

功能工具栏,包含文件上传、代码运行、联网搜索等

新手入门三步练习

第一步:输入"你好,请做个自我介绍" → 测试基础交互
第二步:输入"请用 Python 打印爱心图案" → 测试代码生成能力
第三步:将当前对话重命名为「测试练习」→ 熟悉组织管理

2.3 移动端 APP

DeepSeek 提供 iOS 和安卓 APP,在各大应用商店搜索「DeepSeek」即可下载。APP 端支持语音输入,适合移动办公场景。

参考来源:CSDN《DeepSeek从入门到精通——15天指导手册》


三、模型版本全解析与选型指南

3.1 各版本核心参数对比

版本

发布日期

总参数量

激活参数

上下文长度

核心特色

V4-Pro

2026-04

1.6T

49B

1M tokens

Agent 编码、长上下文、混合注意力

V4-Flash

2026-04

284B

13B

1M tokens

低成本、标配 1M 上下文

V3.2-Speciale

2025-12

-

-

128K

Thinking + Tool-Use 整合

V3.1

2025-08

-

-

128K

Hybrid Think/Non-Think

R1-0528

2025-05

-

-

128K

推理线工程化,支持 Function Calling

R1

2025-01

671B

37B

128K

纯强化学习,思维链推理

V3

2024-12

671B

37B

128K

MoE 架构,通用能力基线

3.2 API 定价对比(2026年6月)

模型

输入价格(/1M tokens)

缓存命中价

输出价格(/1M tokens)

V4-Pro

$0.435

$0.003625

$0.87

V4-Flash

$0.14

$0.0028

$0.28

R1

$0.55

$0.14

$2.19

:V4-Pro 价格为 75% 限时折扣价。对比参考:Claude Sonnet 4.5 输入 3.00/输出3.00/输出3.00/输出15.00,GPT-4.1 输入 2.50/输出2.50/输出2.50/输出8.00。

3.3 选型决策指南

你的使用场景?
│
├── 日常办公/写作/翻译 ──→ V4-Flash(性价比最高)
│   - 输入 $0.14/1M,百元预算可用几个月
│   - 支持文本、代码、翻译等常规任务
│
├── 专业编码/Agent 开发 ──→ V4-Pro(旗舰能力)
│   - Agentic Coding 开源最强
│   - LiveCodeBench 93.5,Codeforces Rating 3206
│   - 支持复杂多文件工程、长上下文 Agent
│
├── 数学推理/算法竞赛 ──→ R1 系列(深度推理)
│   - 思维链推理,正确率显著高于 V 系列
│   - 适合 NP 难问题、高并发架构设计
│   - 成本高于 V 系列但质量更优
│
├── 本地部署/离线使用 ──→ 量化版(GGUF 格式)
│   - 1.5B~70B 可选,适配不同硬件
│   - 推荐 Q4_K_M 量化(效果与性能平衡)
│
└── 混合策略(推荐) ──→ V4-Pro(主力)+ V4-Flash(轻量任务)
    - 编码/Agent → V4-Pro
    - 简单问答/翻译 → V4-Flash
    - 可节省 60-70% 成本

3.4 V3 vs R1 代码生成能力实测对比

基于 Explinks 的 50 万 Token 压力测试数据:

对比维度

DeepSeek V3

DeepSeek R1

代码一次通过率

74%

91%

生成速度(P99)

3.2s

2.1s

高并发架构设计

偏基础

分布式锁、熔断器、监控

多文件工程能力

部分文件

完整项目含 Helm Chart

成本

低(¥1.2/万token)

高(¥2.8/万token)

建议:简单脚本用 V3/V4-Flash,高复杂度架构设计用 R1/V4-Pro。

参考来源:explinks.com DeepSeek V3 API vs R1 代码能力对比、4SAPI V4-Pro 评测、模型谱系档案


四、Web/App 端深度使用技巧

4.1 核心功能速览

功能

说明

使用技巧

对话式交互

基础问答、多轮对话

保持对话上下文,使用历史记录栏管理会话

文件上传

支持 PDF/Word/Excel/图片/代码文件

上传后直接用自然语言提问文件内容

联网搜索

实时搜索最新信息

点击搜索按钮或在 Prompt 中明确要求「请搜索」

代码运行

内置 Python 沙箱

可直接运行 Python 代码查看输出

长文本处理

支持上传书籍、论文等超大文件

超过 8K tokens 建议分块处理

4.2 小红书 500+ 用户提炼的 12 个核心技巧

技巧 1:三段式 Prompt 描述法

来自 @算法猫猫 的实践——采用「语言 + 框架 + 输入输出示例」三段式描述,生成准确率提升 62%

# [需求] Python + Scrapy 框架
# [输入] 目标网站 URL
# [输出] 包含标题和价格的 JSON

请生成一个爬虫脚本,爬取上述网站的产品信息。
技巧 2:开启上下文记忆
  •  72% 的用户推荐开启会话历史功能

  •  连续对话时代码风格一致性提高 3 倍

技巧 3:先提供文档,再请求代码
  •  用户 @DevOps先锋 的测试:先提供 Swagger/API 文档,再请求示例代码

  •  错误率从 27% 降至 6%

技巧 4:流量控制与重试

API 调用建议采用指数退避重试机制:

import time

defcall_api_with_retry(max_retries=3):
for attempt inrange(max_retries):
try:
return deepseek_api_call()
except Exception as e:
            wait = min(2 ** attempt, 10)  # 2s, 4s, 8s 最多10s
print(f"重试 {attempt + 1}/{max_retries},等待 {wait}s")
            time.sleep(wait)
raise Exception("API 调用失败,已达最大重试次数")
技巧 5-8:提示词进阶

技巧

说明

效果

角色扮演

设定专业身份(“你是资深 Python 架构师”)

回答质量提升

分步引导

“先分析问题,再给出方案,最后写代码”

逻辑更清晰

示例驱动

提供 1-2 个输入输出示例

格式更准确

约束明确

“回答不超过 200 字”“用表格输出”

输出更可控

技巧 9-12:避坑实战

技巧

说明

长文本分块处理

超过 8K tokens 时采用"分块摘要 + 关键提取"策略

分步验证法

复杂需求先出伪代码→验证逻辑→转目标语言(85% 受访者推荐)

效果-耗时对比表

量化 AI 带来的效率提升(如 API 文档解析从 4.2h → 1.5h)

建立 Prompt 模板库

将常用场景的提示词保存为模板,持续迭代优化

4.3 35 条场景化实用指令精选

职场办公
1. "将以下会议纪要整理为结构化摘要,突出决议事项和待办任务"
2. "帮我写一份季度工作汇报,包含关键成果、数据亮点、下季度规划"
3. "分析这封英文邮件,用中文回复并保持专业礼貌"
4. "根据以下产品参数,生成一份面向客户的 FAQ 文档"
5. "把这组销售数据生成趋势分析,附可视化建议"
学习学术
6. "用费曼学习法解释[量子计算],要求初中生也能听懂"
7. "帮我梳理论文[粘贴摘要或标题]的核心论点、研究方法和局限性"
8. "对比[技术A]和[技术B]的优缺点,用表格呈现并附选型建议"
9. "翻译以下段落为英文学术风格,保留专业术语准确性"
10. "帮我设计一套 21 天学习[Python 机器学习]的计划表"
内容创作
11. "为[产品名称]写3个小红书文案,分别侧重种草、测评、干货型"
12. "把以下故事大纲扩展为 5000 字短视频剧本,分 5 个场景"
13. "写一篇公众号技术推文,主题[AI Agent 发展],面向中级开发者"
14. "生成[金融/医疗/教育]行业 AI 应用趋势的 10 个热门选题"
15. "用 emoji 和网络流行语改写这段文案,目标年轻用户"
编程技术
16. "用 Python 实现一个 LRU 缓存,支持并发安全和过期淘汰"
17. "审查以下代码的安全漏洞和性能问题,给出修复建议"
18. "帮我写 Dockerfile 和 docker-compose.yml,部署 Flask + Redis + PostgreSQL"
19. "解释[Kubernetes Service Mesh]的原理,并给出 minikube 实战步骤"
20. "为以下 RESTful API 设计生成完整的 Swagger 文档"

4.4 提示词工程三大黄金法则

来自 500+ 用户实践的精练总结:

法则

核心要点

效果

① 结构化表达

明确角色、任务、格式、约束

效果提升 50%+

② 混合工作流

AI 生成 + 人类复核,迭代优化

效率最高

③ 持续优化

建立 Prompt 模板库,定期复盘改进

进阶关键

参考来源:500+ 小红书用户实战分享、smzdm《DeepSeek 实用指令大全》、知乎 DeepSeek 零基础手册


五、API 接口调用实战

5.1 获取 API Key

  1.  访问 DeepSeek Platform

  2.  注册/登录后进入「API Keys」页面

  3.  点击「Create New Key」生成密钥

  4.  重要:复制并妥善保管,离开页面后将无法再次查看

5.2 基础调用示例

Python SDK
pip install openai
from openai import OpenAI

client = OpenAI(
    api_key="sk-your-api-key-here",
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-chat",  # 或 "deepseek-reasoner"
    messages=[
        {"role": "system", "content": "你是一个专业的 Python 开发者"},
        {"role": "user", "content": "用 Python 实现快速排序算法,并分析时间复杂度"}
    ],
    temperature=0.7,
    max_tokens=2000,
    stream=False
)

print(response.choices[0].message.content)
Node.js
constOpenAI = require('openai');

const client = newOpenAI({
apiKey: 'sk-your-api-key-here',
baseURL: 'https://api.deepseek.com'
});

asyncfunctionmain() {
const response = await client.chat.completions.create({
model: 'deepseek-chat',
messages: [
            { role: 'user', content: '解释 React Hooks 的核心原理' }
        ],
temperature: 0.5
    });
console.log(response.choices[0].message.content);
}

main();
cURL
curl https://api.deepseek.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-your-api-key" \
  -d '{
    "model": "deepseek-chat",
    "messages": [{"role": "user", "content": "Hello!"}],
    "temperature": 0.7
  }'

5.3 流式输出

from openai import OpenAI

client = OpenAI(
    api_key="sk-your-api-key-here",
    base_url="https://api.deepseek.com"
)

stream = client.chat.completions.create(
    model="deepseek-chat",
    messages=[{"role": "user", "content": "写一篇 500 字的技术文章"}],
    stream=True
)

for chunk in stream:
if chunk.choices[0].delta.content:
print(chunk.choices[0].delta.content, end="", flush=True)

5.4 function calling(工具调用)

tools = [
    {
"type": "function",
"function": {
"name": "get_weather",
"description": "获取指定城市的天气信息",
"parameters": {
"type": "object",
"properties": {
"city": {"type": "string", "description": "城市名称"}
                },
"required": ["city"]
            }
        }
    }
]

response = client.chat.completions.create(
    model="deepseek-chat",
    messages=[{"role": "user", "content": "北京今天天气怎么样?"}],
    tools=tools,
    tool_choice="auto"
)

tool_call = response.choices[0].message.tool_calls[0]
print(f"调用函数: {tool_call.function.name}")
print(f"参数: {tool_call.function.arguments}")

5.5 模型映射规则

使用 DeepSeek Anthropic 兼容 API 时的自动映射:

Claude 模型名前缀

自动映射为

claude-opus deepseek-v4-pro
claude-sonnet deepseek-v4-flash
claude-haiku deepseek-v4-flash

参考来源:DeepSeek 官方 API 文档


六、本地部署实战(Ollama / LM Studio / vLLM)

6.1 硬件配置要求

根据 DeepSeek 不同参数量模型,分级硬件需求如下:

配置等级

CPU

GPU

内存

存储

可运行模型

入门版

i5-8500+

16GB

50GB

1.5B~7B Q4 量化版

标准版

i7-10700+

RTX 3060 8GB

32GB

100GB

7B~14B Q4/Q5 量化版

高性能版

Xeon/AMD EPYC

RTX 4090 24GB

64GB+

1TB NVMe

14B~70B 量化版

服务器版

双路 Xeon

A100 80GB ×2

256GB+

4TB NVMe

全量版多卡并行

6.2 量化精度与显存对照

模型量化版本

参数量

量化精度

显存占用

适用硬件

deepseek-r1-1.5b

1.5B

Q4_K_M

~1.5GB

无 GPU / 集成显卡

deepseek-r1-7b-q4

7B

Q4_K_M

~6.8GB

RTX 3060

deepseek-r1-14b-q5

14B

Q5_K_S

~12GB

RTX 4070+

deepseek-r1-32b-q4

32B

Q4_K_M

~20GB

RTX 4090

deepseek-r1-70b-q4

70B

Q4_K_M

~40GB

RTX 4090 ×2 / A100

6.3 方案一:Ollama 部署(最简单)

安装 Ollama
# Linux / macOS
curl -fsSL https://ollama.com/install.sh | sh

# Windows:访问 https://ollama.com/download/windows 下载安装包
下载并运行 DeepSeek 模型
# 下载量化版 DeepSeek-R1
ollama pull deepseek-r1:7b

# 运行模型
ollama run deepseek-r1:7b

# 或指定量化版本
ollama pull deepseek-r1:14b-q5_k_m
量化性能实测

在 RTX 4080 上实测数据:

原始模型(FP16):
  推理速度:42 tokens/s
  显存占用:14.2GB

量化后(Q4_K_M):
  推理速度:68 tokens/s (+61%)
  显存占用:6.8GB (-52%)
启用 Flash Attention 加速
export OLLAMA_FLASH_ATTN=1
ollama serve
API 调用
import ollama

response = ollama.generate(
    model='deepseek-r1:7b-q4',
    prompt='用 Python 实现二叉树层序遍历',
    stream=False,
    options={
'temperature': 0.5,
'max_tokens': 2000
    }
)
print(response['response'])

6.4 方案二:LM Studio 部署(界面友好)

  1.  下载 LM Studio

  2.  在搜索栏搜索「DeepSeek」

  3.  选择合适的量化版本(推荐 Q4_K_M)

  4.  点击下载并加载模型

  5.  启用「Local Server」即可通过 OpenAI 兼容 API 调用

6.5 方案三:vLLM 部署(高性能)

适合企业级高并发场景:

# 安装 vLLM
pip install vllm

# 启动 API 服务
vllm serve deepseek-ai/DeepSeek-R1-Distill-Qwen-7B \
  --host 0.0.0.0 \
  --port 8000 \
  --max-model-len 32768 \
  --gpu-memory-utilization 0.95 \
  --tensor-parallel-size 1

6.6 Open WebUI 可视化界面

使用 Docker Compose 一键部署:

version:'3.8'
services:
ollama:
image:ollama/ollama
ports:
-"11434:11434"
volumes:
-ollama_data:/root/.ollama

webui:
image:ghcr.io/open-webui/open-webui:main
ports:
-"3000:8080"
environment:
-OLLAMA_API_BASE_URL=http://ollama:11434
depends_on:
-ollama

volumes:
ollama_data:

启动命令:

docker-compose up -d
# 访问 http://localhost:3000 进入图形界面

参考来源:腾讯云 DeepSeek R1 本地部署全流程指南、Ollama 官方文档


七、Claude Code / Cursor / VS Code 集成

7.1 Claude Code 接入 DeepSeek

DeepSeek 提供了完全兼容 Anthropic API 格式的接口,只需修改环境变量即可无缝切换。

方案一:已有 Claude Code,迁移到 DeepSeek

Linux / Mac

export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic
export ANTHROPIC_AUTH_TOKEN=<你的 DeepSeek API Key>
export ANTHROPIC_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_OPUS_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_SONNET_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_HAIKU_MODEL=deepseek-v4-flash
export CLAUDE_CODE_SUBAGENT_MODEL=deepseek-v4-flash
export CLAUDE_CODE_EFFORT_LEVEL=max

Windows (PowerShell)

$env:ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"
$env:ANTHROPIC_AUTH_TOKEN="<你的 DeepSeek API Key>"
$env:ANTHROPIC_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_OPUS_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_SONNET_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_HAIKU_MODEL="deepseek-v4-flash"
$env:CLAUDE_CODE_SUBAGENT_MODEL="deepseek-v4-flash"
$env:CLAUDE_CODE_EFFORT_LEVEL="max"
方案二:从零安装 Claude Code + DeepSeek
# 1. 安装 Node.js 18+
# 2. 安装 Claude Code
npm install -g @anthropic-ai/claude-code

# 3. 验证安装
claude --version

# 4. 配置环境变量(同上方案一)
# 5. 启动使用
cd /path/to/your-project
claude
方案三:通过 settings.json 配置(推荐)

在 ~/.claude/settings.json 中配置,避免每次设置环境变量:

{
"env":{
"ANTHROPIC_AUTH_TOKEN":"sk-你的 api key",
"ANTHROPIC_BASE_URL":"https://api.deepseek.com/anthropic",
"ANTHROPIC_MODEL":"deepseek-chat",
"ANTHROPIC_DEFAULT_OPUS_MODEL":"deepseek-reasoner",
"ANTHROPIC_DEFAULT_SONNET_MODEL":"deepseek-chat",
"ANTHROPIC_DEFAULT_HAIKU_MODEL":"deepseek-chat",
"CLAUDE_CODE_SUBAGENT_MODEL":"deepseek-chat",
"CLAUDE_CODE_MAX_OUTPUT_TOKENS":"32000"
},
"permissions":{
"allow":[],
"deny":[]
}
}

混合策略优势

  •  日常编码使用 deepseek-chat,成本降低约 70%

  •  复杂推理自动切换为 deepseek-reasoner

  •  子代理任务使用经济模型

7.2 Cursor 集成

  1.  打开 Cursor → Settings → Models

  2.  添加自定义 API:

    •  Provider:OpenAI Compatible

    •  Base URL:https://api.deepseek.com

    •  API Key:你的 DeepSeek API Key

  3.  添加模型名称:deepseek-chat 或 deepseek-reasoner

7.3 VS Code (Continue.dev) 集成

在 Continue 配置文件 config.json 中添加:

{
"models":[
{
"title":"DeepSeek V4",
"provider":"openai",
"model":"deepseek-chat",
"apiBase":"https://api.deepseek.com",
"apiKey":"sk-your-api-key"
}
]
}

7.4 Web Search 功能

DeepSeek API 原生支持 Claude Code 中的 Web Search 功能。模型会自动判断是否需要搜索,但注意:

  •  Web Search 会产生额外的大模型 API 请求来总结搜索内容

  •  因此会产生额外的 Token 费用

参考来源:DeepSeek API Docs、腾讯云 Claude Code 接入 DeepSeek 指南


八、RAG 企业知识库搭建实战

8.1 技术栈选型

基于腾讯云社区实战教程,使用以下技术栈构建企业级 RAG 系统:

组件

选型

说明

大模型

DeepSeek V4

强大的理解与生成能力

嵌入模型

BGE-M3

本地部署,支持中英文,1024 维

向量数据库

ChromaDB

轻量级、易部署

编排框架

LangChain

简化 RAG 流程开发

文档解析

Unstructured

支持 PDF、Word、Markdown 等格式

8.2 环境准备

pip install langchain chromadb unstructured[pdf] tiktoken sentence-transformers

8.3 文档加载与智能切片

from langchain.document_loaders import DirectoryLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter

defload_and_split_documents(docs_dir: str = "./docs"):
"""加载文档并进行智能切片"""
# 加载文档(支持 MD、PDF、Word 等)
    loader = DirectoryLoader(docs_dir, glob="**/*.md")
    documents = loader.load()

# 智能切片:保持段落完整性
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=1000,       # 每块 1000 字符
        chunk_overlap=200,     # 重叠 200 字符,保持上下文连贯
        separators=["\n\n", "\n", "。", "!", "?", ". ", " "]
    )

    chunks = text_splitter.split_documents(documents)
print(f"共切分为 {len(chunks)} 个文档块")
return chunks

8.4 向量嵌入与存储

import chromadb
from langchain.embeddings import HuggingFaceEmbeddings

classVectorStoreManager:
def__init__(self, persist_directory: str = "./chroma_db"):
self.client = chromadb.PersistentClient(path=persist_directory)
self.embedding_func = HuggingFaceEmbeddings(
            model_name="BAAI/bge-m3",
            model_kwargs={'device': 'cpu'}
        )
self.collection = self.client.get_or_create_collection(
            name="company_docs",
            embedding_function=self.embedding_func
        )

defadd_documents(self, chunks):
for i, chunk inenumerate(chunks):
self.collection.add(
                ids=[f"doc_{i}"],
                documents=[chunk.page_content],
                metadatas=[{
"source": chunk.metadata.get("source", ""),
"page": chunk.metadata.get("page", 0)
                }]
            )
print(f"成功存入 {len(chunks)} 个文档块")

defsearch(self, query: str, top_k: int = 5):
        results = self.collection.query(
            query_texts=[query],
            n_results=top_k
        )
return results['documents'][0], results['metadatas'][0]

8.5 构建 RAG 问答链(核心代码)

from openai import AsyncOpenAI
import asyncio

classRAGChatBot:
def__init__(self, api_key: str):
self.client = AsyncOpenAI(
            api_key=api_key,
            base_url="https://api.deepseek.com"
        )
self.vector_store = VectorStoreManager()

asyncdefanswer_question(self, question: str) -> dict:
# 1. 检索相关文档
        contexts, metadatas = self.vector_store.search(question, top_k=3)

# 2. 构建 Prompt
        context_text = "\n\n".join(contexts)
        prompt = f"""
        你是一个专业的技术助手。请根据以下参考资料回答问题。

        参考资料:
{context_text}

        问题: {question}

        要求:
        1. 答案必须基于参考资料,不要编造
        2. 如果资料中没有相关信息,请明确说明
        3. 在答案末尾列出引用的文档来源
        4. 语言简洁专业,不超过 300 字

        答案:
        """

# 3. 调用 DeepSeek 生成答案
        response = awaitself.client.chat.completions.create(
            model="deepseek-chat",
            messages=[{"role": "user", "content": prompt}],
            temperature=0.3
        )
        answer = response.choices[0].message.content

# 4. 提取来源链接
        sources = [meta.get("source", "") for meta in metadatas]
return {"answer": answer, "sources": list(set(sources))}

# 使用示例
asyncdefmain():
    bot = RAGChatBot(api_key="sk-your-api-key")
    result = await bot.answer_question("如何配置公司的 CI/CD 流水线?")
print(f"答案: {result['answer']}")
print(f"来源: {result['sources']}")

asyncio.run(main())

8.6 性能优化与效果评估

实测在 10 万+ 文档 场景下:

指标

数值

优化方案

检索准确率

89%

引入重排序 (Re-ranking) +12%,混合检索 +15%

响应时间

~1.5s

GPU 加速嵌入 + 流式输出

支持并发

无限制

使用 vLLM 后端提升吞吐

8.7 成本分析:RAG vs 传统人工客服

按中型企业 1000 名员工、日均 500 次查询计算:

指标

传统人工客服

RAG 智能问答

改善幅度

响应时间

5 分钟

1.5 秒

-99.5%

准确率

75%

92%

+23%

人力需求

10 人

1 人

-90%
年度成本 约 195 万 约 31 万 节省 164 万

参考来源:腾讯云社区《基于 DeepSeek V4 的企业级 RAG 系统》


九、DeepSeek + Dify + 微信 智能客服搭建

9.1 架构概览

用户微信消息
  → 微信服务器
    → dify-on-wechat 中转服务
      → Dify 智能体平台
        → DeepSeek API / 本地模型
      ← 生成回复
    ← 返回
  ← 推送回复

9.2 前置准备

步骤一:部署 Dify + DeepSeek 知识库

在 Dify 平台上:

  1.  创建应用 → 选择「聊天助手」类型

  2.  配置 LLM 为 DeepSeek(填入 API Key)

  3.  上传企业知识文档,构建知识库

  4.  发布应用,获取 API 接口地址 和 API Key

步骤二:准备微信小号

⚠️ 安全提醒:必须使用已完成实名认证的小号登录微信。严禁使用主号,以避免封号风险。

9.3 部署 dify-on-wechat

# 1. 克隆项目
git clone https://github.com/hanfangyuan4396/dify-on-wechat.git
cd dify-on-wechat

# 2. 配置 config.json

config.json 核心配置:

{
"dify_api_base":"https://your-dify-app.com/v1",
"dify_api_key":"app-xxxxxxxxxxxxx",
"bot_name":"AI助手",
"single_chat_prefix":[""],
"group_chat_prefix":["@AI助手"]
}
# 3. 安装依赖
pip install -r requirements.txt

# 4. 启动并扫码登录
python app.py
# 终端显示二维码后,使用微信小号扫码
# 当显示 "Start auto replying" 即表示启动成功

9.4 触发规则

场景

触发方式

单聊

直接发送消息(或带前缀,取决于配置)

群聊

@机器人 + 消息内容

9.5 后续优化方向

优化方向

说明

多级召回体系

构建更精准的知识检索策略

Rerank 增强

引入重排序机制提升回答质量

动态参数优化

根据场景自动调整模型参数

多模态接入

支持图片、语音等非文本处理

参考来源:掘金《deepseek+dify 本地部署知识库接入微信》、掘金 Dify 官方文档


十、高效办公全场景实战

10.1 五大办公场景速览

场景

核心功能

效率提升

文档处理

合同生成、合规审查、文档摘要

节省 70% 撰写时间

数据分析

数据清洗、趋势分析、SQL 生成

API 文档解析 4.2h → 1.5h

代码开发

测试生成、代码审查、CI/CD

测试用例 32→89 cases/h

创意设计

PPT 生成、提示词优化、短视频脚本

全流程自动化

流程自动化

发票处理、客服应答、邮件回复

24/7 无人值守

10.2 智能合同生成

from openai import OpenAI
from docx import Document

client = OpenAI(
    api_key="sk-your-api-key",
    base_url="https://api.deepseek.com"
)

defgenerate_contract(template_type: str, client_info: dict) -> str:
"""生成标准化合同"""
    prompt = f"""
    请生成一份 {template_type} 合同,包含以下信息:
    - 甲方:{client_info['company_a']}
    - 乙方:{client_info['company_b']}
    - 合同金额:{client_info['amount']}
    - 服务期限:{client_info['duration']}

    要求:
    1. 包含标准合同条款:双方信息、金额、期限、违约条款、争议解决
    2. 使用 Markdown 格式
    3. 语言专业严谨
    """

    response = client.chat.completions.create(
        model="deepseek-chat",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.3
    )
return response.choices[0].message.content

# 生成并保存为 Word
contract_text = generate_contract("服务协议", {
"company_a": "XX科技有限公司",
"company_b": "YY信息技术有限公司",
"amount": "50万元",
"duration": "12个月"
})

doc = Document()
doc.add_heading("服务协议", 0)
for paragraph in contract_text.split('\n'):
if paragraph.strip():
        doc.add_paragraph(paragraph.strip())
doc.save("contract.docx")

10.3 智能数据清洗

import pandas as pd
import numpy as np

defclean_data(df: pd.DataFrame) -> pd.DataFrame:
"""
    三步智能数据清洗:
    1. 缺失值处理
    2. 异常值检测 (3σ原则)
    3. 格式标准化
    """
# 1. 缺失值处理
for col in df.columns:
if df[col].dtype in ['float64', 'int64']:
            df[col] = df[col].fillna(df[col].median())
else:
            df[col] = df[col].fillna("未知")

# 2. 异常值检测
for col in df.select_dtypes(include=[np.number]).columns:
        mean, std = df[col].mean(), df[col].std()
        df[f'{col}_异常'] = ~df[col].between(mean - 3*std, mean + 3*std)

# 3. 格式标准化
for col in df.select_dtypes(include=['datetime64']):
        df[col] = pd.to_datetime(df[col]).dt.strftime('%Y-%m-%d')

print(f"清洗完成:{len(df)} 行数据")
return df

10.4 需求文档转测试用例

import re

defrequirements_to_testcases(requirements_text: str) -> list:
"""
    从需求文档自动提取功能点,生成 pytest 测试用例
    """
    test_cases = []
    lines = requirements_text.strip().split('\n')

for i, line inenumerate(lines):
# 提取以"需求"或数字编号开头的行
match = re.match(r'^(?:需求|REQ)?\s*\d*[.、]\s*(.+)', line)
ifmatch:
            feature = match.group(1).strip()
            test_case = f'''
@pytest.mark.priority("P1")
def test_{feature.replace(" ", "_").replace("(", "").replace(")", "")[:30]}():
    """测试用例: {feature}"""
    # TODO: 实现具体测试逻辑
    assert True  # 占位断言

'''
            test_cases.append(test_case)

return test_cases

# 使用示例
requirements = """
需求1、用户登录功能,支持邮箱和手机号
需求2、密码找回功能,通过邮箱验证码
需求3、个人资料编辑,支持头像上传
"""

cases = requirements_to_testcases(requirements)
withopen("test_generated.py", "w") as f:
forcasein cases:
        f.write(case)
print(f"生成 {len(cases)} 个测试用例")

10.5 智能 PPT 生成

from pptx import Presentation
from pptx.util import Inches

defmarkdown_to_pptx(markdown_text: str, output_path: str):
"""将 Markdown 内容转换为 PPT"""
    prs = Presentation()
    lines = markdown_text.strip().split('\n')

for line in lines:
if line.startswith('# '):
# 一级标题 → 新建幻灯片
            slide = prs.slides.add_slide(prs.slide_layouts[0])
            slide.shapes.title.text = line.replace('# ', '')
elif line.startswith('## '):
# 二级标题 → 新建内容幻灯片
            slide = prs.slides.add_slide(prs.slide_layouts[1])
            slide.shapes.title.text = line.replace('## ', '')
elif line.startswith('- '):
# 列表项 → 添加到当前幻灯片
if slide.shapes.placeholders:
# 简化示例,实际需要更复杂的布局管理
pass

    prs.save(output_path)
print(f"PPT 已保存至 {output_path}")

10.6 分阶段实施策略

阶段

目标

推荐工具

周期

试点期

验证核心场景

DeepSeek + Office 插件 + Python

2 周

扩展期

覆盖 80% 高频办公场景

增加 RPA 工具(UiPath 等)

4 周

优化期

建立 AI 质量监控体系

Prometheus + Grafana

持续

参考来源:CSDN《DeepSeek+AI 工具链高效办公全场景实战手册》


十一、Prompt 提示词工程与进阶技巧

11.1 三级 Prompt 框架

级别

描述

适用场景

示例

L1 基础

直接提问

简单问答

“Python 列表和元组的区别”

L2 结构化

角色+任务+格式

专业任务

“你是资深架构师,设计微服务方案,输出为表格”

L3 链式思维

分步引导+验证

复杂问题

“先分析问题,再给出3个方案,对比后推荐最优”

11.2 场景化 Prompt 模板

编程类
【角色】你是一位拥有 10 年经验的 Python 后端架构师
【任务】设计一个高并发秒杀系统
【约束】
- 支持 10000 QPS
- 使用 Redis + MySQL 技术栈
- 保证不超卖、不超发
- 考虑缓存击穿和雪崩防护
【格式】分别给出架构图描述、核心代码片段和数据库设计
写作类
【角色】你是一位资深科技媒体编辑
【任务】为公众号撰写一篇 AI Agent 技术趋势文章
【要求】
- 面向中级开发者,避免过于晦涩
- 800-1000 字
- 包含至少 2 个实际案例
- 开头要有吸引力,结尾有总结展望
【风格】专业但不枯燥,适当使用比喻
分析类
【任务】分析以下销售数据的趋势和异常
【数据】(粘贴 CSV 或表格数据)
【要求】
1. 识别 Top 3 增长品类和 Top 3 下降品类
2. 分析季节性和周期性规律
3. 给出 3 条可操作的改进建议
【格式】分三部分输出,每部分用表格呈现关键数据

11.3 R1 推理模型专属提示词技巧

R1 系列采用思维链推理,需要不同的提示策略:

# 适合 R1 的提问方式
"请逐步分析并解决以下问题:
首先,列出所有已知条件和约束;
然后,分析可能的解法及其复杂度;
最后,给出最优解和完整代码实现。

问题:[描述]"

# 不适合 R1 的提问方式
"写一个排序算法"  # 太简单,浪费推理能力

11.4 提示词优化循环

撰写初版 Prompt
  → 观察输出质量
    → 识别问题(格式/准确性/完整性)
      → 增加约束或示例
        → 再次测试
          → 满意后保存为模板

11.5 建立个人 Prompt 模板库

推荐使用 Markdown 文件管理:

# 我的 DeepSeek Prompt 模板库

## 编程
### 代码审查
[角色] 资深代码审查员
[任务] 审查以下代码
[关注点] 安全漏洞、性能瓶颈、代码规范
[输出] 按严重程度排序的问题列表,附修复代码

### API 设计
...

## 写作
### 技术博客
...

参考来源:500+ 小红书用户实战、DeepSeek R1 思维链分析


十二、性能优化与故障排查

12.1 常见 API 错误码速查

错误码

含义

常见原因

解决方案

401

身份验证失败

API Key 无效/过期/有空格

重新生成 Key,检查复制完整

403

权限不足

余额不足/未开通服务

充值或检查账户状态

429

请求频率超限

并发请求过多

指数退避重试,降低并发

422

参数错误

temperature>2 等参数越界

检查参数范围:temperature 0-2, max_tokens 1-32000

500

服务端内部错误

DeepSeek 服务器故障

等待并重试

502

网关错误

上游服务异常

切换 API 节点或等待恢复

503

服务不可用

临时维护

稍后重试

12.2 速率限制与重试策略

import time
from openai import OpenAI

client = OpenAI(
    api_key="sk-your-api-key",
    base_url="https://api.deepseek.com",
    timeout=30.0,
    max_retries=3
)

defcall_with_exponential_backoff(messages, max_retries=5):
"""带指数退避的 API 调用"""
for attempt inrange(max_retries):
try:
            response = client.chat.completions.create(
                model="deepseek-chat",
                messages=messages,
                temperature=0.7
            )
return response
except Exception as e:
if"429"instr(e) or"rate"instr(e).lower():
                wait_time = min(2 ** attempt, 60)
print(f"限流触发,等待 {wait_time}s 后重试...")
                time.sleep(wait_time)
elif"401"instr(e):
raise ValueError("API Key 无效,请检查")
else:
                wait_time = min(2 ** attempt, 10)
                time.sleep(wait_time)

raise Exception("达到最大重试次数")

12.3 流式响应中断处理

asyncdefstream_with_reconnect(client, messages, max_retries=3):
"""支持断点续传的流式响应"""
for attempt inrange(max_retries):
try:
            stream = await client.chat.completions.create(
                model="deepseek-chat",
                messages=messages,
                stream=True
            )
            collected = ""
asyncfor chunk in stream:
if chunk.choices[0].delta.content:
                    content = chunk.choices[0].delta.content
                    collected += content
yield content
return collected
except Exception as e:
if attempt < max_retries - 1:
print(f"流中断,尝试重连 ({attempt + 1}/{max_retries})")
await asyncio.sleep(2 ** attempt)
else:
raise

12.4 生产环境推荐配置

配置项

推荐值

说明

单次请求超时

30 秒

避免长时间挂起

自动重试次数

3 次

指数退避策略

降级策略

V4-Pro → V4-Flash

主模型不可用时自动切换

监控告警

错误率 > 5%

触发 PagerDuty/飞书通知

缓存层

相同问题缓存 10 分钟

减少重复 API 调用

连接池

最大 10 个并发

避免触发 429 限流

12.5 成本监控装饰器

import time
from functools import wraps

defmonitor_cost(func):
"""API 调用成本监控装饰器"""
    @wraps(func)
defwrapper(*args, **kwargs):
        start = time.time()
try:
            result = func(*args, **kwargs)
            elapsed_ms = (time.time() - start) * 1000

# 估算成本 (DeepSeek V4 输出价格 $0.87/1M tokens)
ifhasattr(result, 'usage'):
                input_cost = result.usage.prompt_tokens * 0.435 / 1_000_000
                output_cost = result.usage.completion_tokens * 0.87 / 1_000_000
                total = input_cost + output_cost
print(f"API 调用:耗时 {elapsed_ms:.0f}ms,成本 ${total:.6f}")

return result
except Exception as e:
            elapsed_ms = (time.time() - start) * 1000
print(f"API 调用失败:耗时 {elapsed_ms:.0f}ms,错误: {str(e)}")
raise
return wrapper

12.6 快速诊断清单

按以下顺序排查问题:

  1. 1. ✅ API Key 是否正确(以 sk- 开头)

  2. 2. ✅ Base URL 是否配置为 https://api.deepseek.com

  3. 3. ✅ 账户余额是否充足

  4. 4. ✅ 模型名称是否正确(deepseek-chat 或 deepseek-reasoner

  5. 5. ✅ 请求参数是否在有效范围内

  6. 6. ✅ 网络是否能访问 api.deepseek.com

# 快速测试命令
curl -I https://api.deepseek.com

参考来源:HolySheep API 故障排查指南、CSDN DeepSeek API 接入常见问题


十三、热门实操案例精选

案例 1:16GB 笔记本做 AI 编程助手

背景:普通 16GB 内存笔记本(无独显),想用 DeepSeek 本地辅助编程

方案

# 1. 安装 Ollama
curl -fsSL https://ollama.com/install.sh | sh

# 2. 下载 1.5B 量化版(仅需 1.5GB 显存)
ollama pull deepseek-r1:1.5b

# 3. 测试编程辅助
ollama run deepseek-r1:1.5b "用 Python 写一个冒泡排序,并解释每步做了什么"

# 4. 接入 VS Code Continue 插件
# config.json 中添加:
# { "model": "deepseek-r1:1.5b", "apiBase": "http://localhost:11434" }

效果:基础代码补全和解释可用,复杂推理建议使用云端 API。

案例 2:DeepSeek V4 做自动化 Code Review

背景:团队想用 DeepSeek V4 对 Pull Request 做自动化 Code Review

方案

import subprocess
from openai import OpenAI

client = OpenAI(
    api_key="sk-your-api-key",
    base_url="https://api.deepseek.com"
)

defreview_pr_diff(diff_text: str) -> str:
"""审查 Git diff"""
    prompt = f"""
    请审查以下代码变更,重点关注:
    1. 安全漏洞(SQL注入、XSS、敏感信息泄露)
    2. 性能问题(N+1查询、内存泄漏、不必要的循环)
    3. 代码规范(命名、注释、错误处理)
    4. 逻辑错误

    请按严重程度排序,给出具体的修复建议和代码示例。

    Git Diff:
{diff_text[:60000]}  # 限制长度在上下文窗口内
    """

    response = client.chat.completions.create(
        model="deepseek-chat",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.3
    )
return response.choices[0].message.content

# 获取 PR diff
diff = subprocess.run(
    ['git', 'diff', 'origin/main...HEAD'],
    capture_output=True, text=True
).stdout

# 执行审查
review = review_pr_diff(diff)
print(review)

案例 3:自媒体批量内容生产

背景:运营 5 个不同领域的自媒体账号,需要批量生成初稿

方案

from openai import OpenAI
import json

client = OpenAI(
    api_key="sk-your-api-key",
    base_url="https://api.deepseek.com"
)

topics = [
    {"领域": "AI技术", "主题": "2026年值得关注的5个AI开源项目"},
    {"领域": "编程", "主题": "Python 3.14 新特性详解"},
    {"领域": "职场", "主题": "远程办公效率提升的10个技巧"},
    {"领域": "创业", "主题": "SaaS产品从0到1的获客策略"},
    {"领域": "设计", "主题": "2026 UI/UX 设计趋势预测"}
]

for topic in topics:
    prompt = f"""
    你是{topics[0]['领域']}领域的资深博主。
    请撰写一篇关于「{topic['主题']}」的文章。
    要求:1500字左右,结构化(含小标题),面向初中级读者,语气轻松但言之有物。
    """

    response = client.chat.completions.create(
        model="deepseek-chat",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.8,
        max_tokens=3000
    )

    filename = f"{topic['主题'][:20]}.md"
withopen(filename, "w", encoding="utf-8") as f:
        f.write(response.choices[0].message.content)
print(f"已生成:{filename}")

案例 4:企业内部知识库 + 微信智能客服

方案(完整链路):

文档准备 → Dify 知识库构建 → dify-on-wechat 部署 → 微信扫码

已在第九章详细展开,此处不赘述。

案例 5:DeepSeek V4 辅助微服务重构

背景:将 Node.js 单体应用重构为 Go 微服务架构

操作流程

1. 让 DeepSeek 分析现有 Node.js 代码结构
2. 设计微服务拆分方案(API 网关、用户服务、订单服务、商品服务)
3. 生成 Go 项目骨架(含 Dockerfile、K8s 配置)
4. 逐步迁移各模块代码
5. 生成 API 文档和部署脚本

关键提示词

分析以下 Node.js 项目结构,设计一个 Go 微服务迁移方案:
- 列出建议拆分的服务边界
- 设计服务间通信协议(gRPC/REST)
- 给出数据库拆分策略
- 输出完整的项目目录结构和 Docker Compose 配置

项目结构:
[粘贴目录树或核心文件内容]

十四、FAQ 常见问题解答

Q1:DeepSeek 免费吗?

A:Web/App 端使用完全免费(无限制)。API 调用按量收费,但价格极低(V4-Flash 输入仅 $0.14/1M tokens)。本地部署模型完全免费。

Q2:如何选择 V4-Pro 还是 V4-Flash?

A:日常办公用 V4-Flash(性价比高),专业编码/Agent 开发用 V4-Pro(能力强)。推荐混合使用,简单任务用 Flash,复杂任务切 Pro。

Q3:DeepSeek 安全吗?我的数据会被用于训练吗?

A:DeepSeek 不会保存个人提问信息用于训练。但敏感数据建议使用本地部署方式,确保数据完全留在本地。

Q4:API 调用经常报 429,怎么办?

A

  1.  降低并发请求数

  2.  使用指数退避重试策略

  3.  联系 DeepSeek 申请提升速率限制

  4.  考虑本地部署减少 API 依赖

Q5:本地部署需要什么配置?

A:最低 16GB 内存 + 无 GPU 可运行 1.5B 量化版。推荐 RTX 3060 + 32GB 内存运行 7B-14B 量化版。RTX 4090 可运行 32B-70B 量化版。

Q6:Claude Code 接入 DeepSeek 后功能有差异吗?

A:核心编码功能完全可用。已知差异:

  •  Web Search 会产生额外 Token 费用

  •  部分 Claude 特有功能(如 Projects)可能需要额外适配

  •  V4-Pro 在 Agentic Coding 场景下体验良好

Q7:如何查看 API 消费和余额?

A:登录 DeepSeek Platform,在 Dashboard 查看详细使用量、消费记录和余额信息。

Q8:DeepSeek 和其他模型相比有什么优势?

A

  •  vs GPT-4:价格低 50 倍,开源可本地部署

  •  vs Claude:Anthropic API 兼容,迁移零成本

  •  vs 通义千问:代码生成和 Agent 能力更强

  •  vs 文心一言:国际化场景和开源生态更丰富


十五、总结与展望

15.1 核心速记

维度

要点

模型选择

日常办公 V4-Flash,编码 Agent V4-Pro,深度推理 R1

部署方式

零门槛 Web/App → 低成本 API → 完全自主本地部署

成本控制

V4-Flash 输入 $0.14/1M,百元预算可用数月

生态集成

Claude Code/Cursor/VS Code/Dify/RAGFlow 全覆盖

企业价值

RAG 知识库年度可省 164 万,AI 办公效率提升 50-178%

15.2 学习路径推荐

第一阶段(1-3天)
  → Web/App 端上手,熟悉基础交互
  → 掌握三段式 Prompt 框架
  → 浏览模型家族,了解各版本差异

第二阶段(1周)
  → API 调用实战(Python/Node.js)
  → 接入 Claude Code / Cursor / VS Code
  → 建立个人 Prompt 模板库

第三阶段(2周)
  → 本地部署实战(Ollama/LM Studio)
  → RAG 知识库搭建
  → 企业微信/公众号接入

第四阶段(持续)
  → Agent 开发与 Function Calling
  → 多模型协同工作流
  → 成本优化与性能调优

15.3 未来展望

DeepSeek 的发展路径清晰:

  •  V 系列持续强化 Agent 能力和编码水平

  •  R 系列在推理深度和工具调用上不断完善

  •  成本持续下探,V4-Flash 已把百万 token 价格压到 $0.14

  •  开源生态进一步繁荣,更多本地部署方案和社区工具涌现

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐