Coze添加知识库解析的Embedding和PaddleOCR模型配置

本文介绍了两种离线模型在Coze平台上的配置方法：1) Embedding模型配置，使用Ollama部署Qwen3-Embedding-8B模型，修改.env文件设置EMBEDDING_TYPE为ollama并指定URL和模型名称；2) PaddleOCR模型配置，安装相关库后创建FastAPI服务，通过修改.env文件配置OCR服务地址，支持扫描件文本识别和结构化处理。两种配置均需重启Docke

unique_ZRF

1715人浏览 · 2025-09-05 16:17:44

unique_ZRF · 2025-09-05 16:17:44 发布

1. Embedding模型配置

使用ollama模型，导入qwen3的embedding-8B模型，导入流程参考：
Ollama离线部署模型
qwen3-Embedding模型文件可从魔塔社区下载：
Qwen3-Embedding-8B

1.2 Coze配置

在coze_studio/docker目录下输入:

vim .env

找到Embedding设置：
将EMBEDDING_TYPE改为ollama，并修改下面的ollama调用的url和模型名称

ollama中的模型如下：
ollama list

配置完成后输入 :wq 保存vim编辑的内容;

然后返回docker目录下输入：
docker停止：

docker stop $(docker ps -q)

coze启动:

docker-compose --profile ‘*’ up -d

coze启动后在资源库中创建知识库，并上传文件
在这里插入图片描述
然后创建设置：

分段预览和数据处理：

在cmd命令行输入nvidia-smi：
可以看到GPU使用情况:
ollama调用

2. PaddleOCR模型配置

2.1 paddle-ocr安装和代码编写

首先安装PaddleOCR:

pip install paddleocr
pip install paddlepaddle
pip install fastapi uvicorn

paddlerocr运行代码,注意inference参数可能需要自己下载:

from flask import Flask, request, jsonify
from paddleocr import PaddleOCR
import base64, numpy as np, cv2

ocr = PaddleOCR(use_angle_cls=True, use_gpu=False,
                det_model_dir='./inference/ch_PP-OCRv3_det_infer',
                rec_model_dir='./inference/ch_PP-OCRv3_rec_infer',
                cls_model_dir='./inference/ch_ppocr_mobile_v2.0_cls_infer')

app = Flask(__name__)

@app.route("/ocr", methods=["POST"])
def ocr_api():
    img_b64 = request.json["image"]
    img = cv2.imdecode(np.frombuffer(base64.b64decode(img_b64), np.uint8), 1)
    res = ocr.ocr(img, cls=True)
    return jsonify(res)

if __name__ == "__main__":
    app.run(host="0.0.0.0", port=8999)

然后创建paddle_structure.py

from fastapi import FastAPI, UploadFile, File
from paddleocr import PaddleOCR, PPStructure
import uvicorn
import os

app = FastAPI()


# 初始化版面结构化 OCR
table_engine = PPStructure(show_log=True, lang='ch')

UPLOAD_DIR = "uploads"
os.makedirs(UPLOAD_DIR, exist_ok=True)

@app.post("/structure")
async def do_ocr_structure(file: UploadFile = File(...)):
    file_path = os.path.join(UPLOAD_DIR, file.filename)
    with open(file_path, "wb") as f:
        f.write(await file.read())

    result = table_engine(file_path)
    return {"code": 0, "msg": "success", "data": result}


if __name__ == "__main__":
    uvicorn.run(app, host="0.0.0.0", port=9999)

对于离线环境，需要下载paddler-ocr的inference文件并配置:
inference下载和使用

2.2 Coze配置

终端 coze的docker目录下输入:

vim .env

对OCR进行配置并保存：
在这里插入图片描述
然后返回docker目录下输入：
docker停止：

docker stop $(docker ps -q)

coze启动:

docker-compose --profile ‘*’ up -d

coze启动后在资源库中创建知识库，并上传文件，勾选扫描件(OCR)选项,点击下一步之后进行数据处理
在这里插入图片描述
解析结果如下:

在这里插入图片描述

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla