xinference配置embedding模型

docker run --gpus '"device=0"' --name xinference -d -p 9997:9997 -e XINFERENCE_HOME=/data -v /模型路径:/data xprobe/xinference:latest xinference-local -H 0.0.0.0。"input": "你好"embedding模型配置---进行bge-m3模型的下载

小兰吃西瓜

1031人浏览 · 2025-03-10 10:14:49

小兰吃西瓜 · 2025-03-10 10:14:49 发布

embedding模型配置---

进行bge-m3模型的下载

推理镜像的下载

docker pull dockerproxy.net/xprobe/xinference:latest

推理镜像的执行

docker run --gpus '"device=0"' --name xinference -d -p 9997:9997 -e XINFERENCE_HOME=/data -v /模型路径:/data xprobe/xinference:latest xinference-local -H 0.0.0.0

进入推理容器内执行

xinference launch --model-name bge-m3 --model-type embedding -u bge-m3 -mp /data/bge-m3

外部请求

curl -X 'POST' \
'http://127.0.0.1:9997/v1/embeddings' \
-d '{
"model": "bge-m3",
"input": "你好"
}'

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

智能体开发者社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

智能体开发者社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla