M1芯片macOS安装Xinference部署大模型

会遇到几个问题：1）Python版本如果太新可能安装失败2）全量安装会失败3）未科学上网可能会timeout我目前的做法如下：1）安装mini-conda2）创建虚拟环境，Python指定3.11版本，并激活运行。

Box_csdn

1375人浏览 · 2025-06-19 19:13:18

Box_csdn · 2025-06-19 19:13:18 发布

如果你看的是官方手册：安装 — Xinference

千万不要直接运行：

pip install "xinference[all]"

会遇到几个问题：
1）Python版本如果太新可能安装失败

2）全量安装会失败

3）未科学上网可能会timeout

我目前的做法如下：

1）安装mini-conda

2）创建虚拟环境，Python指定3.11版本，并激活运行

conda create -n xinference python=3.11
conda activate xinference

3）安装官方文档，运行不同的引擎，我推荐使用下面的：

Transformers 引擎

PyTorch(transformers) 引擎支持几乎有所的最新模型，这是 Pytorch 模型默认使用的引擎：

pip install "xinference[transformers]"

如果是M系列芯片的mac，还可以选择：

MLX 引擎

MLX-lm 用来在苹果 silicon 芯片上提供高效的 LLM 推理。

初始步骤：

pip install "xinference[mlx]"

其他引擎大家自行选择。

完成引擎安装后，就可以运行了：

xinference-local --host 0.0.0.0 --port 9997

后续访问 127.0.0.1:9997 即可进行配置；

如果是dify使用，先安装Xorbits Inference插件。

如果是docker部署，则大模型的服务器URL如下：

http://host.docker.internal:9997

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla