7天打造专属智能音箱:wukong-robot全平台部署指南(树莓派/云服务器/PC)
你是否曾想拥有一个能听懂中文的智能音箱?还在为复杂的部署流程望而却步?本文将带你从0到1完成wukong-robot的部署,覆盖树莓派、云服务器和个人电脑三大平台,无需专业知识,7天即可上手。## 项目概览wukong-robot是一个开源中文语音对话机器人项目,支持离线唤醒、多平台部署和丰富的技能扩展。截至2023年,已有超过13,000台设备安装使用,累积唤醒次数突破700,000次。
7天打造专属智能音箱:wukong-robot全平台部署指南(树莓派/云服务器/PC)
你是否曾想拥有一个能听懂中文的智能音箱?还在为复杂的部署流程望而却步?本文将带你从0到1完成wukong-robot的部署,覆盖树莓派、云服务器和个人电脑三大平台,无需专业知识,7天即可上手。
项目概览
wukong-robot是一个开源中文语音对话机器人项目,支持离线唤醒、多平台部署和丰富的技能扩展。截至2023年,已有超过13,000台设备安装使用,累积唤醒次数突破700,000次。
核心特性
- 模块化设计:ASR语音识别、TTS语音合成、对话引擎高度解耦
- 多平台支持:树莓派全系列、Ubuntu、Mac OS及Windows WSL
- 灵活配置:支持百度、讯飞、阿里等多厂商语音服务
- 离线唤醒:支持snowboy/porcupine双引擎及脑机交互唤醒
- 后台管理:内置Web管理界面,支持远程配置与监控

环境准备
硬件要求
| 设备类型 | 最低配置 | 推荐配置 |
|---|---|---|
| 树莓派 | Pi 3B+ 1GB RAM | Pi 4B 4GB RAM |
| 云服务器 | 1核2GB | 2核4GB |
| PC | Intel i3 4GB RAM | Intel i5 8GB RAM |
系统要求
- Python 3.7~3.9(不支持Python 2.x及3.10+)
- 树莓派需安装Raspbian系统
- 云服务器推荐Ubuntu 18.04+
- PC支持Mac OS(Intel芯片)、Windows WSL或Linux
部署步骤
1. 源码获取
git clone https://gitcode.com/GitHub_Trending/wu/wukong-robot
cd wukong-robot
2. 依赖安装
# 基础依赖
sudo apt update && sudo apt install -y python3-pip portaudio19-dev sox ffmpeg
# Python依赖
pip3 install -r requirements.txt
3. 配置文件生成
首次运行时自动创建用户配置:
python3 wukong.py
根据提示输入y,配置文件将生成在~/.wukong/config.yml。
平台部署指南
树莓派部署
硬件准备
- 麦克风:推荐ReSpeaker 2-Mics Pi HAT
- 扬声器:3.5mm接口音箱或HDMI音频
- 可选配件:摄像头、LED指示灯
系统优化
# 启用音频接口
sudo raspi-config nonint do_audio 1
# 安装LED驱动
sudo apt install -y python3-rpi.gpio
唤醒配置
默认使用porcupine唤醒引擎:
# 修改~/.wukong/config.yml
detector: porcupine
porcupine:
access_key: "你的Picovoice访问密钥"
keywords: ["孙悟空"]
获取访问密钥:Picovoice控制台
云服务器部署
Docker快速部署
# 构建镜像
docker build -t wukong-robot -f docker/Dockerfile .
# 运行容器
docker run -d -p 5001:5001 --device /dev/snd wukong-robot
后台管理访问
部署完成后通过以下地址访问管理界面:
- 默认地址:http://服务器IP:5001
- 默认账户:wukong
- 默认密码:wukong@2019
安全提示:首次登录后请立即修改密码,编辑
~/.wukong/config.yml中的server.validate字段(使用python3 wukong.py md5 "新密码"生成加密串)
PC本地部署
Windows系统
需先安装WSL并启用音频:
# WSL内安装音频驱动
sudo apt install -y pulseaudio
# 启动WSL音频服务
pulseaudio --start
Mac系统
# 安装音频依赖
brew install portaudio ffmpeg sox
# 启动服务
python3 wukong.py
配置优化
语音服务配置
百度语音(默认)
baidu_yuyin:
appid: "你的APPID"
api_key: "你的API_KEY"
secret_key: "你的SECRET_KEY"
申请地址:百度智能云
离线语音方案
对于无网络环境,可配置FunASR本地识别:
asr_engine: fun-asr
fun_asr:
model_dir: "/path/to/exported/model"
模型导出方法见官方文档
技能插件安装
官方插件列表:
- 摄像头控制:plugins/Camera.py
- 本地音乐播放:plugins/LocalPlayer.py
- 定时提醒:plugins/Reminder.py
安装第三方插件:
# 插件目录
cd ~/.wukong/plugins
# 下载插件
git clone https://github.com/xxx/wukong-plugin-example
运行与维护
启动命令
# 前台运行
python3 wukong.py
# 后台运行(推荐)
nohup python3 wukong.py > wukong.log 2>&1 &
升级方法
# 自动升级
python3 wukong.py update
# 手动升级
git pull && pip3 install -r requirements.txt
日志查看
# 实时日志
tail -f ~/.wukong/logs/wukong.log
# 或通过Web后台:系统日志页面
常见问题解决
唤醒不灵敏
- 调整灵敏度:
config.yml中sensitivity: 0.6(0.3~0.8范围) - 更换唤醒词:使用snowboy-seasalt训练自定义模型
- 环境优化:减少背景噪音,使用定向麦克风
语音合成失败
- 检查API密钥有效性
- 配置网络代理(针对国外服务):
openai:
proxy: "http://代理地址:端口"
- 切换语音引擎:
tts_engine: edge-tts # 微软Edge TTS无需API密钥
高级应用
脑机交互(实验性功能)
muse:
enable: true
ip: "你的Muse Monitor OSC IP"
port: 5001
通过同时眨眼和咬牙动作实现脑机唤醒。
智能家居控制
配置HomeAssistant联动:
# 在第三方插件配置区添加
homeassistant:
host: "http://ha-server:8123"
token: "你的长期访问令牌"
资源与社区
官方文档
- 完整文档:docs/index.html
- 配置说明:static/default.yml
- API接口:server/templates/api.md
社区支持
- QQ频道:扫码加入(见项目README)
- 问题反馈:提交Issue到代码仓库
- 插件分享:wukong-contrib
通过本文指南,你已掌握wukong-robot在不同平台的部署方法。项目持续更新中,欢迎贡献代码或分享使用经验。现在就开始打造你的专属智能音箱吧!
更多推荐
所有评论(0)