7天打造专属智能音箱:wukong-robot全平台部署指南(树莓派/云服务器/PC)

【免费下载链接】wukong-robot 🤖 wukong-robot 是一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,支持ChatGPT多轮对话能力,还可能是首个支持脑机交互的开源智能音箱项目。 【免费下载链接】wukong-robot 项目地址: https://gitcode.com/GitHub_Trending/wu/wukong-robot

你是否曾想拥有一个能听懂中文的智能音箱?还在为复杂的部署流程望而却步?本文将带你从0到1完成wukong-robot的部署,覆盖树莓派、云服务器和个人电脑三大平台,无需专业知识,7天即可上手。

项目概览

wukong-robot是一个开源中文语音对话机器人项目,支持离线唤醒、多平台部署和丰富的技能扩展。截至2023年,已有超过13,000台设备安装使用,累积唤醒次数突破700,000次。

核心特性

  • 模块化设计:ASR语音识别、TTS语音合成、对话引擎高度解耦
  • 多平台支持:树莓派全系列、Ubuntu、Mac OS及Windows WSL
  • 灵活配置:支持百度、讯飞、阿里等多厂商语音服务
  • 离线唤醒:支持snowboy/porcupine双引擎及脑机交互唤醒
  • 后台管理:内置Web管理界面,支持远程配置与监控

wukong-robot架构

环境准备

硬件要求

设备类型 最低配置 推荐配置
树莓派 Pi 3B+ 1GB RAM Pi 4B 4GB RAM
云服务器 1核2GB 2核4GB
PC Intel i3 4GB RAM Intel i5 8GB RAM

系统要求

  • Python 3.7~3.9(不支持Python 2.x及3.10+)
  • 树莓派需安装Raspbian系统
  • 云服务器推荐Ubuntu 18.04+
  • PC支持Mac OS(Intel芯片)、Windows WSL或Linux

部署步骤

1. 源码获取

git clone https://gitcode.com/GitHub_Trending/wu/wukong-robot
cd wukong-robot

2. 依赖安装

# 基础依赖
sudo apt update && sudo apt install -y python3-pip portaudio19-dev sox ffmpeg
# Python依赖
pip3 install -r requirements.txt

3. 配置文件生成

首次运行时自动创建用户配置:

python3 wukong.py

根据提示输入y,配置文件将生成在~/.wukong/config.yml

平台部署指南

树莓派部署

硬件准备
  • 麦克风:推荐ReSpeaker 2-Mics Pi HAT
  • 扬声器:3.5mm接口音箱或HDMI音频
  • 可选配件:摄像头、LED指示灯
系统优化
# 启用音频接口
sudo raspi-config nonint do_audio 1
# 安装LED驱动
sudo apt install -y python3-rpi.gpio
唤醒配置

默认使用porcupine唤醒引擎:

# 修改~/.wukong/config.yml
detector: porcupine
porcupine:
    access_key: "你的Picovoice访问密钥"
    keywords: ["孙悟空"]

获取访问密钥:Picovoice控制台

云服务器部署

Docker快速部署
# 构建镜像
docker build -t wukong-robot -f docker/Dockerfile .
# 运行容器
docker run -d -p 5001:5001 --device /dev/snd wukong-robot
后台管理访问

部署完成后通过以下地址访问管理界面:

  • 默认地址:http://服务器IP:5001
  • 默认账户:wukong
  • 默认密码:wukong@2019

安全提示:首次登录后请立即修改密码,编辑~/.wukong/config.yml中的server.validate字段(使用python3 wukong.py md5 "新密码"生成加密串)

PC本地部署

Windows系统

需先安装WSL并启用音频:

# WSL内安装音频驱动
sudo apt install -y pulseaudio
# 启动WSL音频服务
pulseaudio --start
Mac系统
# 安装音频依赖
brew install portaudio ffmpeg sox
# 启动服务
python3 wukong.py

配置优化

语音服务配置

百度语音(默认)
baidu_yuyin:
    appid: "你的APPID"
    api_key: "你的API_KEY"
    secret_key: "你的SECRET_KEY"

申请地址:百度智能云

离线语音方案

对于无网络环境,可配置FunASR本地识别:

asr_engine: fun-asr
fun_asr:
    model_dir: "/path/to/exported/model"

模型导出方法见官方文档

技能插件安装

官方插件列表:

安装第三方插件:

# 插件目录
cd ~/.wukong/plugins
# 下载插件
git clone https://github.com/xxx/wukong-plugin-example

运行与维护

启动命令

# 前台运行
python3 wukong.py
# 后台运行(推荐)
nohup python3 wukong.py > wukong.log 2>&1 &

升级方法

# 自动升级
python3 wukong.py update
# 手动升级
git pull && pip3 install -r requirements.txt

日志查看

# 实时日志
tail -f ~/.wukong/logs/wukong.log
# 或通过Web后台:系统日志页面

常见问题解决

唤醒不灵敏

  1. 调整灵敏度:config.ymlsensitivity: 0.6(0.3~0.8范围)
  2. 更换唤醒词:使用snowboy-seasalt训练自定义模型
  3. 环境优化:减少背景噪音,使用定向麦克风

语音合成失败

  1. 检查API密钥有效性
  2. 配置网络代理(针对国外服务):
openai:
    proxy: "http://代理地址:端口"
  1. 切换语音引擎:
tts_engine: edge-tts  # 微软Edge TTS无需API密钥

高级应用

脑机交互(实验性功能)

muse:
    enable: true
    ip: "你的Muse Monitor OSC IP"
    port: 5001

通过同时眨眼和咬牙动作实现脑机唤醒。

智能家居控制

配置HomeAssistant联动:

# 在第三方插件配置区添加
homeassistant:
    host: "http://ha-server:8123"
    token: "你的长期访问令牌"

资源与社区

官方文档

社区支持

  • QQ频道:扫码加入(见项目README)
  • 问题反馈:提交Issue到代码仓库
  • 插件分享:wukong-contrib

通过本文指南,你已掌握wukong-robot在不同平台的部署方法。项目持续更新中,欢迎贡献代码或分享使用经验。现在就开始打造你的专属智能音箱吧!

【免费下载链接】wukong-robot 🤖 wukong-robot 是一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,支持ChatGPT多轮对话能力,还可能是首个支持脑机交互的开源智能音箱项目。 【免费下载链接】wukong-robot 项目地址: https://gitcode.com/GitHub_Trending/wu/wukong-robot

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐