一段音频/视频分离成人声与伴奏,Windows + Anaconda 快速跑通 Spleeter(离线可用)
本文介绍如何在Windows10/11系统下使用Anaconda(Python3.8)和Spleeter工具实现音频分离。主要内容包括:1)创建Python3.8独立环境;2)安装必要的音频处理依赖;3)配置Spleeter及TensorFlow环境;4)下载并放置预训练模型;5)设置环境变量;6)执行音频分离操作。该方法无需GPU支持,可将音频分离为人声和伴奏两个音轨,支持mp3/wav/mp4
✅ 目标:把一段音频/视频分离成人声与伴奏
🧩 环境:Windows 10/11 + Anaconda(Python 3.8)
🚫 无 GPU 也能跑(cudart 提示可忽略)
https://github.com/Deezer/spleeter
准备一个测试音频:https://github.com/deezer/spleeter/raw/master/audio_example.mp3
放置到你想放置的文件夹位置: cmd cd到你放置文件的位置,例如:
cd /d “文件夹路径”
1) 🧪 创建独立环境
conda create -n spleeter38 python=3.8 -y
conda activate spleeter38
2) 🎵 安装音频依赖(必须)
conda install -c conda-forge ffmpeg libsndfile -y
3) 📦 安装 Spleeter(在线最省心)
pip install -i https://pypi.mirrors.ustc.edu.cn/simple spleeter==2.1.0
pip install -i https://pypi.mirrors.ustc.edu.cn/simple tensorflow==2.3.0 pandas==1.1.2 protobuf==3.20.3 tensorflow-estimator==2.3.0
💡 说明
-
TF 2.3.0 需
protobuf ≤ 3.20.x(否则会 “Descriptors cannot be created directly”) -
看到
cudart64_101.dll not found:无 GPU 可忽略
4) ⬇️ 下载官方模型并放到正确目录
解压两次后,放到之前建的“文件夹路径”(注意目录层级):
%APPDATA%\spleeter\models\pretrained_models\2stems\
目录内应直接包含 5 个文件:
checkpoint;model.data-00000-of-00001;model.index;model.meta;model.json
5) 📍 固定模型根目录(一次设置)
例如:
setx SPLEETER_MODEL_PATH "C:\Users\Lenovo\AppData\Roaming\spleeter\models\pretrained_models\2stems\"
关掉当前命令窗 → 重新打开 → conda activate spleeter38
快速自检:
python -c "import os;print('SPLEETER_MODEL_PATH=',os.getenv('SPLEETER_MODEL_PATH'));p=r'C:\Users\Lenovo\AppData\Roaming\spleeter\models\pretrained_models\2stems\checkpoint';print('checkpoint_exists=',os.path.exists(p))"
应看到 checkpoint_exists= True
6) ▶️ 开始分离(支持 mp3/wav/mp4)
运行分离:
spleeter separate -p spleeter:2stems -o output audio_example.mp3
输出:
output\audio_example\ ├─ vocals.wav (人声) └─ accompaniment.wav (伴奏)


看到这里你要不点个赞,那就是纯渣男渣女了🤜🤜🤜
欢迎点赞、收藏+转发,有问题随时评论区或私信交流, 感谢支持
To be better!!!
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)