检查已安装依赖库版本

使用以下命令列出当前Python环境中已安装的库及其版本:

pip list

重点关注与音频处理相关的库,如librosasoundfiletorchaudio等。记录这些库的具体版本号,与WhisperLiveKit官方要求的版本进行比对。

验证CUDA与PyTorch兼容性

运行以下Python代码检查CUDA是否可用及PyTorch版本:

import torch
print(torch.__version__)
print(torch.cuda.is_available())

确保PyTorch版本与CUDA驱动版本匹配。参考PyTorch官方文档的版本对应表,必要时重新安装指定版本的PyTorch:

pip install torch==1.13.1+cu117 -f https://download.pytorch.org/whl/torch_stable.html

更新FFmpeg组件

音频解码依赖FFmpeg,通过以下命令安装或更新:

sudo apt update && sudo apt install ffmpeg

在Windows系统可通过官方二进制包安装,并确保ffmpeg命令加入系统PATH环境变量。

创建干净的虚拟环境

为避免现有环境污染,建议新建虚拟环境:

python -m venv whisper_env
source whisper_env/bin/activate  # Linux/Mac
whisper_env\Scripts\activate     # Windows

然后在纯净环境中重新安装所有依赖:

pip install -r requirements.txt

降级冲突库版本

当检测到版本冲突时,手动指定兼容版本安装:

pip install numpy==1.23.5 librosa==0.9.2

特别注意numballvmlite的版本对应关系,常见组合如:

pip install numba==0.56.4 llvmlite==0.39.1

检查模型文件完整性

验证下载的模型文件哈希值是否匹配官方发布值:

shasum large-v2.pt

对于在线下载的模型,可通过设置download_root参数指定缓存目录,避免重复下载损坏文件:

model = whisper.load_model("large-v2", download_root="/path/to/cache")

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐