本安装过程基于 Ubuntu 20.04,主要是为了使用 PaddleSpeech 中的语音合成功能。
安装 Python >= 3.7
sudo add-apt-repository ppa:deadsnakes/ppa
sudo apt-get install python3.7 -y
python3 --version
安装 pip3
sudo apt update
sudo apt install python3-pip -y
pip3 --version
安装 PaddleSpeech
我选择的是中等安装难度,因为已经满足我的需要,参考
安装步骤如下:
Git clone PaddleSpeech
git clone https://github.com/PaddlePaddle/PaddleSpeech.git
cd PaddleSpeech
安装 Conda
Conda 是一个包管理的环境。你可以前往 minicoda 去下载并安装 conda(请下载 py>=3.7 的版本)。你可以尝试自己安装,或者使用以下的命令:
# 下载 miniconda
wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh -P tools/
# 安装 miniconda
bash tools/Miniconda3-latest-Linux-x86_64.sh -b
# conda 初始化
$HOME/miniconda3/bin/conda init
# 激活 conda
bash
然后你可以创建一个 conda 的虚拟环境:
conda create -y -p tools/venv python=3.7
激活 conda 虚拟环境:
conda activate tools/venv
安装 paddlespeech 的 conda 依赖:
conda install -y -c conda-forge sox libsndfile swig bzip2
安装 C++ 编译环境
(如果你系统上已经安装了 C++ 编译环境,请忽略这一步。) 你可以使用如下的步骤来安装 C++ 的编译环境 gcc 和 gxx:
sudo apt install build-essential
(提示: 如果你想使用困难方式完成安装,请不要使用最后一条命令)
安装 PaddlePaddle
飞桨版本:2.3(推荐,稳定版)
操作系统:Linux
安装方式:pip
计算平台:CPU # 因为我用的虚拟机,没有英伟达显卡,所以这里选择安装 CPU 版的飞桨,如果有,看官方安装文档中下面的开始安装说明,安装 GPU 版本的飞桨
# 上面安装的 python 对应的命令是 python3
python3 -m pip install paddlepaddle==2.3.0 -i https://mirror.baidu.com/pypi/simple
安装 PaddleSpeech
最后安装 paddlespeech,这样你就可以使用 paddlespeech中已有的 examples:
# 部分用户系统由于默认源的问题,安装中会出现kaldiio安转出错的问题,建议首先安装pytest-runner:
pip install pytest-runner -i https://pypi.tuna.tsinghua.edu.cn/simple
# 请确保目前处于PaddleSpeech项目的根目录
cd PaddleSpeech
# 下载依赖这一步会比较耗时,是整个安装过程中最耗时的部分,可能至少10分钟以上
pip install . -i https://pypi.tuna.tsinghua.edu.cn/simple
语音合成
安装完毕后,我们执行以下命令测试语音合成功能是否正常:
paddlespeech tts --input "你好,欢迎使用百度飞桨深度学习框架!" --output output.wav
输入以下指令获取更多帮助:
paddlespeech tts --help
错误解决
Descriptors cannot not be created directly. If this call came from a _pb2.py file, your generated code is out of date and must be regenerated with protoc >= 3.19.0
pip install protobuf==3.20.1
No space left on device
磁盘满了,需要扩容,具体参考
paddlespeech: command not found
因为是在 conda 的虚拟环境中执行 paddlespeech 的,所以在重启电脑后需要通过以下命令重新进入:
# 在 ~ 目录下执行
conda activate tools/venv
如果需要退出 conda 虚拟环境:
exit
ValueError: paddle.load
can not parse the file:/home/ubuntu/.paddlespeech/models/fastspeech2_csmsc-zh/1.0/fastspeech2_nosil_baker_ckpt_0.4/snapshot_iter_76000.pdz.
删除 /home/ubuntu/.paddlespeech/models/fastspeech2_csmsc-zh/1.0/ 目录下的所有文件