Speaker Encoder复现: Transfer Learning from Speaker Verification to Multispeaker TTS

笑着哭i 提交于 2020-11-19 23:51:43

0. 说明

跑通他: https://github.com/CorentinJ/Real-Time-Voice-Cloning

中文版1: https://github.com/KuangDD/zhrtvc

  1. git clone https://github.com/CorentinJ/Real-Time-Voice-Cloning.git
  2. cd Real-Time-Voice-Cloning/

1. 环境

 

环境名字为: voiceclone_p36

  1. conda create -n voiceclone_p36 python=3.6.5
  2. conda activate voiceclone_p36
  3. conda install pytorch torchvision torchaudio cpuonly -c pytorch
  4. conda install -c conda-forge librosa # 这一点是特别的 (把ffmpeg也顺便装好了)
  5. 将requirement.txt中的librosa那条删除
  6. conda install tensorflow-gpu==1.14
  7. 将requirement.txt中的tensorflow==1.15那条删除
  8. sudo pacman -S python-pyqt5
  9. 将requirement.txt中的PyQt5那条删除
  10. 再删除一些已经装好的, 剩下的为7行
  11. pip install -r requirements.txt

注:

服务器网络太慢, 离线安装pytorch

缺什么先下好什么, 单独按照顺序人工pip install就可以

  1. pip install numpy-1.19.4-cp36-cp36m-manylinux1_x86_64.whl
  2. pip install torch-1.6.0-cp36-cp36m-manylinux1_x86_64.whl

2. Download Pretrained Models

https://github.com/CorentinJ/Real-Time-Voice-Cloning/wiki/Pretrained-models

  1. 开vpn下载
  2. 按照路径放进去, 都很熟悉

3. Test Configuration

  1. cd /datapool/home/hujk17/Real-Time-Voice-Cloning
  2. conda activate voiceclone_p36
  3. python demo_cli.py


     

 

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!