项目描述:
AI拟声: 在5秒内克隆语音以实时生成任意语音 Clone a voice in 5 seconds to generate arbitrary speech in real-time
参考文档:文档
环境安装:
1、mac osx,Python 3.9.7 (default, Sep 16 2021, 08:50:36)
[Clang 10.0.0 ] :: Anaconda, Inc. on darwin
2、安装PyTorch、ffmpeg、在项目环境安装所需包运行pip install -r requirements.txt
、安装webrtcvad:pip install webrtcvad-wheels
自己训练详见文档
下载别人训练好的:百度网盘(自己玩,本次探索使用)
命令python demo_toolbox.py
测试结果:不理想