MockingBird AI拟声「开源探索」

MockingBird AI模拟声音

项目描述:

AI拟声: 在5秒内克隆语音以实时生成任意语音 Clone a voice in 5 seconds to generate arbitrary speech in real-time

项目地址

1、探索开始

参考文档:文档

环境安装:

1、mac osx,Python 3.9.7 (default, Sep 16 2021, 08:50:36)
[Clang 10.0.0 ] :: Anaconda, Inc. on darwin
2、安装PyTorch、ffmpeg、在项目环境安装所需包运行pip install -r requirements.txt、安装webrtcvad:pip install webrtcvad-wheels

2、模型下载

自己训练详见文档

下载别人训练好的:百度网盘(自己玩,本次探索使用)

存放位置:
MockingBird AI拟声「开源探索」_第1张图片

3、启动工具箱

命令python demo_toolbox.py

或者:
MockingBird AI拟声「开源探索」_第2张图片
MockingBird AI拟声「开源探索」_第3张图片
MockingBird AI拟声「开源探索」_第4张图片

测试结果:不理想

你可能感兴趣的:(python,人工智能,pytorch,深度学习)