百变怪之善口技者——mocking bird 完全指北

正经学习是不可能学习的啦,只能每日照搬大佬的github才能勉强度日啦

这次试试人声模拟是我对这个非常感兴趣(bushi 完全是因为这次有中文文档。。。

上地址   mockingbird

配环境

这次还算顺利

1.安装pytorch

上官网https://pytorch.org/get-started/locally/

百变怪之善口技者——mocking bird 完全指北_第1张图片

 第一行默认

第二行根据自己系统选

第三行windows选conda(之前别忘了装anaconda),mac选pip

第四行选python

第四行  我是核显只能选cpu了,有英伟达显卡的大佬根据自己情况选10.2

最后一行就告诉适合你的命令了,ctrl c+v到anaconda prompt中运行就好了

:如果在用 pip 方式安装的时候出现 ERROR: Could not find a version that satisfies the requirement torch==1.9.0+cu102 (from versions: 0.1.2, 0.1.2.post1, 0.1.2.post2) 这个错误可能是 python 版本过低,3.9 可以安装成功

2.安装ffmpeg

同样是官网Download FFmpeg 

百变怪之善口技者——mocking bird 完全指北_第2张图片

Windows选.dev

再拖到这里

百变怪之善口技者——mocking bird 完全指北_第3张图片

 单击.7z或.zip进行下载

完成后解压缩,将bin文件夹下的三个文件

百变怪之善口技者——mocking bird 完全指北_第4张图片

 移动至C:\Windows\System32

3.安装杂项

点击code下载源文件

百变怪之善口技者——mocking bird 完全指北_第5张图片

 打开anaconda prompt

使用cd +源文件路径移动到目录

运行pip install -r requirements.txt 来安装剩余的必要包。

安装 webrtcvad

 pip install webrtcvad-wheels

准备训练数据

这里我偷懒,直接用了2.2,如果是大佬请自行探索2.1

百变怪之善口技者——mocking bird 完全指北_第6张图片

选一个下载

完成后将文件移动至D:\..\MockingBird-main\synthesizer\saved_models

:saved_models是自己新建的文件夹

启动程序

网页版半天没搞懂,直接运行工具箱

python demo_toolbox.py -d D:\..\MockingBird-main\synthesizer\saved_models

百变怪之善口技者——mocking bird 完全指北_第7张图片

 使用

首先record开始录音,stop结束录音

下一行选择模型vocoder,因为我没独显跑不动,所以选择了质量较差的pre_trained

右上角输入你想让AI说的文本

最后点击右侧synthesize and vocode等几秒就可以输出啦

:有条件还是选择大一点的数据集,如果用自带的pre_trained模仿效果比较差哈

 

你可能感兴趣的:(语音模仿,ai,人工智能)