正经学习是不可能学习的啦,只能每日照搬大佬的github才能勉强度日啦
这次试试人声模拟是我对这个非常感兴趣(bushi 完全是因为这次有中文文档。。。
上地址 mockingbird
这次还算顺利
上官网https://pytorch.org/get-started/locally/
第一行默认
第二行根据自己系统选
第三行windows选conda(之前别忘了装anaconda),mac选pip
第四行选python
第四行 我是核显只能选cpu了,有英伟达显卡的大佬根据自己情况选10.2
最后一行就告诉适合你的命令了,ctrl c+v到anaconda prompt中运行就好了
:如果在用 pip 方式安装的时候出现 ERROR: Could not find a version that satisfies the requirement torch==1.9.0+cu102 (from versions: 0.1.2, 0.1.2.post1, 0.1.2.post2)
这个错误可能是 python 版本过低,3.9 可以安装成功
同样是官网Download FFmpeg
Windows选.dev
再拖到这里
单击.7z或.zip进行下载
完成后解压缩,将bin文件夹下的三个文件
移动至C:\Windows\System32
点击code下载源文件
打开anaconda prompt
使用cd +源文件路径移动到目录
运行pip install -r requirements.txt
来安装剩余的必要包。
pip install webrtcvad-wheels
。
这里我偷懒,直接用了2.2,如果是大佬请自行探索2.1
选一个下载
完成后将文件移动至D:\..\MockingBird-main\synthesizer\saved_models
:saved_models是自己新建的文件夹
网页版半天没搞懂,直接运行工具箱
python demo_toolbox.py -d D:\..\MockingBird-main\synthesizer\saved_models
首先record开始录音,stop结束录音
下一行选择模型vocoder,因为我没独显跑不动,所以选择了质量较差的pre_trained
右上角输入你想让AI说的文本
最后点击右侧synthesize and vocode等几秒就可以输出啦
:有条件还是选择大一点的数据集,如果用自带的pre_trained模仿效果比较差哈