Tensorflow-wavenet生成模拟声音

1.wavenet
wave介绍:https://deepmind.com/blog/wave … udio/
先用一个短视频介绍一下wavenet效果
http://v.qq.com/x/page/w0328zc2azc.html

2.下载tensorflow-wavenet
读者自己先配置好tensorflow
git clone –recursive https://github.com/ibab/tensorflow-wavenet

3.代码目录
wavenet_params.json 这是配置模型的一些相关参数

4.安装依赖包
pip install -r requirements.txt

5.下载语料库
语料库有10个g,解压后有12个g左右,请预备好足够的空间,机器不太行的可以忽略此步
http://homepages.inf.ed.ac.uk/ … ar.gz
http://homepages.inf.ed.ac.uk/ … .html #语料库的介绍

5.准备语料
笔者这里先用一段小的钢琴语料做训练,piano_sample.wav
cd tensorflow-wavenet
mkdir corpus #corpus #用于存放多个训练的.wav文件

6.开始训练
python train.py –help #–batch_size,–num_steps,–learning_rate等等参数
python train.py –data_dir=corpus

7.模型
训练过程中在logdir有train文件,train文件里有会生成训练model

8.生成模拟声音
python generate.py –wav_out_path=generated.wav –samples 160000 ./logdir/train/xxx/model.ckpt-xxx #–samples 16000 16000相当于1秒

9.笔者训练的效果放在附件
piano_sample.wav #样本
generated.wav #生成模拟声音

你可能感兴趣的:(Deep,learning,Speech,Recognition)