ppg_decode_spec_5ms_sch是从ppg到spec的NN版本映射,期望他能修复FindA中找到的中ppgs不连贯问题,产出连贯的specs
主要基于实验室的服务器和开源代码+LJSpeech等
1.1.1 提取的代码项目
Git:https://github.com/ruclion/linears_decoder_5ms_sch_mel_linear/tree/master/LJSpeech
1.1.2 服务器
脚本路径:/datapool/home/hujk17/linears_decoder_5ms_sch_mel_linear/LJSpeech
1.1.3 处理得到的数据
路径:/datapool/home/hujk17/chenxueyuan/LJSpeech-1.1
其中meta_good.txt是提取特征成功的文件名字list,有些ppg的nparray文件,因为服务器变动损坏了,不过问题不大(反正之后要重新做10ms版本)
meta_small.txt是meta_good.txt的一小部分,便于测试;meta.txt是完整的13100句list;注意这两个有文本,meta_good没文本
基本上和LJSpeech差不多,是对称的;大多数区别是读list清单的代码区别
也老老实实列出来吧,以后找路径啥的好找
1.2.1 提取的代码项目
Git:https://github.com/ruclion/linears_decoder_5ms_sch_mel_linear/tree/master/DataBaker_Bilingual_CN
1.1.2 服务器
脚本路径:/datapool/home/hujk17/linears_decoder_5ms_sch_mel_linear/DataBaker_Bilingual_CN
1.1.3 处理得到的数据
路径:/datapool/home/hujk17/chenxueyuan/DataBaker_Bilingual_CN
其中meta_good.txt是提取特征成功的文件名字list,有些ppg的nparray文件,因为服务器变动损坏了,不过问题不大(反正之后要重新做10ms版本)
meta_small.txt是meta_good.txt的一小部分,便于测试;meta.txt是完整的10000句list;注意这两个是双行,meta_good只是最简单的一行一个文件名字
interval是类似于开源标贝数据集东西,可能对于衡量PPG有用,先留着吧
使用DCBHG,而不是DLSTM,原因是sch已经跑通了,效果也不错,代码也用的人家的,复现可预期性更高~
Git:https://github.com/ruclion/linears_decoder_5ms_sch_mel_linear
服务器路径:/datapool/home/hujk17/linears_decoder_5ms_sch_mel_linear
为了方便,单独复制出来三个独立项目,分别是:LJSpeech的,Baker的,Multi-speaker的
Git:https://github.com/ruclion/ppg_decode_spec_5ms_sch_LJSpeech
服务器路径:/datapool/home/hujk17/ppg_decode_spec_5ms_sch_LJSpeech
2.2.1. dataload_ljspeech
2.2.2. train_cbhg_ljspeech
改动了这个,具体弄不太清楚,不过都统一起来吧,'center': True;只要不报错,就没事
Variable(ppgs).float()不知道目的是什么。也不会查询pytorch Tensor的变量类型
2.2.3. models_torch
2.2.4. 运行环境
应该是用的是标准的pytorch环境,凑活着用fastspeech_p36吧
看tensorboard的时候用tensorflow_p36。。。
2.2.5. 训练过程
不知道为什么GPU占用率是0,先不管了,从1200的序列长度one step只有2s来看,是用了GPU的
2.2.6. 预测过程
这部分是由于代码太简化了,没有分成train和validation集
需要用validation部分来决定early stop
2.3.1. 增添validation函数完成所有
注意每隔600steps才测一次,因为测试一次1000句的就需要3分钟
2.3.2. 切分meta list
见图片
2.5. 中文都被killed
为什么?
Git网址:
服务器路径:
改改路径就好
2.5.1. dataload_DataBakerCN
替换即可
2.5.2. generate_trian_validation_list
替换即可
2.5.3. train_cbhg_DataBakerCN
替换即可