基于深度学习的语音识别系统构建

 

加我微信hezkz17进数字音频系统研究开发交流答疑(课题组)

项目内容:

1.语音识别系统构建:负责基于kaldi的混合语音识别模型系统的构建,包括训练数据的搜集与处理,模型训练测试、rescore解码流程和上线部署等;

2.声纹识别系统构建:使用cnn+aam-softmax的模型结构提取说话人声纹特征(embedding),然后在声纹库内进行声纹相似度的检索匹配;

3.语种识别算法:使用类似声纹识别的方法,embedding层后加全连接层来实现语种分类;

4.音频指纹黑库构建:使用对比学习的方法来训练音频指纹特征提取模型,同时参与搭建音频指纹黑库,进行相同和相似音频的检出。

你可能感兴趣的:(音频算法设计研究开发,语音识别,人工智能,信号处理)