thchs30

基于深度学习的中文语音识别系统（毕设）

该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模，其中声学模型包括CNN-CTC、GRU-CTC、CNN-RNN-CTC，语言模型包含transformer、CBHG，数据集包含stc、primewords、Aishell、thchs30

程序员奇奇·2024-02-28 11:53

基于ASRT中文语音识别系统的优化

ASRT_SpeechRecognition该项目很不错，但是本人用原版项目代码进行训练测试无法达到较好的效果，然后对其做了一些改动，时间有限最终拼音ER在11%左右，词错误率WER在33%左右，数据集使用aishell，thchs30

喜欢编程的网管·2023-04-21 02:52

Kaldi - thchs30

文章目录关于数据运行训练run.sh解读1、设置数据地址/下载数据2、数据准备thchs-30_data_prep.shword.txt词序列textphone.txt音素序列wav.scp语音语音ID--文件地址映射utt2spk语音--说话人映射spk2utt说话人--语音的映射3、生成mfcc特征4、数据准备prepare_lang.sh|format_lm.sh5、制作音素图prepare

伊织code·2023-01-31 07:42

（十一）kaldi thchs30 说话人自适应训练（SAT)、FMLLR以及quick训练（line 87-104)

概览首先放代码：#satsteps/train_sat.sh--cmd"$train_cmd"250015000data/mfcc/traindata/langexp/tri2b_aliexp/tri3b||exit1;#testtri3bmodellocal/thchs-30_decode.sh--nj$n"steps/decode_fmllr.sh"exp/tri3bdata/mfcc&#sa

Felix and Phoenix·2023-01-12 14:39

kaldi thchs30使用自己的数据和字典训练tdnn模型

一、生成语言模型1、需要准备lexicon.txt声学字典；words.txt语料：lexicon.txt字典删除所有的音素即是；phones.txt语料：lexicon.txt字典删除所有的单词即是；2、lm_word生成ngram-count-vocablexicon.txt-textwords.txt-order3-writemy.count-unkngram-count-readmy.co

wyw0000·2022-12-29 20:57

Kaldi thchs30手札（八）DAE与TDNN（line 109-115)

欢迎大家关注我的博客http://pelhans.com/，所有文章都会第一时间发布在那里~本部分是对Kaldithchs30中run.sh的代码的line109-115行研究和知识总结，主要内容为带噪声的神经网络模型以及TDNN的训练。概览首先放代码：#traindaemodel#python2.6oraboveisrequiredfornoisydatageneration.#Tospeedu

Pelhans·2022-12-29 20:48

tf-7.中文语音识别 tensorflow

python3.5下编辑中有错误修正来自：http://blog.csdn.net/sinat_30665603/article/details/74897891数据集：http://data.cslt.org/thchs30

qq_39239990·2022-12-15 01:49

使用kaldi+清华大学开源语料数据集thchs30训练语音识别模型

2.下载thchs30数据集下载地址：http://www.openslr.org/18/thchs30是一个开源的30小时中文数据集。如上下载三个文件，时间较长。。。。

nlp_traindata·2022-12-02 16:15

基于华为云ModelArts深度学习算法的语音识别实践【华为云至简致远】

【摘要】前言利用新型的人工智能（深度学习）算法，结合清华大学开源语音数据集THCHS30进行语音识别的实战演练，让使用者在了解语音识别基本的原理与实战的同时，更好的了解人工智能的相关内容与应用。

·2022-08-11 21:58

基于华为云ModelArts深度学习算法的语音识别实践【华为云至简致远】

【摘要】前言利用新型的人工智能（深度学习）算法，结合清华大学开源语音数据集THCHS30进行语音识别的实战演练，让使用者在了解语音识别基本的原理与实战的同时，更好的了解人工智能的相关内容与应用。

·2022-08-11 21:27

Open Transformer

源码链接：https://github.com/ZhengkunTian/OpenTransformer数据准备：选用Thchs30数据集，首先生成3个训练所需的数据集：（1）vocab.npy内容是汉字及其对应的编号

静一下1·2021-04-13 00:35

清华大学中文语音识别数据 THCHS30

本文对转载内容有更改，不代表原作者目录简介作者联系人数据文件data_thchs30datatrain,dev,testlm_wordlm_phonetest-noiseresourceresource/dict/lexicon.txtresource/dict/lexiconp.txtresource/dict/extra_questions.txtresource/dict/nonsilenc

Hai Liang Wang·2020-09-11 12:07

错误01 run.pl: 4 / 4 failed, log is in exp/make_mfcc/train/make_mfcc_train.*.log

.log”在log文件中显示是“Permissiondenied”检查了一下个部分文件，s5文件下的mfcc文件夹有打开权限，所以将sudochmod-R777/home/chz/kaldi/egs/thchs30

Chz9523·2020-08-26 15:23

kaldi上运行thchs30中文语音库的错误总结

在运行完timit示例后，开始运行中文库thchs30。

HalFTeen·2020-08-25 04:33

Kaldi thchs30手札（六）说话人自适应训练（SAT)、FMLLR以及quick训练（line 87-104)

欢迎大家关注我的博客http://pelhans.com/，所有文章都会第一时间发布在那里~本部分是对Kaldithchs30中run.sh的代码的line87-104行研究和知识总结，内容涵盖说话人自适应训练(SpeakerAdaptiveTraining，SAT)以及特征空间最大似然线性回归(Feature-spaceMaximumLikelihoodLinearRegression,FMLL

Pelhans·2020-08-25 03:17

Kaldi thchs30手札（七） DNN-HMM模型的训练

欢迎大家关注我的博客http://pelhans.com/，所有文章都会第一时间发布在那里~本部分是对Kaldithchs30中run.sh的代码的line106-107行研究和知识总结，主要内容为Kaldi中nnet1的DNN-HMM模型训练。概览首先放代码：#traindnnmodellocal/nnet/run_dnn.sh--stage0--nj$nexp/tri4bexp/tri4b_a

Pelhans·2020-08-22 13:36

kaldi语音特征预处理-mfcc特征与标签对齐（一）

以thchs30语料进行试验，对mono模型的对齐特征进行提取

Xwei1226·2020-08-19 01:38

语音识别——基于深度学习的中文语音识别tutorial（代码实践）

文章目录利用thchs30为例建立一个语音识别系统1.特征提取2.数据处理下载数据2.1生成音频文件和标签文件列表定义函数`source_get`，获取音频文件及标注文件列表确认相同id对应的音频文件和标签文件相同

东方佑·2020-08-19 00:58

tf15: 中文语音识别

使用的数据集THCHS30是DongWang,XueweiZhang,ZhiyongZhang这几位大神发布的开放语音数据集，可用于开发中文语音识别系统。

MachineLP·2020-08-16 02:16

thchs30跑的输出记录（Mac os）

[riemann@bogon:~/documents/riemann/kaldi/egs/thchs30/s5onmaster]%zsh-x./run.sh✹✭+./run.sh:3>..

RiemannLee·2020-07-06 22:09

thchs30数据集

2THCHS-30的特点这部分我们介绍THCHS-30语音库。这个数据库是在2000-2001年记录的，第一个作者是Prof.XiaoyanZhu的一个研究生。这个语音库设计的目的是作为863数据库的补充，尽可能提高中文发音的涵盖率。这个新数据库叫TCMSD(清华大学连续普通话数据库），而且变得更加开放。。我们15年前发布了这个数据库，其所有权为Prof.Zhu。后来又更名为THCHS-30，代表

河妖鱼鱼·2020-07-06 12:32

Kaldi系列--Ubuntu训练thchs30数据集及其在线识别汇总（四）

前面训练了TIMIT数据集和TIMIT在线识别，TIMIT是英语语音识别，现在训练中文数据集thchs30，并做在线识别。

FairmeLi·2020-07-04 21:03

各领域数据集下载

使用的数据集THCHS30是DongWang,XueweiZhang,ZhiyongZhang这几位大神发布的开放语音数据集，可用于开发中文语音识别系统。

偏执的眸·2020-06-28 22:29

语音识别开源软件-- DeepSpeech（2）训练中文数据源thchs30

语音识别开源软件--DeepSpeech（2）训练中文数据源thchs30Thchs30数据源是清华大学的30小时公用数据集下载地址：http://www.openslr.org/18/相关软件安装基本安装：首先是文档DeepSpeech(1)所提到的安装见上一篇https://mp.csdn.net/mdeditor/86554065#n-gram处理工具kenlm：$gitclonehttps

VickyG9·2020-06-28 19:51

Kaldi学习笔记（三）——运行thchs30（清华大学中文语料库）

Kaldi中文语音识别公共数据集一共有4个（据我所知），分别是：1.aishell:AISHELL公司开源178小时中文语音语料及基本训练脚本，见kaldi-master/egs/aishell2.gale_mandarin:中文新闻广播数据集(LDC2013S08,LDC2013S08）3.hkust:中文电话数据集(LDC2005S15,LDC2005T32)4.thchs30:清华大学30小

snowdroptulip·2020-06-26 13:55

Mac os下运行Kaldi中文例子(thchs30，清华大学30小时语音)

资料：http://www.kaldi-asr.org/doc/Kaldi官方文档https://shiweipku.gitbooks.io/chinese-doc-of-kaldi/content/Kaldi中文手册，翻译自Kaldi官方文档kaldi的全部资料-v0.4.pdffromwbglearn（吴本谷）组织Kaldi语音识别Lecture1、2、3参考博客：http://www.jia

RiemannLee·2020-06-26 01:32

Deepspeech v2版本deepspeech.pytorch中文语音识别笔记

代码地址https://github.com/SeanNaren/deepspeech.pytorch中文语音数据库采用thchs30（1）首先提取data文件下的trn翻译文本，生成包含空格在内的生字表并保存为

hw200855·2020-06-23 16:07

thchs30在线识别解码器的应用

一开始识别的是音素，不是汉字，琢磨了好久，发现单因素mono模型训练的时候，不仅有音素对应的HCLG.fst解码图和word.txt（内容都是音素），而且还有word对应的graph_word文件夹下的HCLG.fst解码图和word.txt（内容是汉字和汉语单词），改成后者，果然可以识别成汉语。。。正在为结果有一丝丝欣喜的时候……回头看手册，人家本来就写的是graph_word而不是graph_

诸葛村姑·2020-06-23 12:07

Speech Recognition（语音识别）

数据集：清华大学THCHS30中文语音数据集data_thchs30.tgz：http://cn-mirror.openslr.org/re

chen_gong_ping·2020-06-22 21:33

语音识别之语音数据预处理

Email：[email protected]原创内容，转载请标明数据集1.清华大学THCHS30中文语音数据集data_thchs30.tgzhttp://cn-mirror.openslr.org

Yogaht·2020-06-22 09:03

kaldi 如何自制语料来做中文识别

由于需求只是做命令词识别，没有太高的要求，所以在跑thchs30的时候，没有跑dnn。

知行健康·2019-12-17 02:50

各领域公开数据集下载

原文链接：https://blog.csdn.net/c2a2o2/article/details/74942545使用的数据集THCHS30是DongWang,XueweiZhang,ZhiyongZhang

凌风探梅·2019-09-11 17:58

语音识别——基于深度学习的中文语音识别tutorial（代码实践）

文章目录利用thchs30为例建立一个语音识别系统1.特征提取2.数据处理下载数据2.1生成音频文件和标签文件列表定义函数`source_get`，获取音频文件及标注文件列表确认相同id对应的音频文件和标签文件相同

Audior·2018-12-15 13:55

kaldi中文语音识别thchs30模型训练

1.准备thchs30中文数据集今天开始做语言模型啦，数据集采用的是清华大学的中文数据集thchs30，下载地址在http://www.openslr.org/18/，由于是在服务器做训练，以下步骤均采用

Dreamy_Z·2018-10-09 15:03

kaldi中文语音识别thchs30模型训练

1.准备thchs30中文数据集今天开始做语言模型啦，数据集采用的是清华大学的中文数据集thchs30，下载地址在http://www.openslr.org/18/，由于是在服务器做训练，以下步骤均采用

Dreamy_Z·2018-10-09 15:03

kaldi中文语音识别平台的搭建——运行thchs30

kaldi资料的准备：《Kaldi学习笔记（三）——运行thchs30（清华大学中文语料库）》运行kaldi中的自带样例：《Kaldi学习笔记（四）——thchs30中文在线识别》thchs30的主要搭建过程参照以上两篇博客

Alexwym·2018-09-25 15:19

Kaldi运行thchs30中文语音识别教程

这篇文章写的比较详细，适合新手入门观看，特地摘录下来以供分享和之后学习说明测试环境：Ubuntu16.04建议：仔细地按照此教程来，有些人中间出错是因为没仔细按照教程的步骤和细节文档更新时间：20180713使用thchs30

顺其灬自然丨·2018-09-09 19:28

kaldi中文语音识别_基于thchs30(8)

接上回，我们继续看run.sh#copyfeatsandcmvntotest.ph,avoidduplicatedmfcc&cmvn#拷贝mfcc特征和cmvn到test.ph，避免重复的mfcc和cmvncpdata/mfcc/test/feats.scpdata/mfcc/test_phone&&cpdata/mfcc/test/cmvn.scpdata/mfcc/test_phone||ex

52Babara·2018-09-07 13:32

kaldi中文语音识别_基于thchs30(7)

接上回，mfcc特征咱们暂时看完了，总结一下，此处引用别人的分析：特征提取MFCCcompute-mfcc-feats.ccCreateMFCCfeaturefiles.Usage:compute-mfcc-feats[options...]其中参数rspecifier用于读取.wav文件，wspecifier用于写入得到的MFCC特征。典型应用中，特征将被写入到一个大的”archive”文件，同

52Babara·2018-08-22 17:45

kaldi中文语音识别_基于thchs30(6)

接上回，其实上回我们在make_mfcc.sh中提取特性$cmdJOB=1:$nj$logdir/make_mfcc_${name}.JOB.log\compute-mfcc-feats$vtln_opts--verbose=2--config=$mfcc_config\scp,p:$logdir/wav_${name}.JOB.scpark:-\|\copy-feats$write_num_fr

52Babara·2018-08-20 10:14

kaldi在线识别

博客上搜到的都是清华大学的中文数据集thchs30，其实中文和英文的在线识别操作是一样的，我这里用英文librispeech数据集进行测试（kaldi官网上可以下载到数据集和训练好的模型）。

YoungLittleT·2018-07-08 17:25

基于深度学习的语音识别研究-CTC理论推导（四）

首先，我们得知道为什么要引入CTC，前面博客讲到，之前在做语音的声学模型的时候，我们的数据形式是帧与标签的分别对齐，以Thchs30为例，训练集大约25小时的数据集，经过kaldi的GMM-HMM对齐之后

Xwei1226·2018-07-02 22:24

语音识别算法原理文档整理（八）

任务：在kaldi-trunk/egs/wsj/s5目录下拷贝出两个文件夹（注意拷贝所有内容）：‘utils’和‘steps’，并把它们放在你的/home/hujianhua/kaldi/egs/thchs30

风口上的传奇·2018-06-23 21:23

语音识别算法原理文档整理（七）

首要任务：首先在kaldi/egs/目录下创建一个名为thchs30/s5的文件夹，这是你存放有关你工程的所有文件的地方。接下来，讲解一下

风口上的传奇·2018-06-23 20:00

kaldi中文语音识别_基于thchs30(5)

接上回if[-f$data/segments];then#这里是查看data/mfcc/train下是否存在segments，如果存在则执行then后面的脚本，否则执行else后面的，这个文件不存在，所以之后调用else后面的处理echo"$0[info]:segmentsfileexists:usingthat."split_segments=""fornin$(seq$nj);dosplit_

52Babara·2018-05-23 17:37

kaldi中文语音识别_基于thchs30(4)

接上回，完成数据准备的工作后，shell显示说明已经创建这些文件完毕。我们看到生成的spk2utt的文件格式是这样的：我们看到它是先是一个说话者id号然后是这个说话者id下的所有名称，而word.txt和text是一样的。既然我们已经数据准备了,所以以后就不用再进行数据准备了，所以在下次运行run.sh时,先注释掉相关数据准备的shell脚本。#datapreparation#generatete

52Babara·2018-05-16 14:47

kaldi中文语音识别_基于thchs30(3)

接上回，我们继续看run.sh#youcanobtainthedatabasebyuncommtingthefollowinglines#[-d$thchs]||mkdir-p$thchs||exit1#echo"downloadingTHCHS30at$thchs..."#local/download_and_untar.sh$thchshttp://www.openslr.org/resour

52Babara·2018-05-14 17:57

TensorFlow练习15: 中文语音识别

使用的数据集THCHS30是DongWang,XueweiZhang,ZhiyongZhang这几位大神发布的开放语音数据集，可用于开发中文语音识

天涯海阁未走远·2018-05-10 21:55

kaldi中文语音识别_基于thchs30(2)

接上回，我们需要修改cmd.sh.如下：exporttrain_cmd=run.pl#将原来的queue.pl改为run.plexportdecode_cmd="run.pl"#将原来的queue.pl改为run.pl这里的--mem4G还是去掉吧因为我机器装的虚拟机内存不是很大exportmkgraph_cmd="run.pl"#将原来的queue.pl改为run.pl这里的--mem8G还是去

52Babara·2018-05-10 11:09

kaldi中文语音识别_基于thchs30(1)

kaldi是语音识别的开源软件包，网址http://www.kaldi-asr.org/Kaldi'scodelivesathttps://github.com/kaldi-asr/kaldi.Tocheckout(i.e.cloneinthegitterminology)themostrecentchanges,youcanusethiscommandgitclonehttps://github

52Babara·2018-05-09 19:26

推荐频道

thchs30

基于深度学习的中文语音识别系统（毕设）

基于ASRT中文语音识别系统的优化

Kaldi - thchs30

（十一）kaldi thchs30 说话人自适应训练（SAT)、FMLLR以及quick训练（line 87-104)

kaldi thchs30使用自己的数据和字典训练tdnn模型

Kaldi thchs30手札（八）DAE与TDNN（line 109-115)

tf-7.中文语音识别 tensorflow

使用kaldi+清华大学开源语料数据集thchs30训练语音识别模型

基于华为云ModelArts深度学习算法的语音识别实践【华为云至简致远】

基于华为云ModelArts深度学习算法的语音识别实践【华为云至简致远】

Open Transformer

清华大学中文语音识别数据 THCHS30

错误01 run.pl: 4 / 4 failed, log is in exp/make_mfcc/train/make_mfcc_train.*.log

kaldi上运行thchs30中文语音库的错误总结

Kaldi thchs30手札（六）说话人自适应训练（SAT)、FMLLR以及quick训练（line 87-104)

Kaldi thchs30手札（七） DNN-HMM模型的训练

kaldi语音特征预处理-mfcc特征与标签对齐（一）

语音识别——基于深度学习的中文语音识别tutorial（代码实践）

tf15: 中文语音识别

thchs30跑的输出记录（Mac os）

thchs30数据集

Kaldi系列--Ubuntu训练thchs30数据集及其在线识别汇总（四）

各领域数据集下载

语音识别开源软件-- DeepSpeech（2）训练中文数据源thchs30

Kaldi学习笔记（三）——运行thchs30（清华大学中文语料库）

Mac os下运行Kaldi中文例子(thchs30，清华大学30小时语音)

Deepspeech v2版本deepspeech.pytorch中文语音识别笔记

thchs30在线识别解码器的应用

Speech Recognition（语音识别）

语音识别之语音数据预处理

kaldi 如何自制语料来做中文识别

各领域公开数据集下载

语音识别——基于深度学习的中文语音识别tutorial（代码实践）

kaldi中文语音识别thchs30模型训练

kaldi中文语音识别thchs30模型训练

kaldi中文语音识别平台的搭建——运行thchs30

Kaldi运行thchs30中文语音识别教程

kaldi中文语音识别_基于thchs30(8)

kaldi中文语音识别_基于thchs30(7)

kaldi中文语音识别_基于thchs30(6)

kaldi在线识别

基于深度学习的语音识别研究-CTC理论推导（四）

语音识别算法原理文档整理（八）

语音识别算法原理文档整理（七）

kaldi中文语音识别_基于thchs30(5)

kaldi中文语音识别_基于thchs30(4)

kaldi中文语音识别_基于thchs30(3)

TensorFlow练习15: 中文语音识别

kaldi中文语音识别_基于thchs30(2)

kaldi中文语音识别_基于thchs30(1)