E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
thchs30
基于深度学习的中文语音识别系统(毕设)
该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含transformer、CBHG,数据集包含stc、primewords、Aishell、
thchs30
程序员奇奇
·
2024-02-28 11:53
深度学习从入门到精通
语音识别
深度学习
人工智能
基于ASRT中文语音识别系统的优化
ASRT_SpeechRecognition该项目很不错,但是本人用原版项目代码进行训练测试无法达到较好的效果,然后对其做了一些改动,时间有限最终拼音ER在11%左右,词错误率WER在33%左右,数据集使用aishell,
thchs30
喜欢编程的网管
·
2023-04-21 02:52
语音识别
Kaldi -
thchs30
文章目录关于数据运行训练run.sh解读1、设置数据地址/下载数据2、数据准备thchs-30_data_prep.shword.txt词序列textphone.txt音素序列wav.scp语音语音ID--文件地址映射utt2spk语音--说话人映射spk2utt说话人--语音的映射3、生成mfcc特征4、数据准备prepare_lang.sh|format_lm.sh5、制作音素图prepare
伊织code
·
2023-01-31 07:42
语音
kaldi
thchs30
(十一)kaldi
thchs30
说话人自适应训练(SAT)、FMLLR以及quick训练(line 87-104)
概览首先放代码:#satsteps/train_sat.sh--cmd"$train_cmd"250015000data/mfcc/traindata/langexp/tri2b_aliexp/tri3b||exit1;#testtri3bmodellocal/thchs-30_decode.sh--nj$n"steps/decode_fmllr.sh"exp/tri3bdata/mfccsa
Felix and Phoenix
·
2023-01-12 14:39
kaldi
语音识别
人工智能
kaldi
thchs30
使用自己的数据和字典训练tdnn模型
一、生成语言模型1、需要准备lexicon.txt声学字典;words.txt语料:lexicon.txt字典删除所有的音素即是;phones.txt语料:lexicon.txt字典删除所有的单词即是;2、lm_word生成ngram-count-vocablexicon.txt-textwords.txt-order3-writemy.count-unkngram-count-readmy.co
wyw0000
·
2022-12-29 20:57
语音识别
kaldi
语音识别
Kaldi
thchs30
手札(八)DAE与TDNN(line 109-115)
欢迎大家关注我的博客http://pelhans.com/,所有文章都会第一时间发布在那里~本部分是对Kaldithchs30中run.sh的代码的line109-115行研究和知识总结,主要内容为带噪声的神经网络模型以及TDNN的训练。概览首先放代码:#traindaemodel#python2.6oraboveisrequiredfornoisydatageneration.#Tospeedu
Pelhans
·
2022-12-29 20:48
ASR
ASR
tf-7.中文语音识别 tensorflow
python3.5下编辑中有错误修正来自:http://blog.csdn.net/sinat_30665603/article/details/74897891数据集:http://data.cslt.org/
thchs30
qq_39239990
·
2022-12-15 01:49
语音识别
tensorflow
中
使用kaldi+清华大学开源语料数据集
thchs30
训练语音识别模型
2.下载
thchs30
数据集下载地址:http://www.openslr.org/18/
thchs30
是一个开源的30小时中文数据集。如上下载三个文件,时间较长。。。。
nlp_traindata
·
2022-12-02 16:15
kaldi
thchs30
语料
语音识别
训练模型
基于华为云ModelArts深度学习算法的语音识别实践【华为云至简致远】
【摘要】前言利用新型的人工智能(深度学习)算法,结合清华大学开源语音数据集
THCHS30
进行语音识别的实战演练,让使用者在了解语音识别基本的原理与实战的同时,更好的了解人工智能的相关内容与应用。
·
2022-08-11 21:58
后端运维程序员数据挖掘深度学习
基于华为云ModelArts深度学习算法的语音识别实践【华为云至简致远】
【摘要】前言利用新型的人工智能(深度学习)算法,结合清华大学开源语音数据集
THCHS30
进行语音识别的实战演练,让使用者在了解语音识别基本的原理与实战的同时,更好的了解人工智能的相关内容与应用。
·
2022-08-11 21:27
后端程序员
Open Transformer
源码链接:https://github.com/ZhengkunTian/OpenTransformer数据准备:选用
Thchs30
数据集,首先生成3个训练所需的数据集:(1)vocab.npy内容是汉字及其对应的编号
静一下1
·
2021-04-13 00:35
清华大学中文语音识别数据
THCHS30
本文对转载内容有更改,不代表原作者目录简介作者联系人数据文件data_thchs30datatrain,dev,testlm_wordlm_phonetest-noiseresourceresource/dict/lexicon.txtresource/dict/lexiconp.txtresource/dict/extra_questions.txtresource/dict/nonsilenc
Hai Liang Wang
·
2020-09-11 12:07
聊天机器人
语音识别
开放数据
错误01 run.pl: 4 / 4 failed, log is in exp/make_mfcc/train/make_mfcc_train.*.log
.log”在log文件中显示是“Permissiondenied”检查了一下个部分文件,s5文件下的mfcc文件夹有打开权限,所以将sudochmod-R777/home/chz/kaldi/egs/
thchs30
Chz9523
·
2020-08-26 15:23
提取mfcc
kaldi上运行
thchs30
中文语音库的错误总结
在运行完timit示例后,开始运行中文库
thchs30
。
HalFTeen
·
2020-08-25 04:33
ASR
Kaldi
thchs30
手札(六)说话人自适应训练(SAT)、FMLLR以及quick训练(line 87-104)
欢迎大家关注我的博客http://pelhans.com/,所有文章都会第一时间发布在那里~本部分是对Kaldithchs30中run.sh的代码的line87-104行研究和知识总结,内容涵盖说话人自适应训练(SpeakerAdaptiveTraining,SAT)以及特征空间最大似然线性回归(Feature-spaceMaximumLikelihoodLinearRegression,FMLL
Pelhans
·
2020-08-25 03:17
ASR
Kaldi
thchs30
手札(七) DNN-HMM模型的训练
欢迎大家关注我的博客http://pelhans.com/,所有文章都会第一时间发布在那里~本部分是对Kaldithchs30中run.sh的代码的line106-107行研究和知识总结,主要内容为Kaldi中nnet1的DNN-HMM模型训练。概览首先放代码:#traindnnmodellocal/nnet/run_dnn.sh--stage0--nj$nexp/tri4bexp/tri4b_a
Pelhans
·
2020-08-22 13:36
ASR
kaldi语音特征预处理-mfcc特征与标签对齐(一)
以
thchs30
语料进行试验,对mono模型的对齐特征进行提取
Xwei1226
·
2020-08-19 01:38
kaldi
语音识别——基于深度学习的中文语音识别tutorial(代码实践)
文章目录利用
thchs30
为例建立一个语音识别系统1.特征提取2.数据处理下载数据2.1生成音频文件和标签文件列表定义函数`source_get`,获取音频文件及标注文件列表确认相同id对应的音频文件和标签文件相同
东方佑
·
2020-08-19 00:58
日常
tf15: 中文语音识别
使用的数据集
THCHS30
是DongWang,XueweiZhang,ZhiyongZhang这几位大神发布的开放语音数据集,可用于开发中文语音识别系统。
MachineLP
·
2020-08-16 02:16
机器学习
Deep
learning
TensorFlow练习汇总
thchs30
跑的输出记录(Mac os)
[riemann@bogon:~/documents/riemann/kaldi/egs/
thchs30
/s5onmaster]%zsh-x./run.sh✹✭+./run.sh:3>..
RiemannLee
·
2020-07-06 22:09
thchs30
数据集
2THCHS-30的特点这部分我们介绍THCHS-30语音库。这个数据库是在2000-2001年记录的,第一个作者是Prof.XiaoyanZhu的一个研究生。这个语音库设计的目的是作为863数据库的补充,尽可能提高中文发音的涵盖率。这个新数据库叫TCMSD(清华大学连续普通话数据库),而且变得更加开放。。我们15年前发布了这个数据库,其所有权为Prof.Zhu。后来又更名为THCHS-30,代表
河妖鱼鱼
·
2020-07-06 12:32
语音识别技术材料
thchs30数据集说明
Kaldi系列--Ubuntu训练
thchs30
数据集及其在线识别汇总(四)
前面训练了TIMIT数据集和TIMIT在线识别,TIMIT是英语语音识别,现在训练中文数据集
thchs30
,并做在线识别。
FairmeLi
·
2020-07-04 21:03
Ubuntu
各领域数据集下载
使用的数据集
THCHS30
是DongWang,XueweiZhang,ZhiyongZhang这几位大神发布的开放语音数据集,可用于开发中文语音识别系统。
偏执的眸
·
2020-06-28 22:29
机器学习
数据分析
Linux
语音识别开源软件-- DeepSpeech(2)训练中文数据源
thchs30
语音识别开源软件--DeepSpeech(2)训练中文数据源thchs30Thchs30数据源是清华大学的30小时公用数据集下载地址:http://www.openslr.org/18/相关软件安装基本安装:首先是文档DeepSpeech(1)所提到的安装见上一篇https://mp.csdn.net/mdeditor/86554065#n-gram处理工具kenlm:$gitclonehttps
VickyG9
·
2020-06-28 19:51
DeepSpeech
Kaldi学习笔记(三)——运行
thchs30
(清华大学中文语料库)
Kaldi中文语音识别公共数据集一共有4个(据我所知),分别是:1.aishell:AISHELL公司开源178小时中文语音语料及基本训练脚本,见kaldi-master/egs/aishell2.gale_mandarin:中文新闻广播数据集(LDC2013S08,LDC2013S08)3.hkust:中文电话数据集(LDC2005S15,LDC2005T32)4.thchs30:清华大学30小
snowdroptulip
·
2020-06-26 13:55
Kaldi
语音识别
Mac os下运行Kaldi中文例子(
thchs30
,清华大学30小时语音)
资料:http://www.kaldi-asr.org/doc/Kaldi官方文档https://shiweipku.gitbooks.io/chinese-doc-of-kaldi/content/Kaldi中文手册,翻译自Kaldi官方文档kaldi的全部资料-v0.4.pdffromwbglearn(吴本谷)组织Kaldi语音识别Lecture1、2、3参考博客:http://www.jia
RiemannLee
·
2020-06-26 01:32
Deepspeech v2版本deepspeech.pytorch中文语音识别笔记
代码地址https://github.com/SeanNaren/deepspeech.pytorch中文语音数据库采用
thchs30
(1)首先提取data文件下的trn翻译文本,生成包含空格在内的生字表并保存为
hw200855
·
2020-06-23 16:07
人工智能
thchs30
在线识别解码器的应用
一开始识别的是音素,不是汉字,琢磨了好久,发现单因素mono模型训练的时候,不仅有音素对应的HCLG.fst解码图和word.txt(内容都是音素),而且还有word对应的graph_word文件夹下的HCLG.fst解码图和word.txt(内容是汉字和汉语单词),改成后者,果然可以识别成汉语。。。正在为结果有一丝丝欣喜的时候……回头看手册,人家本来就写的是graph_word而不是graph_
诸葛村姑
·
2020-06-23 12:07
Speech Recognition(语音识别)
数据集:清华大学
THCHS30
中文语音数据集data_thchs30.tgz:http://cn-mirror.openslr.org/re
chen_gong_ping
·
2020-06-22 21:33
语音识别
语音识别之语音数据预处理
Email:
[email protected]
原创内容,转载请标明数据集1.清华大学
THCHS30
中文语音数据集data_thchs30.tgzhttp://cn-mirror.openslr.org
Yogaht
·
2020-06-22 09:03
语音识别
kaldi 如何自制语料来做中文识别
由于需求只是做命令词识别,没有太高的要求,所以在跑
thchs30
的时候,没有跑dnn。
知行健康
·
2019-12-17 02:50
各领域公开数据集下载
原文链接:https://blog.csdn.net/c2a2o2/article/details/74942545使用的数据集
THCHS30
是DongWang,XueweiZhang,ZhiyongZhang
凌风探梅
·
2019-09-11 17:58
URL
语音识别——基于深度学习的中文语音识别tutorial(代码实践)
文章目录利用
thchs30
为例建立一个语音识别系统1.特征提取2.数据处理下载数据2.1生成音频文件和标签文件列表定义函数`source_get`,获取音频文件及标注文件列表确认相同id对应的音频文件和标签文件相同
Audior
·
2018-12-15 13:55
语音识别
kaldi中文语音识别
thchs30
模型训练
1.准备
thchs30
中文数据集今天开始做语言模型啦,数据集采用的是清华大学的中文数据集
thchs30
,下载地址在http://www.openslr.org/18/,由于是在服务器做训练,以下步骤均采用
Dreamy_Z
·
2018-10-09 15:03
语音识别
kaldi中文语音识别
thchs30
模型训练
1.准备
thchs30
中文数据集今天开始做语言模型啦,数据集采用的是清华大学的中文数据集
thchs30
,下载地址在http://www.openslr.org/18/,由于是在服务器做训练,以下步骤均采用
Dreamy_Z
·
2018-10-09 15:03
语音识别
kaldi中文语音识别平台的搭建——运行
thchs30
kaldi资料的准备:《Kaldi学习笔记(三)——运行
thchs30
(清华大学中文语料库)》运行kaldi中的自带样例:《Kaldi学习笔记(四)——
thchs30
中文在线识别》
thchs30
的主要搭建过程参照以上两篇博客
Alexwym
·
2018-09-25 15:19
大数据与机器学习
Kaldi运行
thchs30
中文语音识别教程
这篇文章写的比较详细,适合新手入门观看,特地摘录下来以供分享和之后学习说明测试环境:Ubuntu16.04建议:仔细地按照此教程来,有些人中间出错是因为没仔细按照教程的步骤和细节文档更新时间:20180713使用
thchs30
顺其灬自然丨
·
2018-09-09 19:28
Kaldi语音识别
kaldi中文语音识别_基于
thchs30
(8)
接上回,我们继续看run.sh#copyfeatsandcmvntotest.ph,avoidduplicatedmfcc&cmvn#拷贝mfcc特征和cmvn到test.ph,避免重复的mfcc和cmvncpdata/mfcc/test/feats.scpdata/mfcc/test_phone&&cpdata/mfcc/test/cmvn.scpdata/mfcc/test_phone||ex
52Babara
·
2018-09-07 13:32
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
kaldi中文语音识别_基于
thchs30
(7)
接上回,mfcc特征咱们暂时看完了,总结一下,此处引用别人的分析:特征提取MFCCcompute-mfcc-feats.ccCreateMFCCfeaturefiles.Usage:compute-mfcc-feats[options...]其中参数rspecifier用于读取.wav文件,wspecifier用于写入得到的MFCC特征。典型应用中,特征将被写入到一个大的”archive”文件,同
52Babara
·
2018-08-22 17:45
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
kaldi中文语音识别_基于
thchs30
(6)
接上回,其实上回我们在make_mfcc.sh中提取特性$cmdJOB=1:$nj$logdir/make_mfcc_${name}.JOB.log\compute-mfcc-feats$vtln_opts--verbose=2--config=$mfcc_config\scp,p:$logdir/wav_${name}.JOB.scpark:-\|\copy-feats$write_num_fr
52Babara
·
2018-08-20 10:14
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
kaldi在线识别
博客上搜到的都是清华大学的中文数据集
thchs30
,其实中文和英文的在线识别操作是一样的,我这里用英文librispeech数据集进行测试(kaldi官网上可以下载到数据集和训练好的模型)。
YoungLittleT
·
2018-07-08 17:25
在线语音识别
基于深度学习的语音识别研究-CTC理论推导(四)
首先,我们得知道为什么要引入CTC,前面博客讲到,之前在做语音的声学模型的时候,我们的数据形式是帧与标签的分别对齐,以
Thchs30
为例,训练集大约25小时的数据集,经过kaldi的GMM-HMM对齐之后
Xwei1226
·
2018-07-02 22:24
语音识别-深度学习
语音识别算法原理文档整理(八)
任务:在kaldi-trunk/egs/wsj/s5目录下拷贝出两个文件夹(注意拷贝所有内容):‘utils’和‘steps’,并把它们放在你的/home/hujianhua/kaldi/egs/
thchs30
风口上的传奇
·
2018-06-23 21:23
智能识别
语音识别算法原理文档整理(七)
首要任务:首先在kaldi/egs/目录下创建一个名为
thchs30
/s5的文件夹,这是你存放有关你工程的所有文件的地方。接下来,讲解一下
风口上的传奇
·
2018-06-23 20:00
智能识别
kaldi中文语音识别_基于
thchs30
(5)
接上回if[-f$data/segments];then#这里是查看data/mfcc/train下是否存在segments,如果存在则执行then后面的脚本,否则执行else后面的,这个文件不存在,所以之后调用else后面的处理echo"$0[info]:segmentsfileexists:usingthat."split_segments=""fornin$(seq$nj);dosplit_
52Babara
·
2018-05-23 17:37
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
kaldi中文语音识别_基于
thchs30
(4)
接上回,完成数据准备的工作后,shell显示说明已经创建这些文件完毕。我们看到生成的spk2utt的文件格式是这样的:我们看到它是先是一个说话者id号然后是这个说话者id下的所有名称,而word.txt和text是一样的。既然我们已经数据准备了,所以以后就不用再进行数据准备了,所以在下次运行run.sh时,先注释掉相关数据准备的shell脚本。#datapreparation#generatete
52Babara
·
2018-05-16 14:47
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
kaldi中文语音识别_基于
thchs30
(3)
接上回,我们继续看run.sh#youcanobtainthedatabasebyuncommtingthefollowinglines#[-d$thchs]||mkdir-p$thchs||exit1#echo"downloadingTHCHS30at$thchs..."#local/download_and_untar.sh$thchshttp://www.openslr.org/resour
52Babara
·
2018-05-14 17:57
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
TensorFlow练习15: 中文语音识别
使用的数据集
THCHS30
是DongWang,XueweiZhang,ZhiyongZhang这几位大神发布的开放语音数据集,可用于开发中文语音识
天涯海阁未走远
·
2018-05-10 21:55
语音合成技术
kaldi中文语音识别_基于
thchs30
(2)
接上回,我们需要修改cmd.sh.如下:exporttrain_cmd=run.pl#将原来的queue.pl改为run.plexportdecode_cmd="run.pl"#将原来的queue.pl改为run.pl这里的--mem4G还是去掉吧因为我机器装的虚拟机内存不是很大exportmkgraph_cmd="run.pl"#将原来的queue.pl改为run.pl这里的--mem8G还是去
52Babara
·
2018-05-10 11:09
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
kaldi中文语音识别_基于
thchs30
(1)
kaldi是语音识别的开源软件包,网址http://www.kaldi-asr.org/Kaldi'scodelivesathttps://github.com/kaldi-asr/kaldi.Tocheckout(i.e.cloneinthegitterminology)themostrecentchanges,youcanusethiscommandgitclonehttps://github
52Babara
·
2018-05-09 19:26
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
上一页
1
2
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他