E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
kaldi
语音识别——
kaldi
解码及特征提取详解
文章目录1.注意事项2.流程图:3.具体流程指令:1.注意事项首先要训练好模型,用到3个文件,分别是:final.mdl(训练模型得到的模型文件)final.mat(用来特征转换)HCLG.fst(fst文件)此外要提供待解码音频文件或路径.scp文件:wav.scp(音频路径.scp文件)2.流程图:CreatedwithRaphaël2.2.0开始compute-mfcc-featscopy-
Audior
·
2018-07-27 18:15
语音识别
语音识别——
kaldi
常用文件查看指令
文章目录1.ark特征文件2.FST文件资料来自
kaldi
官方文档。转载注明出处。
Audior
·
2018-07-27 18:09
语音识别
kaldi
chain models 中文版
“链”模型“链”模型简介“链”模型是一种使用nnet3实现的DNN-HMM模型,它在很多方面都和传统的模型不同。你可以将它们看作声学模型空间中的不同设计点。····我们在神经网络的输出端使用了3倍的帧速率,这大大减少了测试时间所需的计算量,使实时解码变得更加容易。模型从一开始就用序列级目标函数-即正确序列的对数概率进行训练。它的本质是MMI通过在音素n-gram语言模型导出的解码图上做一个完全的向
Championvas
·
2018-07-27 16:42
kaldi
-yesno例子
"yesno"语料库是一个非常小打一个人的录音数据集,测试集在单声道阶段完全被识别WER(WordErrorRate)是字错误率,是一个衡量语音识别系统的准确程度的度量。其计算公式是WER=(I+D+S)/N,I代表被插入的单词个数D代表被删除的单词个数S代表被替换的单词个数通俗来讲是把识别出来的结果中,多认的,少认的,认错的全都加起来,除以总单词数。这个数字当然是越低越好。总共60个wav文件,
cg_speech
·
2018-07-25 15:50
语音识别
kaldi
训练模型过程中遭遇的最后一个问题
steps/make_mfcc_pitch.sh:line138:run.pl:commandnotfoundERROR(make-h-transducer[5.4]:GetHmmAsFst():hmm-utils.cc:39)Contextsizemismatch,ilabel-info[fromcontextFSTis3,context-dependencyobjectexpects1昨天在k
Championvas
·
2018-07-24 11:33
kaldi
训练模型的过程
整理一下训练新模型的过程:1.进入到
kaldi
-trunk/egs目录下创建XX(看你心情随便命名)文件夹,然后在文件夹里创建一个audio文件夹,在audio文件夹内在创建两个文件夹train和test
Championvas
·
2018-07-23 16:05
语音识别-
kaldi
下载与安装
Kaldi
是为语音识别开发者提供的非常强大的工具库,其名字来自一个传说中发现咖啡树的牧羊人,由C++编码,目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。
机器灵
·
2018-07-21 16:46
语音识别
Kaldi
学习手记(一):
Kaldi
的编译安装
下载安装gitsudoapt-getinstallgit下载
Kaldi
gitclonehttps://github.com/
kaldi
-asr/
kaldi
.git
kaldi
-trunk--origingolden
gmHappy
·
2018-07-19 15:13
机器学习
kaldi
中文资料最后一章在线解码器遇到的问题及解决方案
本文假设读者看了《在线解码器》的中文博客,并按照该博客里面的指令来进行操作练习。需要注意的有以下几个地方:1.为了为了使指令检查更简单,把所需要的文件都copy到同一个路径下比较方便,我是都copy到了digits路径下面。值得注意的是,有时候把final.mdl复制出来之后会上锁(仔细看final.mdl文件有一把小锁),这时候就会报文件读取错误(英文报错我忘记了,差不多就是这个意思)。解决方案
Championvas
·
2018-07-18 14:18
新手入门深度学习做语音识别?谷歌AIY也是开源
目前,出现了一些很优秀的开源语音识别系统,例如
Kaldi
,就能把神经系统作为其中的一个模块。但其的高度复杂性,并不适合解决简单问题的指南。
Gravitylink
·
2018-07-13 14:58
AIY
Projects
语音识别算法原理文档整理(十)
Kaldi
单音素脚本从脚本run.sh来看,单音素训练#monophonesteps/train_mono.sh–boost-silence1.25–nj$n–cmd“$train_cmd”data/mfcc
风口上的传奇
·
2018-07-13 10:40
智能识别
kaldi
在线识别
博客上搜到的都是清华大学的中文数据集thchs30,其实中文和英文的在线识别操作是一样的,我这里用英文librispeech数据集进行测试(
kaldi
官网上可以下载到数据集和训练好的模型)。
YoungLittleT
·
2018-07-08 17:25
在线语音识别
基于深度学习的语音识别研究-CTC理论推导(四)
首先,我们得知道为什么要引入CTC,前面博客讲到,之前在做语音的声学模型的时候,我们的数据形式是帧与标签的分别对齐,以Thchs30为例,训练集大约25小时的数据集,经过
kaldi
的GMM-HMM对齐之后
Xwei1226
·
2018-07-02 22:24
语音识别-深度学习
语音识别算法原理文档整理(九)
数据部分与数据集的录音相关,而―语言部分则与语言本身更相关的内容,例如发音字典、音素集合以及其他
Kaldi
需要的关于音素的额外信息。
风口上的传奇
·
2018-06-23 21:48
智能识别
语音识别算法原理文档整理(八)
2.1.工具附件你需要添加在例子脚本中广泛使用的
kaldi
工具箱。
风口上的传奇
·
2018-06-23 21:23
智能识别
语音识别算法原理文档整理(七)
如何使用
kaldi
系统
Kaldi
运行流程前提:你已经有了一定数量的包含不同说话人的的数字音频数据,每一个音频文件是一个完整的句子。我们以清华30小时为例。
风口上的传奇
·
2018-06-23 20:00
智能识别
语音识别算法原理文档整理(三)
语音识别系统
kaldi
相关原理介绍
Kaldi
是一个非常强大的语音识别工具库,主要由DanielPovey开发和维护。
风口上的传奇
·
2018-06-22 20:57
智能识别
部署在树莓派上Kalid离线语音识别框架
Kaldi
语音识别总结一、编译安装1、下载:建议使用
kaldi
-trunk版本,来进行语音识别,下载代码:gitclonehttps://github.com/
kaldi
-asr/
kaldi
.git
kaldi
-trunk
凯东
·
2018-06-21 22:41
资料备份
kaldi
说话人自适应
Kaldi
中主要采用的是特征空间变换方法:LDA、MLLT和fMLLR,其本质都是在训练过程中估计变换矩阵,然后构造变换后的特征,再迭代训练新的声学模型参数。LDA+MLLT针对环境特性,拼
落红灬有丶情
·
2018-06-13 17:36
kaldi
Kaldi
使用
下载和安装参考网站http://
kaldi
-asr.org/doc/install.htmlgitclonehttps://github.com/
kaldi
-asr/
kaldi
.git
kaldi
--originupstreamcd
kaldi
cdtoolsextras
Nicholas_Wong
·
2018-06-09 17:48
语音识别
Kaldi
学习(一)
最近准备开始进行语音识别算法的学习,所以决定拿
kaldi
进行解读,这样一方面更加增加自己C++的基本功,另一方面也可以让自己慢慢走入语音识别的大门,自己的路,决定了就走下去,不管有多难。
爱国者002
·
2018-06-09 17:30
语音识别
从零开始语音识别--基于
Kaldi
工具(一、ubuntu系统安装编译Kaidi)
下载安装
kaldi
:$gitclone--recursivehttps://github.com/
kaldi
-asr/
kaldi
可以在
kaldi
官方文档查看相关的文档。
莫名其妙的摩羯座
·
2018-06-07 20:12
kaldi
kaldi
快速入门(基于centos7)
1.
kaldi
安装包(https://github.com/
kaldi
-asr/
kaldi
/上可以下载到)2.语音模型包(http://www.
kaldi
-asr.org/models.html官网上可以下载到
只一刀
·
2018-05-24 15:02
linux
kaldi
中文语音识别_基于thchs30(5)
接上回if[-f$data/segments];then#这里是查看data/mfcc/train下是否存在segments,如果存在则执行then后面的脚本,否则执行else后面的,这个文件不存在,所以之后调用else后面的处理echo"$0[info]:segmentsfileexists:usingthat."split_segments=""fornin$(seq$nj);dosplit_
52Babara
·
2018-05-23 17:37
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
kaldi
中文语音识别_基于thchs30(4)
接上回,完成数据准备的工作后,shell显示说明已经创建这些文件完毕。我们看到生成的spk2utt的文件格式是这样的:我们看到它是先是一个说话者id号然后是这个说话者id下的所有名称,而word.txt和text是一样的。既然我们已经数据准备了,所以以后就不用再进行数据准备了,所以在下次运行run.sh时,先注释掉相关数据准备的shell脚本。#datapreparation#generatete
52Babara
·
2018-05-16 14:47
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
kaldi
中文语音识别_基于thchs30(3)
接上回,我们继续看run.sh#youcanobtainthedatabasebyuncommtingthefollowinglines#[-d$thchs]||mkdir-p$thchs||exit1#echo"downloadingTHCHS30at$thchs..."#local/download_and_untar.sh$thchshttp://www.openslr.org/resour
52Babara
·
2018-05-14 17:57
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
kaldi
中文语音识别_基于thchs30(2)
接上回,我们需要修改cmd.sh.如下:exporttrain_cmd=run.pl#将原来的queue.pl改为run.plexportdecode_cmd="run.pl"#将原来的queue.pl改为run.pl这里的--mem4G还是去掉吧因为我机器装的虚拟机内存不是很大exportmkgraph_cmd="run.pl"#将原来的queue.pl改为run.pl这里的--mem8G还是去
52Babara
·
2018-05-10 11:09
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
kaldi
中文语音识别_基于thchs30(1)
kaldi
是语音识别的开源软件包,网址http://www.
kaldi
-asr.org/
Kaldi
'scodelivesathttps://github.com/
kaldi
-asr/
kaldi
.Tocheckout
52Babara
·
2018-05-09 19:26
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
Kaldi
说话人识别之aishell V1 模型(一)
一、数据准备1、首先在根目录下建立路径:/export/a05/xna/data然后下载数据集。这里下载数据集要在run.sh前面加sudo命令,这是路径的缘故。下载数据集用到的脚本是local/download_and_untar.sh需要下载两个数据文件:data_aishell和resource_aishell.2、数据准备阶段运行脚本:local/aishell_data_prep.sh运
gwpjiayou
·
2018-05-09 17:45
Kaldi语音识别
Kaldi
中的并行化(转载)
简介使用
Kaldi
最理想的环境是配备集群任务分发工具,如SunGridEngine。如果同时使用多个服务器组成的集群,还需要能同时访问的共享文件系统,如NFS。
52Babara
·
2018-05-09 11:51
语音识别
音视频开发系统技术专题
关于
kaldi
中yesno脚本的详细分析,以及脚本的理解
本人经过一番寒彻骨,学习shell、linux、
kaldi
,终于将
kaldi
中最简单的样例理解,由于过于口语话,文中可能出现措辞不当,忘谅解。
Xwei1226
·
2018-04-27 15:00
kaldi
Kaldi
thchs30手札(三)单音素模型训练(line 62-68)
欢迎大家关注我的博客http://pelhans.com/,所有文章都会第一时间发布在那里~本部分是对
Kaldi
thchs30中run.sh的代码的line62-68行研究和知识总结,内容为单音素模型的训练与解码
Pelhans
·
2018-04-19 11:25
ASR
初探语音识别技术
语音识别主流开源框架:HTK、
Kaldi
、CMUSphinx。因为目前只接触了Sphinx,对于另外两个框架没有太深入研究。
ArrowYL
·
2018-04-17 19:43
C++
Kaldi
系列--Ubuntu中TIMIT在线识别(三)
在
kaldi
的工具集里有好几个程序可以用于在线识别。
FairmeLi
·
2018-04-16 16:09
Ubuntu
A Note on
Kaldi
's PLDA Implementation
Kaldi
’sPLDAimplementationisbasedon[1],theso-calledtwo-covariancePLDAby[2].TheauthorsderiveacleanupdateformulafortheEMtrainingandgiveadetailedcommentinthesourcecode.Hereweaddsomeexplanationstomakeformu
MoussaTintin
·
2018-04-05 16:05
原创
机器学习
概率统计
语音技术
kaldi
的yesno样例分析
这篇文章是根据yesno样例下的run.sh脚本写出来的,当然脚本里还有许多附带工具暂时就来不及一一详解,看以后有没有时间和兴趣了。1.train_cmd="utils/run.pl"decode_cmd="utils/run.pl"定义机器运作方式,这里是本地多任务处理工作方式,而不是gpu.2.if[!-dwaves_yesno];thenwgethttp://www.openslr.org/
zhuanse
·
2018-04-03 15:10
语音识别学习资料入门整理
语音信号处理/模式识别/统计分析,1.算法:常用的深度学习算法,包括cnn/dnn/rnn/lstm;GMM/SVM/CRF/MaxEnt/HMM;对CTC有经验;2.框架:熟悉至少一种深度学习框架,包括
kaldi
海德堡绝尘
·
2018-04-03 14:30
语音识别
AIm
入门整理
语音识别&AI
IOS Android 和 Unity上基于
kaldi
的离线语音识别系统
在一些教育医疗产业中,很多的词汇都非常专业,并不是一般的语音识别系统所能提供服务的,这时就需要我们自己构建一个离线的可以在手机或者平板上运行的语音识别系统,我选择的是
Kaldi
,因为
Kaldi
的识别能力要比上一代的
子龙法国
·
2018-03-08 22:33
kaldi
ios
android
unity
语音识别
Centos下
kaldi
的学习(二)
kaldi
的安装
上篇介绍了安装cuda,这篇来介绍一下
kaldi
的安装1、安装git工具yuminstall-ygit2、克隆
kaldi
源代码gitclonehttps://github.com/
kaldi
-asr/
kaldi
.git
kaldi
-trunk
Cwy_yeah
·
2018-02-18 13:40
Centos下
kaldi
的学习(一)cuda的安装
2、安装cuda:第一次其实我安装好了cuda、
kaldi
,但是在检测cudamatrix的时候没有检测到GPU,所以我傻傻地以为我需要再安装一个Nvidia的显卡驱动,然后就走上了一发不可收拾的路,一直重复安装
Cwy_yeah
·
2018-02-18 11:26
&1.
kaldi
学习之路 之
kaldi
的安装编译
自入学来自己一人在语音识别领域痛苦挣扎,看了很多篇论文,语音识别领域质量较高的文章大多数还是英文的比较靠谱,看了几个月的论文终于有点头绪了,找到了自己的创新点,开始打算用Tensorflow训练实验,后来经多方人士推荐语音这块还是用
Kaldi
luckygirl0809
·
2018-01-17 18:28
Kaldi
kaldi
生成自己数据的mfcc
/bin/bashindexForSave=wavforfilein/home/
kaldi
/examples/*doif[-d"$file"]thenecho"$fileisa
AllyLi0022
·
2017-12-27 16:54
语音
基于
kaldi
的在线语音识别
本文是基于
kaldi
的在线语音识别,使用b/s架构进行在线识别。适用于刚刚接触的小白。开发环境:jdk-1.8,Ubuntu16.04,Eclipse。
落红灬有丶情
·
2017-12-18 09:12
kaldi
在
kaldi
工具包使用小数字语料库创建一个简单的ASR系统(番外篇)
相信很多人已经看过
kaldi
英文官网上关于该系统的搭建流程。虽然官方已经写的很通俗易懂,但是第一次接触的话还是不可避免的会碰到许多坑。恰巧最近实践了一下,把整个实践过程写了下来。
lindadasummer
·
2017-12-12 14:42
kaldi例程
5.
kaldi
学习方法的问题
kaldi
的学习方法网址:https://www.zhihu.com/question/65516424集合了众知乎大神的学习方法,那种积累性的学习方法就算了,要用最有效的学习方法。
诸葛村姑
·
2017-12-11 07:15
Kaldi
中nnet3进行语音识别过程中用到的部分工具集锦!!!
前一篇文章我们对
Kaldi
ASR有了初步的了解,我们再来看看怎么使用
Kaldi
的神经网络模型NNET3来进行wav文件语音识别~~~~下载中文预训练模型:[houwenbin@localhost~]$cd
一代程序码农
·
2017-11-29 16:51
机器学习
人工智能
语音识别
Kaldi
Kaldi
中如何使用已经训练好的模型进行语音识别ASR呢?
很好,细心的你一定会发现
kaldi
源码src目录中有online*相关的模块,这就是我们今天的主角啦!!!
一代程序码农
·
2017-11-28 19:55
机器学习
编程经验
人工智能
人工神经网络
语音识别
Kaldi
./configure时,error: cannot find install-sh, install.sh, or shtool解决方法
在测试
kaldi
例子timit时,需要安装irstlm(extras/install_irstlm.sh)出现Makefile生成失败问题:.
一代程序码农
·
2017-11-27 15:54
autoconf
automake
irstlm
kaldi
机器学习
编程经验
嵌入式开发
人工智能
语音识别
kaldi
使用tri4b进行测试时的调参
测试完tri1的模型后,一定很想试试tri2或3.但当你操作时,会遇到如下的问题:ERROR(online-wav-gmm-decode-faster:LogLikelihoods():diag-gmm.cc:533)DiagGmm::ComponentLogLikelihood,dimensionmismatch39vs.40怎么解决?答案:1、于是修改run.sh成如下这个样子:ac_mode
AllyLi0022
·
2017-11-27 14:41
语音
Kaldi
DNN的特征提取和解码的连接操作
通过读脚本,我们知道了对应的特征提取和dnn的解码过程,得到一个lat(晶格文件),最后通过晶格文件进行分析,得到解码的结果,通过几次尝试,我这里通过wav文件得到了解码的文件,接下来将详细说明:首先是创建独立的文件夹,专门用来测试,里面保存5个文件,分别是:1.t2ss.wav(原始的wav文件)2.wav.scp(里面是保存了wav的绝对路径)3.final.mdl(训练模型得到的模型文件)4
张念
·
2017-11-16 11:55
语音识别
上一页
8
9
10
11
12
13
14
15
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他