kaldi 第12页

语音识别——kaldi解码及特征提取详解

文章目录1.注意事项2.流程图：3.具体流程指令：1.注意事项首先要训练好模型，用到3个文件，分别是：final.mdl(训练模型得到的模型文件)final.mat（用来特征转换）HCLG.fst（fst文件）此外要提供待解码音频文件或路径.scp文件：wav.scp(音频路径.scp文件)2.流程图：CreatedwithRaphaël2.2.0开始compute-mfcc-featscopy-

Audior·2018-07-27 18:15

语音识别——kaldi常用文件查看指令

文章目录1.ark特征文件2.FST文件资料来自kaldi官方文档。转载注明出处。

Audior·2018-07-27 18:09

kaldi chain models 中文版

“链”模型“链”模型简介“链”模型是一种使用nnet3实现的DNN-HMM模型，它在很多方面都和传统的模型不同。你可以将它们看作声学模型空间中的不同设计点。····我们在神经网络的输出端使用了3倍的帧速率，这大大减少了测试时间所需的计算量，使实时解码变得更加容易。模型从一开始就用序列级目标函数-即正确序列的对数概率进行训练。它的本质是MMI通过在音素n-gram语言模型导出的解码图上做一个完全的向

Championvas·2018-07-27 16:42

kaldi-yesno例子

"yesno"语料库是一个非常小打一个人的录音数据集，测试集在单声道阶段完全被识别WER（WordErrorRate）是字错误率，是一个衡量语音识别系统的准确程度的度量。其计算公式是WER=(I+D+S)/N，I代表被插入的单词个数D代表被删除的单词个数S代表被替换的单词个数通俗来讲是把识别出来的结果中，多认的，少认的，认错的全都加起来，除以总单词数。这个数字当然是越低越好。总共60个wav文件,

cg_speech·2018-07-25 15:50

kaldi训练模型过程中遭遇的最后一个问题

steps/make_mfcc_pitch.sh:line138:run.pl:commandnotfoundERROR(make-h-transducer[5.4]:GetHmmAsFst():hmm-utils.cc:39)Contextsizemismatch,ilabel-info[fromcontextFSTis3,context-dependencyobjectexpects1昨天在k

Championvas·2018-07-24 11:33

kaldi训练模型的过程

整理一下训练新模型的过程：1.进入到kaldi-trunk/egs目录下创建XX（看你心情随便命名）文件夹，然后在文件夹里创建一个audio文件夹，在audio文件夹内在创建两个文件夹train和test

Championvas·2018-07-23 16:05

语音识别-kaldi下载与安装

Kaldi是为语音识别开发者提供的非常强大的工具库，其名字来自一个传说中发现咖啡树的牧羊人，由C++编码，目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。

机器灵·2018-07-21 16:46

Kaldi学习手记（一）：Kaldi的编译安装

下载安装gitsudoapt-getinstallgit下载Kaldigitclonehttps://github.com/kaldi-asr/kaldi.gitkaldi-trunk--origingolden

gmHappy·2018-07-19 15:13

kaldi中文资料最后一章在线解码器遇到的问题及解决方案

本文假设读者看了《在线解码器》的中文博客，并按照该博客里面的指令来进行操作练习。需要注意的有以下几个地方：1.为了为了使指令检查更简单，把所需要的文件都copy到同一个路径下比较方便，我是都copy到了digits路径下面。值得注意的是，有时候把final.mdl复制出来之后会上锁（仔细看final.mdl文件有一把小锁），这时候就会报文件读取错误（英文报错我忘记了，差不多就是这个意思）。解决方案

Championvas·2018-07-18 14:18

新手入门深度学习做语音识别？谷歌AIY也是开源

目前，出现了一些很优秀的开源语音识别系统，例如Kaldi，就能把神经系统作为其中的一个模块。但其的高度复杂性，并不适合解决简单问题的指南。

Gravitylink·2018-07-13 14:58

语音识别算法原理文档整理（十）

Kaldi单音素脚本从脚本run.sh来看，单音素训练#monophonesteps/train_mono.sh–boost-silence1.25–nj$n–cmd“$train_cmd”data/mfcc

风口上的传奇·2018-07-13 10:40

kaldi在线识别

博客上搜到的都是清华大学的中文数据集thchs30，其实中文和英文的在线识别操作是一样的，我这里用英文librispeech数据集进行测试（kaldi官网上可以下载到数据集和训练好的模型）。

YoungLittleT·2018-07-08 17:25

基于深度学习的语音识别研究-CTC理论推导（四）

首先，我们得知道为什么要引入CTC，前面博客讲到，之前在做语音的声学模型的时候，我们的数据形式是帧与标签的分别对齐，以Thchs30为例，训练集大约25小时的数据集，经过kaldi的GMM-HMM对齐之后

Xwei1226·2018-07-02 22:24

语音识别算法原理文档整理（九）

风口上的传奇·2018-06-23 21:48

语音识别算法原理文档整理（八）

2.1.工具附件你需要添加在例子脚本中广泛使用的kaldi工具箱。

风口上的传奇·2018-06-23 21:23

语音识别算法原理文档整理（七）

如何使用kaldi系统Kaldi运行流程前提：你已经有了一定数量的包含不同说话人的的数字音频数据，每一个音频文件是一个完整的句子。我们以清华30小时为例。

风口上的传奇·2018-06-23 20:00

语音识别算法原理文档整理（三）

风口上的传奇·2018-06-22 20:57

部署在树莓派上Kalid离线语音识别框架

Kaldi语音识别总结一、编译安装1、下载：建议使用kaldi-trunk版本，来进行语音识别，下载代码：gitclonehttps://github.com/kaldi-asr/kaldi.gitkaldi-trunk

凯东·2018-06-21 22:41

kaldi 说话人自适应

Kaldi中主要采用的是特征空间变换方法：LDA、MLLT和fMLLR，其本质都是在训练过程中估计变换矩阵，然后构造变换后的特征，再迭代训练新的声学模型参数。LDA+MLLT针对环境特性，拼

落红灬有丶情·2018-06-13 17:36

Kaldi使用

下载和安装参考网站http://kaldi-asr.org/doc/install.htmlgitclonehttps://github.com/kaldi-asr/kaldi.gitkaldi--originupstreamcdkaldicdtoolsextras

Nicholas_Wong·2018-06-09 17:48

Kaldi学习（一）

最近准备开始进行语音识别算法的学习，所以决定拿kaldi进行解读，这样一方面更加增加自己C++的基本功，另一方面也可以让自己慢慢走入语音识别的大门，自己的路，决定了就走下去，不管有多难。

爱国者002·2018-06-09 17:30

从零开始语音识别--基于Kaldi工具（一、ubuntu系统安装编译Kaidi）

下载安装kaldi：$gitclone--recursivehttps://github.com/kaldi-asr/kaldi可以在kaldi官方文档查看相关的文档。

莫名其妙的摩羯座·2018-06-07 20:12

kaldi快速入门（基于centos7）

1.kaldi安装包(https://github.com/kaldi-asr/kaldi/上可以下载到)2.语音模型包（http://www.kaldi-asr.org/models.html官网上可以下载到

只一刀·2018-05-24 15:02

kaldi中文语音识别_基于thchs30(5)

接上回if[-f$data/segments];then#这里是查看data/mfcc/train下是否存在segments，如果存在则执行then后面的脚本，否则执行else后面的，这个文件不存在，所以之后调用else后面的处理echo"$0[info]:segmentsfileexists:usingthat."split_segments=""fornin$(seq$nj);dosplit_

52Babara·2018-05-23 17:37

kaldi中文语音识别_基于thchs30(4)

接上回，完成数据准备的工作后，shell显示说明已经创建这些文件完毕。我们看到生成的spk2utt的文件格式是这样的：我们看到它是先是一个说话者id号然后是这个说话者id下的所有名称，而word.txt和text是一样的。既然我们已经数据准备了,所以以后就不用再进行数据准备了，所以在下次运行run.sh时,先注释掉相关数据准备的shell脚本。#datapreparation#generatete

52Babara·2018-05-16 14:47

kaldi中文语音识别_基于thchs30(3)

接上回，我们继续看run.sh#youcanobtainthedatabasebyuncommtingthefollowinglines#[-d$thchs]||mkdir-p$thchs||exit1#echo"downloadingTHCHS30at$thchs..."#local/download_and_untar.sh$thchshttp://www.openslr.org/resour

52Babara·2018-05-14 17:57

kaldi中文语音识别_基于thchs30(2)

接上回，我们需要修改cmd.sh.如下：exporttrain_cmd=run.pl#将原来的queue.pl改为run.plexportdecode_cmd="run.pl"#将原来的queue.pl改为run.pl这里的--mem4G还是去掉吧因为我机器装的虚拟机内存不是很大exportmkgraph_cmd="run.pl"#将原来的queue.pl改为run.pl这里的--mem8G还是去

52Babara·2018-05-10 11:09

kaldi中文语音识别_基于thchs30(1)

kaldi是语音识别的开源软件包，网址http://www.kaldi-asr.org/Kaldi'scodelivesathttps://github.com/kaldi-asr/kaldi.Tocheckout

52Babara·2018-05-09 19:26

Kaldi 说话人识别之aishell V1 模型（一）

一、数据准备1、首先在根目录下建立路径：/export/a05/xna/data然后下载数据集。这里下载数据集要在run.sh前面加sudo命令，这是路径的缘故。下载数据集用到的脚本是local/download_and_untar.sh需要下载两个数据文件：data_aishell和resource_aishell.2、数据准备阶段运行脚本：local/aishell_data_prep.sh运

gwpjiayou·2018-05-09 17:45

Kaldi中的并行化(转载)

简介使用Kaldi最理想的环境是配备集群任务分发工具，如SunGridEngine。如果同时使用多个服务器组成的集群，还需要能同时访问的共享文件系统，如NFS。

52Babara·2018-05-09 11:51

关于kaldi中yesno脚本的详细分析，以及脚本的理解

本人经过一番寒彻骨，学习shell、linux、kaldi，终于将kaldi中最简单的样例理解，由于过于口语话，文中可能出现措辞不当，忘谅解。

Xwei1226·2018-04-27 15:00

Kaldi thchs30手札（三）单音素模型训练（line 62-68)

欢迎大家关注我的博客http://pelhans.com/，所有文章都会第一时间发布在那里~本部分是对Kaldithchs30中run.sh的代码的line62-68行研究和知识总结，内容为单音素模型的训练与解码

Pelhans·2018-04-19 11:25

初探语音识别技术

语音识别主流开源框架：HTK、Kaldi、CMUSphinx。因为目前只接触了Sphinx，对于另外两个框架没有太深入研究。

ArrowYL·2018-04-17 19:43

Kaldi系列--Ubuntu中TIMIT在线识别（三）

在kaldi的工具集里有好几个程序可以用于在线识别。

FairmeLi·2018-04-16 16:09

A Note on Kaldi's PLDA Implementation

Kaldi’sPLDAimplementationisbasedon[1],theso-calledtwo-covariancePLDAby[2].TheauthorsderiveacleanupdateformulafortheEMtrainingandgiveadetailedcommentinthesourcecode.Hereweaddsomeexplanationstomakeformu

MoussaTintin·2018-04-05 16:05

kaldi的yesno样例分析

这篇文章是根据yesno样例下的run.sh脚本写出来的，当然脚本里还有许多附带工具暂时就来不及一一详解，看以后有没有时间和兴趣了。1.train_cmd="utils/run.pl"decode_cmd="utils/run.pl"定义机器运作方式，这里是本地多任务处理工作方式，而不是gpu.2.if[!-dwaves_yesno];thenwgethttp://www.openslr.org/

zhuanse·2018-04-03 15:10

语音识别学习资料入门整理

语音信号处理/模式识别/统计分析，1.算法:常用的深度学习算法，包括cnn/dnn/rnn/lstm;GMM/SVM/CRF/MaxEnt/HMM;对CTC有经验;2.框架:熟悉至少一种深度学习框架，包括kaldi

海德堡绝尘·2018-04-03 14:30

IOS Android 和 Unity上基于kaldi的离线语音识别系统

在一些教育医疗产业中，很多的词汇都非常专业，并不是一般的语音识别系统所能提供服务的，这时就需要我们自己构建一个离线的可以在手机或者平板上运行的语音识别系统，我选择的是Kaldi，因为Kaldi的识别能力要比上一代的

子龙法国·2018-03-08 22:33

Centos下kaldi的学习（二）kaldi的安装

上篇介绍了安装cuda，这篇来介绍一下kaldi的安装1、安装git工具yuminstall-ygit2、克隆kaldi源代码gitclonehttps://github.com/kaldi-asr/kaldi.gitkaldi-trunk

Cwy_yeah·2018-02-18 13:40

Centos下kaldi的学习（一）cuda的安装

2、安装cuda:第一次其实我安装好了cuda、kaldi，但是在检测cudamatrix的时候没有检测到GPU，所以我傻傻地以为我需要再安装一个Nvidia的显卡驱动，然后就走上了一发不可收拾的路，一直重复安装

Cwy_yeah·2018-02-18 11:26

&1. kaldi学习之路之 kaldi的安装编译

自入学来自己一人在语音识别领域痛苦挣扎，看了很多篇论文，语音识别领域质量较高的文章大多数还是英文的比较靠谱，看了几个月的论文终于有点头绪了，找到了自己的创新点，开始打算用Tensorflow训练实验，后来经多方人士推荐语音这块还是用Kaldi

luckygirl0809·2018-01-17 18:28

kaldi生成自己数据的mfcc

/bin/bashindexForSave=wavforfilein/home/kaldi/examples/*doif[-d"$file"]thenecho"$fileisa

AllyLi0022·2017-12-27 16:54

基于kaldi的在线语音识别

本文是基于kaldi的在线语音识别，使用b/s架构进行在线识别。适用于刚刚接触的小白。开发环境：jdk-1.8，Ubuntu16.04，Eclipse。

落红灬有丶情·2017-12-18 09:12

在kaldi工具包使用小数字语料库创建一个简单的ASR系统（番外篇）

相信很多人已经看过kaldi英文官网上关于该系统的搭建流程。虽然官方已经写的很通俗易懂，但是第一次接触的话还是不可避免的会碰到许多坑。恰巧最近实践了一下，把整个实践过程写了下来。

lindadasummer·2017-12-12 14:42

5.kaldi学习方法的问题

kaldi的学习方法网址：https://www.zhihu.com/question/65516424集合了众知乎大神的学习方法，那种积累性的学习方法就算了，要用最有效的学习方法。

诸葛村姑·2017-12-11 07:15

Kaldi中nnet3进行语音识别过程中用到的部分工具集锦！！！

前一篇文章我们对KaldiASR有了初步的了解，我们再来看看怎么使用Kaldi的神经网络模型NNET3来进行wav文件语音识别~~~~下载中文预训练模型：[houwenbin@localhost~]$cd

一代程序码农·2017-11-29 16:51

Kaldi中如何使用已经训练好的模型进行语音识别ASR呢？

很好，细心的你一定会发现kaldi源码src目录中有online*相关的模块，这就是我们今天的主角啦！！！

一代程序码农·2017-11-28 19:55

./configure时，error: cannot find install-sh, install.sh, or shtool解决方法

在测试kaldi例子timit时，需要安装irstlm（extras/install_irstlm.sh）出现Makefile生成失败问题：.

一代程序码农·2017-11-27 15:54

kaldi使用tri4b进行测试时的调参

测试完tri1的模型后，一定很想试试tri2或3.但当你操作时，会遇到如下的问题：ERROR(online-wav-gmm-decode-faster:LogLikelihoods():diag-gmm.cc:533)DiagGmm::ComponentLogLikelihood,dimensionmismatch39vs.40怎么解决？答案：1、于是修改run.sh成如下这个样子:ac_mode

AllyLi0022·2017-11-27 14:41

Kaldi DNN的特征提取和解码的连接操作

通过读脚本，我们知道了对应的特征提取和dnn的解码过程，得到一个lat（晶格文件），最后通过晶格文件进行分析，得到解码的结果，通过几次尝试，我这里通过wav文件得到了解码的文件，接下来将详细说明：首先是创建独立的文件夹，专门用来测试，里面保存5个文件，分别是：1.t2ss.wav(原始的wav文件)2.wav.scp(里面是保存了wav的绝对路径)3.final.mdl(训练模型得到的模型文件)4

张念·2017-11-16 11:55

推荐频道

kaldi