Kaldi 第13页

Kaldi nnet3 -------- Data Type

本文为kaldi官网关于nnet3的译文：简介本文覆盖最新的nnet3。为了了解Kaldi里的所有DNN，例如karel的版本，参考DeepNeuralNetworksinKaldi。

会飞行的小蜗牛·2017-11-14 15:28

音频视频自动提取字幕（extract subtitle from audios and vedios）

自动提取字幕的功能，在国外视频网站Youtube和社交巨头Facebook都已经上线多年，但国内各类视频和音频站都没有类似的功能，所有花了点时间调研了一下subtitle的自动提取功能：1.开源语音识别库，比如Kaldi

chijiaodaxie·2017-10-31 17:14

kaldi训练thchs30详细步骤

一、下载源码，https://github.com/kaldi-asr。二、进入thchs30/s5文件夹，修改run.sh里面的数据路径，我才用了直接下载的方式，因为之前没有这方面的数据。

AllyLi0022·2017-10-26 16:22

Kaldi在虚拟机里面安装

建议安装4.8以上版本，登陆最好是root，废话不多说，开始，首先安装虚拟机，虚拟机安装，完成的示意图，快捷键Ctrl+Alt+t打开终端：在终端中键入sudoapt-getupdate命令然后输入密码回车kaldi

张念·2017-10-25 09:00

关于咖啡的这些知识你知道吗？

最广泛流传的是：一位名为Kaldi的埃塞俄比亚牧羊人发现自己的动物在吃完成熟的咖啡豆后，变得异常兴奋。2、一株咖啡树能活200年以上，当它开始发芽时，顶端的嫩

小星酱01·2017-10-10 11:07

Unbuntu16.04+Kaldi本地运行timit语料（完整版）

首先准备数据集将数据集放再kaldi/egs/timit/data/中解压rarxtimit.rar注：若没有安装rar，可根据相应的提示安装然后修改s

binglel·2017-10-03 20:44

Unbuntu16.04+Kaldi本地运行thchs30语料（完整版）

之前已经写过如何源码安装Kaldi，在此不再赘述，直奔主题！首先，准备清华语料thchs30数据有两种，一种是HTK版，另一种就是Kaldi版。

binglel·2017-10-01 21:34

kaldı、kaldi-ctc的安装(CUDA+CUDNN)

操作系统：Ubuntu14.04（64位）显卡：GTX750TiCUDA版本：7.5(后缀为cuda_7.5.18_linux.run)（截止2019-3-1，kaldi仅支持cuda7.5和cuda8.0

落红灬有丶情·2017-09-24 21:23

Kaldi 现在提供 TensorFlow 集成

许多语音识别团队都依靠Kaldi，这是一款广受欢迎的开放源代码语音识别工具包。今天，我们宣布Kaldi现在提供TensorFlow集成。

DemonHunter211·2017-09-18 09:32

kaldi 学习笔记-单音素训练

本人初入语音识别一个月,最近开始学习kaldi源码。本文介绍kaldi语音识别对单音素训练的大致流程。欢迎指正纠错，谢谢。

fengzhou_·2017-09-15 22:55

kaldi简单使用笔记***

blog.csdn.net/foolsnowman/article/details/51115204http://blog.csdn.net/quhediegooo/article/details/709414551Kaldi

AllyLi0022·2017-09-14 17:21

kaldi使用入门

有些内容复制不过来，只好将其链接写到这个地方：参考资料：http://www.360doc.com/content/15/0203/17/2036337_446008889.shtmlhttp://blog.csdn.net/amds123/article/details/70313780http://blog.csdn.net/hongmaodaxia/article/details/4422

AllyLi0022·2017-09-14 16:11

语音识别工具kaldi在linux环境下的安装步骤

最近需要进行语音识别的学习，选择了kaldi作为开发平台，在尝试了网上的很多安装方法后，寻找了一种最简洁的安装方法，总结如下：第一步：先安装git命令:sudoapt-getinstallgit第二步：

BITgaol·2017-09-10 10:29

Kaldi语音识别工具包简介及安装说明

1Kaldi简介Kaldi是一个开源的语音识别工具，整合了HTK的基本功能，同时也加入了深度神经网络的分类器(DNN)。

Pandora91·2017-09-05 10:42

kaldi的timit例子运行到SGMM2 Training & Decoding部分突然中断

跑timit时到SGMM2Training&Decoding部分突然中断，终端中断程序时显示如下：============================================================================SGMM2Training&Decoding=====================================================

lindadasummer·2017-08-30 23:20

kaldi 安装

一、预习安装包（系统Ubuntu）#installsomepackagefirstsudoapt-getinstalllibtoolsudoapt-getinstallautoconfsudoapt-getinstallwgetsudoapt-getinstallperlsudoapt-getinstallsubversionsudoapt-getinstallbuild-essentialsud

Tiger-Gao·2017-08-25 19:11

Kaldi脚本分析（6）——解码图构建

Kaldi中对FST的很多操作与参考文献[1]中稍有不同，尤其是对消歧符号和权重推移等的处理上。其中，G为语言模型FST，输入输出标签相同，都是词，本质为FSA。

Pandora91·2017-08-25 11:00

Kaldi学习之如何运行脚本

学习Kaldi也有两三个星期了，基本上就是对Kaldi官网上的说明简单摸索了下，顺便跑了跑自带的例子。

llearner·2017-08-25 00:17

Kaldi WFST HCLG.fst 构图学习

HCLG.fst由四部分构成1.G：语言模型WFST，输入输出符号相同，实际是一个WFSA（acceptor接受机），为了方便与其它三个WFST进行操作，将其视为一个输入输出相同的WFST。2.L：发音词典WFST，输入符号：monophone，输出符号：词;3.C:上下文相关WFST，输入符号：triphone（上下文相关），输出符号：monophnoe;4.H:HMM声学模型WFST，输入符号

lucky_ricky·2017-08-23 20:12

关于找不到库文件.so,.h的万能debug方法

安装使用kaldi时，今天又碰到了.so库文件找不到的问题，感觉时编译的时候出了问题，因为要tools里下载依赖（opentsp等），然后去src里安装编译，第一次跑yesnosample的时候通过，后来给

chijiaodaxie·2017-08-19 17:12

kaldi的语音识别数据timit例子详解

本文将以kaldi中timit的例程来看整个run.sh脚本的执行过程。数据准备请先进入kaldi\egs\timit\s5\这个目录。

DanyHgc·2017-07-17 11:47

kaldi安装及yesno实例

Kaldi是一个非常强大的语音识别工具库，主要由DanielPovey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。

Shmily_Young·2017-07-03 16:44

使用kaldi进行语音自动切分、模型训练和强制对齐

1.只有原始录音和音素标注，进行初次以及多轮的单音素、三音素模型训练，并且基于这些模型进行语音切分：http://pages.jh.edu/~echodro1/tutorial/kaldi/kaldi-training.html

mx_windforce·2017-06-17 23:19

kaldi001 -- 树的内部结构

有关解释整个实现算法以及工具包如何使用，请参阅“如何在Kaldi中使用决策树”一节。EventMap类构建决策树代码的主要概念是“事件映射”，由EventMap类型表示。

u012361418·2017-06-03 13:00

Kaldi学习笔记（二）

本文主要解读thchs30/s5/run.sh的主要步骤，以及一些编写脚本过程中可能遇到的问题。对于文中的差错，欢迎各位指正！1.数据准备在处理数据之前，我们要知道thchs30数据集包含三部分：train（训练集）、dev（开发集）和test（测试集）。其中dev的作用是在某些步骤与train进行交叉验证的，如local/nnet/run_dnn.sh同时用到exp/tri4b_ali和exp/

看什么看·2017-05-06 11:44

Kaldi学习笔记（一）

工欲善其事，必先利其器，机器、数据、算法对深度学习都非常重要。1机器我先后尝试两台机器以及虚拟机，处理速度差距还是很大的。当前配置：i76700+gtx1060+16G+240GSSD。至少现在的实验流程可以在一天之内完成，用旧机器可能3天都不一定能完成。cpu对于大部分的计算都是至关重要的，尤其是解码步骤，最为耗时，如果能用上可以超频的cpu，速度会快不少吧。gpu主要可以加速dnn训练，据说与

看什么看·2017-05-05 11:36

有趣的开源软件：语音识别工具Kaldi (二)

在上一篇blog中简单的介绍了Kaldi的安装方法有趣的开源软件：语音识别工具Kaldi(一) 在这篇blog中继续Kaldi模型训练的步骤，介绍一下在模型训练之前的一些数据准备的工作。

算法学习者·2017-04-21 13:58

有趣的开源软件：语音识别工具Kaldi (一)

算法学习者·2017-04-21 13:22

kaldi上第一个免费的中文语音识别例子

今天在清华大学cslt实验室王东老师的分享下，kaldi终于有了免费的中文语音识别的例子，网址为：https://github.com/kaldi-asr/kaldi/tree/master/egs/thchs30

算法学习者·2017-04-21 13:14

基于kaldi的在线中文识别，online的操作介绍

最近研究了下kaldi，也看了好多文章，感觉这方面的有用文章太少！大多停留在编译和深层理论方面。对于我们这种没有基础的人，除了看完编译，就只能很茫然的看哪些高高在上的理论了。本文章，适合那些。

算法学习者·2017-04-21 13:21

Kaldi 中文语音识别需要考虑的问题

转自：点击打开链接原文作者：英语流利说团队李飞腾Kaldi语音识别1.声学建模单元的选择1.1对声学建模单元加入位置信息2.输入特征3.区分性技术4.多音字如何处理？

会飞行的小蜗牛·2017-04-13 09:03

如何用 Kaldi 训练一个 DNN 声学模型

英文原文地址：点击打开链接本人译文如下：1.介绍：首先，需要完成标准的GMM-HMM声学模型的训练训练monophonemodel是通过GMM-HMMSystem做utterance-leveltranscriptions，即训练label-audio的映射训练triphonemodel是通过GMM-HMMSystem做phoneme-to-audioaglignments因此，DNN是严格依赖于

会飞行的小蜗牛·2017-04-11 21:11

Kaldi HCLG 深入理解

会飞行的小蜗牛·2017-04-11 15:10

Kaldi-dnn 学习

1.Kaldi中实现的dnn共4种：a.nnet1-基于Karel's的实现，特点：简单，仅支持单GPU,由Karel维护b.nnet2-基于DanielPoveyp-norm的实现，特点：灵活，支持多

会飞行的小蜗牛·2017-03-14 21:36

Kaldi 学习总结

会飞行的小蜗牛·2017-02-16 17:26

kaldi run.sh 执行

用于公司研究记录#preparelanguagestuff#buildalargelexiconthatinvovleswordsinboththetraininganddecoding.(echo"makewordgraph..."cd$H;mkdir-pdata/{dict,lang,graph}&&\cp$thchs/resource/dict/{extra_questions.txt,no

dzp443366·2017-01-11 14:45

kaldi数据准备部分,文件解释

若想用已识别的系统对你的数据解码，要重写“数据部分”.直接以thchs30项目为例里面或许会有cmvn.scpfeats.scpreco2file_and_channelsegmentsspk2utttextutt2spkwav.scp文件”text”:包含每段语音的文字意思每行的第一项是录音编号（utterance-id），发音编号后面跟着的是每段录音的标注。文件wav.scp这个文件的格式是大

dzp443366·2017-01-05 16:27

kaldi

第一阶段:./cmd.sh../path.sh(设置执行路径以及命令脚本名字)ps:decode解码train训练第二阶段:datapreparation(数据准备阶段)执行local/thchs-30_data_prep.sh为了创建:wav.scp,utt2spk.scp,spk2utt.scp,text还有words.txtphone.txt-循环遍历thchs30/thchs30-open

dzp443366·2017-01-05 16:34

数据准备（快速构建ASR系统）

数据准备在Kaldi官方文档中已经有了较为全面、详尽的说明。然而在自己拿到语音数据后，要快速构建一个简单的ASR语音识别系统，对于新手来说，思路可能并不清晰。

lujian1989·2017-01-03 17:22

Ubuntu16下安装编译kaldi

kaldi是一个开源的语音识别工具箱，是基于c++编写的，可以在windows和unix平台上编译首先安装一些依赖的库：执行以下命令udoapt-getinstallautoconfautomakegcclibtoolsubversionlibatlas-devlibatlas-base-devgfortrang

atcmy·2016-11-18 15:01

笔记——kaldi中关于声学模型final.mdl的打印

初学kaldi语音识别，在Linux上查看文件不像Windows那么简单易行。

Toby_fbby·2016-10-12 10:14

如何用kaldi训练好的DNN模型做在线识别

在已经训练好模型的情况下，需要针对一个新任务做在线识别应该怎么做呢？一种情况是，用已有的声学模型和新训练的语言模型。语言模型可以同srilm等工具训练，但是怎样将语言模型与DNN声学模型一起来进行识别的。SRILM可以用来训练ARPA格式的LM，假设train.txt是语料，wordlist是词汇，假设语言模型的字典和识别器的字典一样，可以按如下办法训练ＬＭngram-count-texttrai

Inger_H·2016-10-11 17:55

kaldi学习笔记 -- 训练单音素（monophone）模型脚本 -- steps/train_mono.sh

本文介绍了kaldi训练monophone脚本的过程，脚本中每个程序的作用以及相关参数配置对训练结果的影响。#!

DuishengChen·2016-09-18 17:48

Ubuntu上安装Kaldi

什么是Kaldi？

我把葡萄酿成酒·2016-09-01 20:51

kaldi中文语音识别thchs30模型训练代码功能和配置参数解读

Monophone单音素模型的训练#Flatstartandmonophonetraining,withdelta-deltafeatures.#Thisscriptappliescepstralmeannormalization(perspeaker).#monophone训练单音素模型steps/train_mono.sh--boost-silence1.25--nj$n--cmd"$trai

Anymake·2016-08-22 11:44

kaldi 中lattice操作的几个工具

latgen-faster-mapped：生成latticelattice-scale：Applyscalingtolatticeweightslattice-add-penalty：Addwordinsertionpenaltytothelatticelattice-best-path：Generate1-bestpaththroughlattices;outputastranscription

huchad·2016-08-10 16:58

kaldi 一些错误

因为这个例程建立语言模型是用irstlm工具建立的，但是在最新版本的kaldi里面，irstlm不是默认编译的。首先进入kaldi目录下的tools/extras目录，执行in

蓝色天空2014-09·2016-05-30 15:34

语音识别工具Kaldi环境配置及安装手册（更新加强版）

首先的首先，需要感谢所在研究团队的男神李健和女神姬艳这两位ASR担当。从硕士到博士，弃武从文（从语音识别到语音生成）。心有不甘，觉得放下太可惜。于是，决定两手抓，两手都要硬，两个领域相辅相成，互相促进。参加今年的ICASSP的时候，感觉到ASR发展的真是太快了，回来之后就觉得应该迅速拾起来，并乐在其中。心血来潮，今天搞了一天，重新“入门”，做个云笔记，希望能帮助他人。一、安装操作系

u013538664·2016-05-05 22:00

Kaldi使用笔记

1Kaldi安装gitclonehttps://github.com/kaldi-asr/kaldi.gitkaldi-trunk--origingoldencdkaldi-trunkcdtools/extras

奋斗啊哈·2016-04-10 21:34

Kaldi使用笔记

1Kaldi安装gitclonehttps://github.com/kaldi-asr/kaldi.gitkaldi-trunk--origingolden cdkaldi-trunk cdtools

foolsnowman·2016-04-10 21:00

推荐频道

Kaldi

Kaldi nnet3 -------- Data Type

音频视频自动提取字幕（extract subtitle from audios and vedios）

kaldi训练thchs30详细步骤

Kaldi在虚拟机里面安装

关于咖啡的这些知识你知道吗？

Unbuntu16.04+Kaldi本地运行timit语料（完整版）

Unbuntu16.04+Kaldi本地运行thchs30语料（完整版）

kaldı、kaldi-ctc的安装(CUDA+CUDNN)

Kaldi 现在提供 TensorFlow 集成

kaldi 学习笔记-单音素训练

kaldi简单使用笔记***

kaldi使用入门

语音识别工具kaldi在linux环境下的安装步骤

Kaldi语音识别工具包简介及安装说明

kaldi的timit例子运行到SGMM2 Training & Decoding部分突然中断

kaldi 安装

Kaldi脚本分析（6）——解码图构建

Kaldi学习之如何运行脚本

Kaldi WFST HCLG.fst 构图 学习

关于找不到库文件.so,.h的万能debug方法

kaldi的语音识别数据timit例子详解

kaldi安装及yesno实例

使用kaldi进行语音自动切分、模型训练和强制对齐

kaldi001 -- 树的内部结构

Kaldi学习笔记（二）

Kaldi学习笔记（一）

有趣的开源软件：语音识别工具Kaldi (二)

有趣的开源软件：语音识别工具Kaldi (一)

kaldi上第一个免费的中文语音识别例子

基于kaldi的在线中文识别，online的操作介绍

Kaldi 中文语音识别需要考虑的问题

如何用 Kaldi 训练一个 DNN 声学模型

Kaldi HCLG 深入理解

Kaldi-dnn 学习

Kaldi 学习总结

kaldi run.sh 执行

kaldi数据准备部分,文件解释

kaldi

数据准备（快速构建ASR系统）

Ubuntu16下安装编译kaldi

笔记——kaldi中关于声学模型final.mdl的打印

如何用kaldi训练好的DNN模型做在线识别

kaldi学习笔记 -- 训练单音素（monophone）模型脚本 -- steps/train_mono.sh

Ubuntu上安装Kaldi

kaldi中文语音识别thchs30模型训练代码功能和配置参数解读

kaldi 中lattice操作的几个工具

kaldi 一些错误

语音识别工具Kaldi环境配置及安装手册（更新加强版）

Kaldi使用笔记

Kaldi使用笔记

Kaldi WFST HCLG.fst 构图学习