【kaldi】第10页

kaldi中CD-DNN-HMM网络参数更新公式手写推导

在基于DNN-HMM的语音识别中，DNN的作用跟GMM是一样的，即它是取代GMM的，具体作用是算特征值对每个三音素状态的概率，算出来哪个最大这个特征值就对应哪个状态。只不过以前是用GMM算的，现在用DNN算了。这是典型的多分类问题，所以输出层用的激活函数是softmax，损失函数用的是crossentropy（交叉熵）。不用均方差做损失函数的原因是在分类问题上它是非凸函数，不能保证全局最优解（只有

davidtym·2019-11-05 08:00

声音的响度Python

kaldiCntkhttps://segmentfault.com/q/1010000009158922提取语音的响度https://github.com/faroit/awesome-python-scientific-audiogit

美环花子若野·2019-11-03 04:40

4.kaldi平台运行yesno的例子

1.kaldi平台运行yesno的例子运行run.sh（键入.

诸葛村姑·2019-11-02 16:15

咖啡起源与历史

牧羊人的故事图片发自App公元6世纪前后，在非洲埃塞俄比亚的高原上，牧羊人卡尔迪（Kaldi）突然发现羊群疯狂地喧闹起来，经过多次探查，才发现每当羊群吃了一种野生灌木的果实之后，就会不由自主地呈兴奋状态

半盏蔷薇·2019-11-02 06:21

kaldi例程timit运行与理解

语料准备首先是语料的获取，我是从kaldi新手QQ群上获取到的语料，而该语料的文件与yesno有较大区别，除了wav文件外还包含了三个描述文件，具体含义可以参考readme文档了解。

知行健康·2019-11-01 22:07

语音识别大牛Daniel Povey为何加入小米？“手机+AIoT”强大生态，开源战略是关键...

utm_source=aicamp整理|夕颜出品|AI科技大本营（ID:rgznai100）10月17日，语音识别开源工具Kaldi创始人，语音和AI领域大牛DanielPovey在10月19日，小米集团副总裁

AI科技大本营·2019-10-21 12:42

[kaldi] 特征文件格式转换

20190108qzd1.kaldi中的ark文件与htk中的mfcc文件的互相转换（1）ark转mfcc使用底层命令copy-feats-to-htkSavefeaturesasHTKfiles:每个发音会转化为一个对应的

原来是酱紫呀·2019-10-19 17:48

拒绝美式政治正确，他负气出走，选择来中国

关键词：DanielPovey，Kaldi，入职小米当地时间10月17日凌晨3点，开源语音识别工具包Kaldi之父DanielPovey，发布推特透露，自己即将跟小米签合同，并于今年年底正

超神经HyperAI·2019-10-19 14:50

拒绝美式政治正确，他负气出走，选择来中国

关键词：DanielPovey，Kaldi，入职小米当地时间10月17日凌晨3点，开源语音识别工具包Kaldi之父DanielPovey，发布推特透露，自己即将跟小米签合同，并于

HyperAI超神经·2019-10-18 17:02

美国AI语音大牛转投小米！因政治正确遭名校JHU开除，其后怒拒FB百万美元合同...

他打造的语音识别开源工具包Kaldi，集成了各种用于语音识别的模型，是语音识别领域的重要基础。此前Facebook邀约加盟，据说直接开出百万美元合同。△Via褚明宇：Dan在上海但因不堪

QbitAl·2019-10-18 12:54

怒拒 Facebook 后，语音识别大牛、Kaldi 之父将加盟小米

文|I/O雷锋网消息，10月17日，国际语音识别领域的大神级人物、前约翰霍普金斯大学（JonhsHopkinsUniversity）教授、语音识别开源工具Kaldi之父DanielPovey在个人Twitter

机器学习算法与Python学习-公众号·2019-10-18 12:00

确认！语音识别大牛Daniel Povey将入职小米，曾遭霍普金斯大学解雇，怒拒Facebook

（ID:rgznai100）【导读】10月17日，语音界传奇DanielPovey发布推特，宣布自己2019年末将要入职小米，目前正在签订合同阶段，入职后，他将带领一支团队研发下一代PyTorch-yKaldi

AI科技大本营·2019-10-18 10:35

随想录（从kaldi学习语音识别）

今天晚上，趁着有时间，看了一下kaldi的基本代码，心里有了一些基本的概念。1、代码地址https://github.com/kaldi-asr/kaldi2、主要目录tools/，提示

费晓行·2019-10-17 23:28

怒拒 Facebook 后，语音识别大牛、Kaldi 之父将加盟小米

文：I/O雷锋网消息，10月17日，国际语音识别领域的大神级人物、前约翰霍普金斯大学（JonhsHopkinsUniversity）教授、语音识别开源工具Kaldi之父DanielPovey在个人Twitter

itwriter·2019-10-17 17:00

分析一套源代码的代码规范和风格并讨论如何改进优化代码

这个选题需要研究机器学习的基本方法，需要使用到kaldi和TensorFlow,目前仍处

remainjjh·2019-10-13 11:00

结合工程实践选题调研分析同类软件产品

这个选题需要研究机器学习的基本方法，需要使用到kaldi和TensorFlow,而这些在

remainjjh·2019-10-12 21:00

OpenFST概览

学习Kaldi首先需要了解OpenFST，之后才能够深入的学习Kaldi，很多概念都是和OpenFSTaging相关的，而且如果要调整模型的准确率和速度也离不开OpenFST。

lawenliu·2019-09-29 19:21

kaldi学习笔记 -- 训练单音素（monophone）模型脚本 -- steps/train_mono.sh

本文介绍了kaldi训练monophone脚本的过程，脚本中每个程序的作用以及相关参数配置对训练结果的影响。#!

DuishengChen·2019-09-26 18:03

Kaldi入门教程 aishell脚本

Kaldi入门教程aishell脚本文章目录Kaldi入门教程aishell脚本@[toc]准备词典准备数据，分为test、dev、train集词典、语言文件准备，生成对应的数据关系训练语言模型使用语言模型生成有限状态机单音素训练构建单音素解码图

倚剑笑紅尘·2019-09-16 20:47

kaldi 学习笔记1

#指定bash#!/bin/bash#包含文件../path.sh||exit1../cmd.sh||exit1#配置nj=1#numberofparalleljobs-1isperfectforsuchasmalldatasetlm_order=1#languagemodelorder(n-gramquantity)-1isenoughfordigitsgrammar#安全检查.utils/pa

Ephemeroptera·2019-09-09 15:37

三个小白是如何在三个月内搭一个基于kaldi的嵌入式在线语音识别系统的

一段时间后老板就布置了具体任务：在我们公司自己的ARM芯片上基于kaldi搭建一个在线语音识别系统，三个人花三个月左右的时间完成。由于我们都是语音识别领域的小白，要求

davidtym·2019-09-09 08:00

kaldi LibriSpeech教程

前言因为我这里在服务器上下载数据很慢，所以，选择在别的地方下载好数据，然后上传过去的方式。稍微复杂一点。写个教程记录下.1下载训练数据&字典数据data_url=www.openslr.org/resources/12lm_url=www.openslr.org/resources/11⚠️data_url下的数据需要做解压，lm_url的数据不可以.1data_url的数据可以随便放，按照下面修

杨建利·2019-08-19 09:56

kaldi安装教程(CentOs GPU机器)

官网:https://kaldi-asr.org/代码:https://github.com/kaldi-asr/kaldicentos7安装kaldi下载:gitclonehttps://github.com

杨建利·2019-08-19 09:25

以kaldi中的yesno为例谈谈transition

在基于GMM-HMM的传统语音识别里，比音素（phone）更小的单位是状态（state）。一般每个音素由三个状态组成，特殊的是静音（SIL）由五个状态组成。这里所说的状态就是指HMM里的隐藏的状态，而每帧数据就是指HMM里的观测值。每个状态可以用一个GMM模型表示（这个GMM模型的参数是通过训练得到的）。在识别时把每帧数据对应的特征值放进每个状态的GMM里算概率，概率最大的那个就是这帧对应的状态。

davidtym·2019-08-12 08:00

以kaldi中的yesno为例谈谈transition

在基于GMM-HMM的传统语音识别里，比音素（phone）更小的单位是状态（state）。一般每个音素由三个状态组成，特殊的是静音（SIL）由五个状态组成。这里所说的状态就是指HMM里的隐藏的状态，而每帧数据就是指HMM里的观测值。每个状态可以用一个GMM模型表示（这个GMM模型的参数是通过训练得到的）。在识别时把每帧数据对应的特征值放进每个状态的GMM里算概率，概率最大的那个就是这帧对应的状态。

david_tym·2019-08-09 21:03

如何正确安装kaldi－－同时安装sph2pipe

如何正确安装kaldi如何正确安装kaldi－－同时解决sph2pipe安装问题git克隆kaldi配置kaldisph2pipe的使用如何正确安装kaldi－－同时解决sph2pipe安装问题众所周知

重复是俗套的·2019-07-26 15:56

语音关键词识别分类和介绍

Wiesner,M.,Peddinti,V.,Zhang,X.,Ghahremani,P.,Wang,Y.,Manohar,V.,Xu,H.,Povey,D.,Khudanpur,S.(2017)TheKaldiOpenKWSSystem

qq_33216029·2019-07-18 11:14

kaldi nnet3在线解码和chain在线解码

chain在线解码可以参考https://blog.csdn.net/it_king1/article/details/80109398我补充一下nnet3在线解码:nnet3跟chain不同之处在于nnet3没有HCLG.fst，用的还是tri5a的HCLG.fst(也就是hmm所代表的信息）这倒是证明了dnn只是代替gmm，可以参考如下的图示（来源http://www.jianshu.com/

boyStray·2019-07-08 21:29

kaldi的优化

１、kaldi的脚本中的decode.sh步骤都可以注释掉，减少训练的时间。decode是计算test语料的正确率。２、lexicon.txt其实直接用dacidian就可以，不用从语料中训练。

boyStray·2019-07-07 15:27

kaldi中SHELL调用C++程序过程源码分析

引入kaldi真正的核心源码，都是C++写成的，这个结论可以从如下两点得以确认：（1）在kaldi的源码kaldi/src目录下，能看到很多扩展名为.cc的源程序，这是linux下C++源码；（2）在源码中

ybdesire·2019-07-05 23:20

Mac 下编译 Kaldi Android (arm) .so 库

于是在TelegramChannel里面咨询了下，@nshmyrev回复建议可以利用KaldiDNN模型，应该会有显著提升。于是考虑转向研究Kaldi。首先碰到的一个问题是跨平台编译。

raywalker·2019-07-01 10:51

基于WFST的语音识别解码器

老板要求我们基于Kaldi搭一个语音识别系统，在设备上通过MIC讲话，连着设备的PC的console上就能基本实时显示出讲话的内容。

davidtym·2019-06-23 22:00

Ubuntu16.04下安装Kaldi

Ubuntu16.04下安装KaldiCUDA的安装CUDA安装注意的几点：Kaldi环境配置Kaldi的编译CUDA的安装在配置Kaldi环境之前，需要在Ubuntu里安装CUDA。

He_yuan_hong·2019-06-23 16:46

kaldi lattice（网格）

https://shiweipku.gitbooks.io/chinese-doc-of-kaldi/content/lattice.html一、lattice基础1、Lattice①它是一个FST；②

liangym·2019-06-20 16:45

基于kaldi的iOS实时语音识别(在线)+03+librispeech

由于最近一直在弄kaldi本地化，所以这系列文件一直来不及更新。这篇主要是讲解librispeech运行的run.sh脚本#!

长风浮云·2019-06-14 22:14

区分性训练与mmi（二）：fst、lattice、supervision

目录FSTFST与FSASemiringsTropicalSemiringLogSemiring不同的Semiring可能用到的特性WFST的基础操作（超级简略版本）Lattice什么是LatticeKaldi

兔子的熊·2019-06-01 21:01

解析kaldi中yesno的hmm的用法

在yesno/s5/exp/mono0a/graph_tgpr目录下打印Ha.fst的内容boystray@boystray-All-Series:~/kaldi/egs/yesno/s5/exp/mono0a

boyStray·2019-06-01 17:54

语音识别系列7-chain model 之分子部分

一、简介现在有越来越多的公司和团体开始使用chainmodel了，得益于kaldi社区日益活跃和kaldi作者povey的大力推荐，chainmodel的优越性在于：1，使用了单状态的biphone，建模粒度更大

心学-知行合一·2019-06-01 14:21

aishell的说话人识别资料

跑脚本请参考kaldi/egs/aishell/v1数学公式请参考https://www.zhihu.com/question/63978977/answer/215215119kaldi代码请参考https

boyStray·2019-05-28 23:35

kaldi+cuda安装

1.下载kaldi2.在tools下面按照步骤安装3.vim.bashrc修改环境变量exportPATH=/usr/local/cuda-8.0/bin:$PATHexportLD_LIBRARY_PATH

AliceXingFree·2019-05-26 20:34

【kaldi学习.4】Aishell V1（说话人识别、声纹识别）中的run.sh详解

做声纹识别就要选择aishell/V1，这里是kaldi的github地址：https://github.com/kaldi-asr/

Colleen_oh·2019-05-24 14:11

Kaldi 安装

1.git下载源码gitclonehttps://github.com/kaldi-asr/kaldi.gitkaldi-trunk--origingolden2.安装cdtools目录cdkaldi-trunk

kyle_liao·2019-05-23 17:00

kaldi语音识别：yesno模型图形化lattice（又叫词图）

article/details/81737937https://blog.csdn.net/yutianzuijin/article/details/77621511那么把lattice打印出来，需要用到kaldi

boyStray·2019-05-18 11:07

【Kaldi学习】了解+搭建kaldi环境

因为自己工作上的需求，近期接触了很多NLP的领域，所以学习这个强大的kaldi模型是肯定不可少的，下面是我的体会，有问题直接提出来啦！！

Colleen_oh·2019-04-29 11:31

kaldi中的i/o机制（代码级）

语音中用得比较多的工具箱就是kaldi了，kaldi的初步学习是从某个模型的脚本开始，单步运行。可以参考一下网上的一些博客，例如这篇，还是比较容易跑通第一个aishellv1的demo的。

哈哈进步·2019-04-28 14:05

Kaldi初体验（一）：安装

最近对Kaldi这个工具箱有了一些粗浅的体验，踩了不少坑。于是就稍微整理了一下。下载代码Kaldi托管在GitHub上，首先需要将代码下载到本地。

indes·2019-04-17 00:00

kaldi第一步安装kaldi测试yesno

Kaldi是一个非常强大的语音识别工具库，主要由DanielPovey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。

liuliqun520·2019-04-08 21:40

kaldi做aishell的nnet3训练耗时44个小时

kaldi做aishell，其中倒数第3步是local/nnet3/run_tdnn.sh，一共花了44个小时，主机配置32G内存，E31231V3，2个gtx9502G的显卡，机械硬盘。

boyStray·2019-04-07 16:01

语音识别传统方法(GMM+HMM+NGRAM)概述

部门起了个新项目，要用到语音识别（准备基于Kaldi来做）。我们之前做的传统音频已基本成熟，就开始关注在语音识别上了。

davidtym·2019-04-02 19:00

kaldi解码器在嵌入式平台运行

该博文属于系列文章，其他文章参考总览：kaldi嵌入式平台的移植及实现前言前面的博文kaldi源码的交叉编译已经将嵌入式平台的解码器编译完成，解码器有GMM、nnet2、nnet3等等，GMM解码器又分为单音素

遇逆境处之泰然·2019-03-18 15:35

推荐频道

【kaldi】

kaldi中CD-DNN-HMM网络参数更新公式手写推导

声音的响度Python

4.kaldi平台运行yesno的例子

咖啡起源与历史

kaldi例程timit运行与理解

语音识别大牛Daniel Povey为何加入小米？“手机+AIoT”强大生态，开源战略是关键...

[kaldi] 特征文件格式转换

拒绝美式政治正确，他负气出走，选择来中国

拒绝美式政治正确，他负气出走，选择来中国

美国AI语音大牛转投小米！因政治正确遭名校JHU开除，其后怒拒FB百万美元合同...

怒拒 Facebook 后，语音识别大牛、Kaldi 之父将加盟小米

确认！语音识别大牛Daniel Povey将入职小米，曾遭霍普金斯大学解雇，怒拒Facebook

随想录（从kaldi学习语音识别）

怒拒 Facebook 后，语音识别大牛、Kaldi 之父将加盟小米

分析一套源代码的代码规范和风格并讨论如何改进优化代码

结合工程实践选题调研分析同类软件产品

OpenFST概览

kaldi学习笔记 -- 训练单音素（monophone）模型脚本 -- steps/train_mono.sh

Kaldi入门教程 aishell脚本

kaldi 学习笔记1

三个小白是如何在三个月内搭一个基于kaldi的嵌入式在线语音识别系统的

kaldi LibriSpeech教程

kaldi安装教程(CentOs GPU机器)

以kaldi中的yesno为例谈谈transition

以kaldi中的yesno为例谈谈transition

如何正确安装kaldi－－同时安装sph2pipe

语音关键词识别分类和介绍

kaldi nnet3在线解码和chain在线解码

kaldi的优化

kaldi中SHELL调用C++程序过程源码分析

Mac 下编译 Kaldi Android (arm) .so 库

基于WFST的语音识别解码器

Ubuntu16.04下安装Kaldi

kaldi lattice（网格）

基于kaldi的iOS实时语音识别(在线)+03+librispeech

区分性训练与mmi（二）：fst、lattice、supervision

解析kaldi中yesno的hmm的用法

语音识别系列7-chain model 之分子部分

aishell的说话人识别资料

kaldi+cuda安装

【kaldi学习.4】Aishell V1（说话人识别、声纹识别）中的run.sh详解

Kaldi 安装

kaldi语音识别：yesno模型图形化lattice（又叫词图）

【Kaldi学习】了解+搭建kaldi环境

kaldi中的i/o机制（代码级）

Kaldi初体验（一）：安装

kaldi第一步安装kaldi测试yesno

kaldi做aishell的nnet3训练耗时44个小时

语音识别传统方法(GMM+HMM+NGRAM)概述

kaldi解码器在嵌入式平台运行