【kaldi】第6页

kaldi中查看深度学习模型参数

cdpath/of/kaldi/src/nnetbin/./nnet-infopath/of/final.nnet

jiangtopaz·2020-08-25 03:29

kaldi平台上aishell运行时出现的问题及解决办法

问题1：ThisscriptisintendedtobeusedwithGPUsbutyouhavenotcompiledKaldiwithCUDAIfyouwanttouseGPUs(andhavethem

程序猿-博客·2020-08-25 03:50

语音识别工具Kaldi 笔记

`本文翻译来自：[http://white.ucc.asn.au/Kaldi-Notes/tidigits/train]水平有限，翻译有不准确的地方望指出。

gwpjiayou·2020-08-25 03:38

KALDI之aishell模型说话人识别之V1

1.首先，成功安装kaldi在服务器上，用gitclone那种方式安装（和在本地Unbuntu乌班图环境安装没区别）。

落雪snowflake·2020-08-25 02:23

kaldi中声纹识别例子大概步骤综述

如何利用kaldi搭建说话人识别的例子。仅仅是搭建，具体的很多参数的调整需要大家根据数据集的不同慢慢调整。

落雪snowflake·2020-08-25 02:52

kaldi---get_egs.sh和get_egs_targets.sh区别

get_egs.sh和get_egs_targets.sh文件理解get_egs.sh和get_egs_targets.sh文件实现的功能相同，都是生成label标签和帧之间的对应，并划分训练-验证样本数据集。不同的是，get_egs.sh是通过上步已经生成的对齐文件夹（ali）及其相关文件生成帧级别的样本标签，而get_egs_targetes.sh文件是通过上步已经准备好的targets_sc

陌上阳光·2020-08-24 17:22

kaldi数据集下载（swbd）

kaldi数据集下载（swbd）LDC：https://catalog.ldc.upenn.edu/byyear（97年LDC97S62Switchboard-1Release2）https://linguistics.cornell.edu

陌上阳光·2020-08-24 17:22

全新mac安装kaldi

1.安装xcode官网下载xcodehttps://developer.apple.com/download/2.安装Xcode命令行工具$xcode-select--install3.安装homebrew命令获取网址：https://brew.sh//usr/bin/ruby-e"$(curl-fsSLhttps://raw.githubusercontent.com/Homebrew/inst

陌上阳光·2020-08-24 17:50

Kaldi特征提取之-VAD

Kaldi特征提取之-VAD背景VAD即VoiceActivityDetection，用于检测静音和非静音。

wxb_blog·2020-08-24 16:34

kaldi——用shellscript（bash）制作yesno的recipe（一）

先从kaldi的安装说起吧一，kaldi的安装与编译首先cd到安装的目录下cd /wangyu #wangyu是我建的一个文件夹然后安装kaldigitclonehttps:

Wang_yu09·2020-08-24 13:53

Kaldi 杂记

台式机器：I5-6500GTX950，ubuntu14.04(新手建议不要太新的ubutnu，出现问题不好百度)1.安装CUDA7.5到NVIDIA下载CUDA安装包，然后在安装一些可能需要的库：sudoapt-getinstallppa-purgesudoapt-add-repositoryppa:xorg-edgerssudoapt-getupdatesubversion,automake,a

Aderic·2020-08-24 11:39

make_mfcc_pitch.sh阅读笔记

steps/make_mfcc_pitch.sh--cmd"xexp/make_mfcc/mfccdir||exit1;提取特征代码：compute-mfcc-feats#提取mfcc特征compute-kaldi-pitch-feats

诸葛村姑·2020-08-24 04:57

Kaldi HMM拓扑和状态转换模型

我的书：淘宝购买链接当当购买链接京东购买链接##HMM拓扑使用c++的HmmTopology来描述音素的HMM拓扑。其描述的一个实例（3-stateBakis模型）如下：123456780000.510.51110.520.52220.530.53在这个实例中只有一个TopologyEntry，其包括了音素1~8（所以这个例子总共8个音素，这些音素共享相同的拓扑）。有三个发射状态，每个状态包括一个

shichaog·2020-08-24 02:24

Kaldi 查看ark,fst,tree等文件用到的命令

*1.ark,scp文件~/kaldi/src/featbin/copy-featsark:raw_mfcc_dev.10.arkark,t:-|headark存的试二进制文件，scp可以直接用cat命令看

诸葛村姑·2020-08-23 19:42

[Kaldi] 查看不同文件

20190108qzd1.ark,scp文件~/kaldi/src/featbin/copy-featsark:raw_mfcc_dev.10.arkark,t:-|headark存的试二进制文件，scp

原来是酱紫呀·2020-08-22 15:59

美国 AI 的秘密武器——中国人才，国际局势影响人才流动

去年，国际语音识别领域大神级人物，Kaldi之父DanielPovey拒绝了Facebook来到中国选择了小米。上周，英特尔芯片设计师JimKeller离职，中国网友纷纷评论欢迎到中国企业就职。

芒果果·2020-08-22 15:31

kaldi tutorial

https://eleanorchodroff.com/tutorial/kaldi/index.html

·Barton··2020-08-22 14:57

Kaldi thchs30手札（七） DNN-HMM模型的训练

欢迎大家关注我的博客http://pelhans.com/，所有文章都会第一时间发布在那里~本部分是对Kaldithchs30中run.sh的代码的line106-107行研究和知识总结，主要内容为Kaldi

Pelhans·2020-08-22 13:36

kaldi 源码分析(三) - run.pl 分析

在kaldi样本(egs/xxx/s5)目录下，大都会存在如下文件及文件夹：cmd.sh#并行执行命令，通常分run.pl,queue.pl两种config#参数定制化配置文件，mfcc,decode,

走在成长的道路上·2020-08-21 11:45

杂记：腾讯暑期实习 Web 后端开发面试经历

可能是因为我在简历中有过一个语音识别的项目经验，但那只是大二的一个课程作业，我对其中的原理并不十分了解，只说了什么Kaldi的内部是GMM+HMM模型实现的，唉。接下来是四道编程题，

weixin_33774615·2020-08-20 01:36

wav 文件按起止时间切割

step1:sox不能直接切，先转化为sphos.system(‘sox{}-fsph{}’.format(wav_filepath,sph_filepath))step2:用kaldi的sph2pipe

jinmingz·2020-08-19 22:00

kaldi常用工具（原理分析）

kaldi/src/gmmbin/gmm-copy–binary=false

jinmingz·2020-08-19 06:42

Kaldi中的plda的训练以及computer-socre

最近一直有个疑惑，plda是怎么训练的？就是plda是怎么计算得分的?又是怎么根据得分进行判断说话人的？EER跟准确率之间又是什么关系？时间很紧，论文还没写，需要静一静，好好弄明白这个来清醒一下。提取完i-vector之后，计算出每一句话的ivector特征，然后计算了sreivector-meanscp:exp/ivectors_sre/ivector.scpexp/ivectors_sre/m

jinmingz·2020-08-19 06:42

特征提取I-VECTOR算法源码01

#include#include"ivector/agglomerative-clustering.h"namespacekaldi{voidAgglomerativeClusterer::Cluster

落雪snowflake·2020-08-19 05:41

KALDI中声纹识别学习流程及资源

KALDI工具包中的例子首先最基础的就是egs/aishell/V1,先跑通它，并理解代码和基础理论知识。egs/sre08REMAD.TXT系统开发所需的数据（除了所描述的测试数据之外）在..

落雪snowflake·2020-08-19 05:40

kaldi 用ivector计算plda出错

运行结果如下：=====FEATURESEXTRACTION=====steps/make_mfcc.sh--cmdrun.pl--nj1data/trainexp/make_mfcc/trainmfccsteps/make_mfcc.sh:movingdata/train/feats.scptodata/train/.backupsteps/make_mfcc.sh:[info]:nosegme

新一姬·2020-08-19 04:32

KALDI中ivector提取过程

/local/data_prep.sh/home/yixin/kaldi/egs/clarinet/data/clarinet_audio/wav/home/yixin/kaldi/egs/clarinet

新一姬·2020-08-19 04:32

语音识别

语音识别主流开源框架：HTK、Kaldi、CMUSphinx。因为目前只接触了Sphinx，对于另外两个框架没有太深入研究。

飞星·2020-08-19 03:14

kaldi 强制对齐相关代码介绍

CorpusPhoneticsTutorialEleanorChodroffIntroPennForcedAlignerAutoVOTKaldiOtherResourcesPrerequisitesFamiliarizationTrainingAcousticModelsConceptuallyTrainingAcousticModelsForcedAlignmentKaldiForcedAlig

dlx59140096·2020-08-19 01:43

kaldi训练mono-phone——强制对齐

kaldi中训练声学模型，首先是训练单音素模型，即mono-phone过程，本文主要讲述mono-phone训练的过程。

audiocool·2020-08-19 01:29

kaldi中基于决策树的状态绑定

为什么要做状态绑定假如我们有218monophone，然后现在要考虑上下文音素对发音的影响，这时候我们通常使用triphone。那么会有几个triphone呢？答案是218的3次方。如果不进行聚类，我们需要建立(218的3次方)*3个混合gmm模型(假设每个triphone有3个状态)，计算量巨大,另一方面会引起数据稀疏。所以通常我们会根据数据特征对triphone的状态进行绑定。常见的状态绑定方

nlpgeek·2020-08-19 01:28

kaldi语音特征预处理-mfcc特征与标签对齐（一）

学习kaldi已经接近两个月了，终于将kaldi中语音的特征数据提取出来，对于其分帧的标签进行对齐，即将输入到TensorFlow搭建的模型中，下面详细的讲解一下如何提取语音的特征以及对音素标签进行对齐

Xwei1226·2020-08-19 01:38

PYTORCH-KALDI语音识别工具包

PYTORCH-KALDI语音识别工具包MircoRavanelli1，TitouanParcollet2，YoshuaBengio1*Mila,Universit´edeMontr´eal,∗CIFARFellowLIA

king_audio_video·2020-08-18 11:23

Kaldi结果文件可视化查看

转载：https://blog.csdn.net/zjm750617105/article/details/52540823目录L.fstMFCC&FBANKmonophone,triphonetreeali.1.gzshow-transitions样例是用自己的数据跑的，改编自wsj，文件名称不是很标准，但重点是工具的使用，加路径是为了好理解，内容暂时不解释，以后有时间来补充。这个文档太棒了，理

我是个粉刷匠·2020-08-17 08:52

【kaldi】Kaldi+CUDA安装向问题（含libtool is not installed.的解决方法）

现在汇总一下出现的问题。（1）Ubuntu16.04更新Nvidia驱动后，图形登录界面无限循环H：目前（请右上看眼发文时间），最新版本的Ubuntu16.04不兼容Nvidia驱动。14.04或者14.10版本是安全的。这里，提供一个站点：厦门大学的信息与网络中心。里面有很多linux版本。有Deepin/CenOS/ubuntu等。（2）虚拟机是（几乎）无法调用GPU的/不能运行CUDA的吗？

HH_Lab·2020-08-16 02:41

win10+cuda8.0+vs2013+kinectv2+bundlefusion的安装配置

bundlefusion下载下来https://github.com/niessner/BundleFusion6.下载mLibExtrernal，放在与bundlefusion同级文件夹下：http://kaldir

CptM·2020-08-16 01:40

语音识别—Viterbi解码

曾看过很多语音识别书（余栋的语音识别实战、陈果果的kaldi实战以及张雪英的数位语音处理等书）、课程（七月在线、深蓝学院等课程），上述研究对

Xwei1226·2020-08-15 22:58

语音识别技术(AI VQ HMM)，语音样本及开源工具 Kaldi等，双麦阵列

--AI：计算机视觉、语音识别、NLP(NaturalLanguageProcessing)人工智能正从比较初级的计算智能向更高层次的智能过渡。更高层次的智能包括3个阶段：感知（perception）智能，计算机视觉（computervision），认知（cognition）阶段，第一个阶段是感知（perception）智能，机器要听得见、看得见。听得见是我们常说的语音识别，机器把人说的一句话，由

desaco·2020-08-15 22:15

在树莓派上搭建kaldi离线语音识别系统（交叉编译）

在树莓派上搭建kaldi离线语音识别系统（交叉编译）一、系统功能和环境概述1.1、实现功能1.2、开发环境二、kaldi语音识别工具箱三、树莓派的相关配置四、kaldi交叉编译过程4.1、配置Ubuntu

麻城明歌·2020-08-15 11:47

kaldi理解WFST，HCLG，lattice

文章目录WFST，HCLGlattice两种lattice结构TheLatticetype和CompactlatticesLattice的产生获取rawlattice，并将其转换为最终形式。Latticesinarchives再lattices上的一些操作Pruninglattices剪枝Computingthebestpaththroughalattice计算最优路径ComputingtheN-

倚剑笑紅尘·2020-08-13 17:40

ubuntu下安装kaidl实用教程

1.介绍Kaldi语音识别工具将HTK比较零碎的各种各样的指令和功能进行整理集合，使用perl脚本调用。

chenxiaoliang0303·2020-08-11 03:15

Kaldi 编译问题

今天编译Kaldi,总是冒出“Couldnotfindanylibraries/usr/local/lib/liblapack,liblapack_atlas,libclapackthatseemtobeanATLASCLAPACKlibrary

yinger4972·2020-08-10 12:09

开源语音识别工具包 - CMUSphinx

以下是目前比较流行的语音识别工具包：CMUSphinxKaldiHTKJuliusISIP作为语音识别小白，我将从CMUSphinx入手

muxiue·2020-08-09 05:12

语音识别学习资料入门整理

语音信号处理/模式识别/统计分析，1.算法:常用的深度学习算法，包括cnn/dnn/rnn/lstm;GMM/SVM/CRF/MaxEnt/HMM;对CTC有经验;2.框架:熟悉至少一种深度学习框架，包括kaldi

weixin_34262482·2020-08-09 00:11

Kaldi特征提取之-FBank

Kaldi特征提取之-FBank背景人耳对声音频谱的响应是非线性的，经验表明：如果我们能够设计一种前端处理算法，以类似于人耳的方式对音频进行处理，可以提高语音识别的性能。

wxb_blog·2020-08-08 22:51

Kaldi WFST最小化算法

WFST最小化算法最小化算法主要是在保证DFA识别的语言不变的条件下，将DFA中等价状态合并，减少状态数、转移边数，简化DFA结构，从而减少存储空间和运算时间。比较有名的最小化算法有Moore，Hopcroft以及Brzozowski等，本章主要针对Hopcroft算法进行优化。WFSTHopcroft最小化算法原理Hopcroft算法在初始阶段将所有状态划分为终结状态和非终结状态两个等价类，然后

shakingWaves·2020-08-08 21:35

Kaldi WFST确定化算法

Kaldi中采用的确定化算法叫“子集构造法”，该算法原本是为了处理FSA的确定化，然而，Kaldi