Kaldi 第7页

利用kaldi提取mfcc特征

前言1）由于kaldi的集成性很高，这样如果只是想实现一个小功能，就需要很多准备东西，比如如果要提取mfcc就需要利用steps/make_mfcc.sh脚本，需要为其准备一些文件。

长虹剑·2020-08-08 12:13

音声合成：音高、泛音、谐波、基频到底是什么概念？

工具Kaldi，虽然非常高效，表现也好，但是忒难用，不灵活，总得改C++代码；PyKaldi，虽然用上了机器学习界宠儿Python，但本质上跟Kaldi还是一回事嘛；PyTorch-Kaldi，虽然灵活了一些

缠禅可禅·2020-08-08 11:13

[实验室环境配置] kaldi安装

下载kaldi包gitclonehttps://github.com/kaldi-asr/kaldi.git检查并自动安装依赖库cdtools.

ASR_THU·2020-08-06 13:46

kaldi中文件的写入及读取

文件名有“rxfilename”和“wxfilename”两种类型“-”或者“”表示标准的输入；filename:12345定位到12345Table有两种形式：“archive”和“script”文件。它们之间的差别在于：archive包含实际的数据，而script文件则指出数据的具体位置从Tabla中读数据的程序需要一个“rspecifier”输入，该字符串指明了如何读取索引数据写数据到Tab

wuxianfeng1987·2020-08-04 21:39

Decoding-graph creation recipe (training time) （kaldi翻译+个人理解）

kaldi的图创建过程在训练阶段与测试阶段相比而言要相对简单一点，主要是因为不需要消歧符号，我们假定你已经读了这个recipe的test阶段，然而我没读，，，。

少游223·2020-08-04 00:06

kaldi中TransitionModel介绍

kaldi中的HMM模型，实际就是一个TransitionModel对象。这个对象描述了音素的HMM拓扑结构，并保存了pdf-id和transition-id相关的信息，并且可以进行各种变量的转换。

lbaihao·2020-08-03 18:46

kaldi中文语音识别(1)

这3篇博客，详细总结和记录了我编译安装kaldi和两种用kaldi进行中文语音识别的过程，包括如何kaldi的简单介绍、环境的配置、相关模型的训练、导入，算是自己近期学习的一个总结，也希望可以帮助到需要的人

shenzhiping12·2020-08-03 04:27

kaldi win10 vs2019 CPU和GPU下遇到的问题

kaldiwin10visualstudio2019CPU和GPU下遇到的问题1需要组件1.1nvidiadriver1.2vs2019社区版1.3cmake1.4git和TortoiseGit2kaldivs

zhulinniao·2020-08-02 15:13

Kaldi（二）中文模型识别

目前kaldi中文识别数据集aishell:AISHELL公司开源178小时中文语音语料及基本训练脚本，见kaldi-master/egs/aishellaishell-1：http://www.openslr.org

圆滚滚的大营子·2020-08-01 01:48

win7安装UBUNTU18 双系统流程中途出现GRUB失败（已解决）

最近开始学习KALDI开始装的虚拟机无奈渣本是6年前的4g内存根本带不动所以开始安装双系统。

赤崎Akasaki·2020-07-30 21:25

Win10下启动内置Linux子系统

目录最近想要重新把Kaldi装上来复习一下以前的项目内容，以前是在Windows+Cygwin的配置下跑Kaldi，这次安装过程中出现了一些问题，据说是64位最新版的Cygwin好像会出现这些问题，在网上找解决方案无果后

Yogurt0928·2020-07-30 19:23

Ubuntu16.04安装Kaldi toolkit

sudoapt-getinstallautoconfautomakelibtoolsubversionlibatlas-devlibatlas-base-devzlib1g-devgawkgitgfortrangccg++二、在github（https://github.com/kaldi-asr

z小白·2020-07-29 13:05

从说话人识别demo开始学习kaldi--（5）compute_vad_decision.sh

Grace_yanyanyan·2020-07-29 13:36

kaldi feature extraction

支持提取mfcc/plp特征，和HTK特征的主要差别在于默认参数值的设定。使用选项-htk-compat=true以及合适的参数，可以得到htk特征。全局CMVNcompute-cmvn-stats假设帧数为i，特征维度为j，cmvn计算得到两个矩阵：(A1,A2,...,Aj,Aj+1)(B1,B2,...,Bj)第Aj+1表示总的帧数N假设特征为fij，其中变量的计算公式如下：Aj=∑ifij

xmucas·2020-07-29 13:36

基于深度神经网络的语音识别方法

2019独角兽企业重金招聘Python工程师标准>>>Kaldi语音工具箱的简介Kaldi语音工具箱[61]是由微软研究院Povey等人研究的应用于语音识别方面的开源工具箱。

weixin_33957648·2020-07-29 12:06

如何利用kaldi提自己想要的特征（mfcc plp pitch）

转自：http://blog.csdn.net/wbgxx333/article/details/27705939首先，确保你的s5文件夹有conflocalsteputils文件夹。然后你把你的数据保存为test文件夹，比如test文件夹里有test1.wavtest2.wavtest3.wav。然后，新建个data文件夹，data文件夹新建个test文件夹，这个test文件夹里需要三个文件：w

JamesJuZhang·2020-07-29 11:46

kaldi中的特征提取

本翻译原文http://kaldi.sourceforge.net/feat.html，由@煮八戒翻译，@wbglearn校对和修改。

wbglearn·2020-07-29 11:08

MFCC & PLP

kaldi特征提取默认参数设置：###预加重将信号通过高通滤波器:s2(n)=s(n)−a∗s(n−1)s_2(n)=s(n)-a^{*}s(n-1)s

shichaog·2020-07-29 11:33

【声纹识别】 kaldi callhome diarization

callhomediarizationkaldi中专门用来进行混合录音文件聚类分别的，主要参考blog-->操作指南学会自己看kaldi中的指令demo。

SoWhat1412·2020-07-29 10:34

Kaldi-MFCC模块源码主流程分析

那么趁着这个机会，研究一下kaldi源码中MFCC部分的内容。

爱国者002·2020-07-29 10:43

kaldi基础介绍（一）在说话人识别中的数据准备

在kaldi说话人识别示例（egs/sre10,egs/sre16）中，数据总共有两大类，一是训练集（training），二是评估数据集（evaluation）。

monsieurliaxiamen·2020-07-29 10:45

基于x-vector的文本无关说话人识别

这篇文章分两部分，第一部分介绍x-vector的说话人识别细节算法，第二部分是对最新技术的跟进，本质是对训练数据做了dataaugmentation，x-vector方法在kaldi上的实现细节将在下一篇文章中展示

monsieurliaxiamen·2020-07-29 10:45

语音识别传统方法(GMM+HMM+NGRAM)概述

部门起了个新项目，要用到语音识别（准备基于Kaldi来做）。我们之前做的传统音频已基本成熟，就开始关注在语音识别上了。

david_tym·2020-07-29 09:20

语音特征提取学习笔记--对比kaldi、htk、w2l的语音提取过程。

不过在KALDI和HTK软件中，除了MFCC，其实还提供了其他一些特性提取方法，其中就包括PLP和FilterBank。本文又加入了

golfbears·2020-07-29 08:21

Kaldi在ubuntu 18.04下编译小结

sctk-2.4.10-20151007-1312Z.tar.bz2这个文件在https://github.com/kaldi-asr/kaldi中下载是通过tools/Makefile文件中该行实现的

奔跑的Levi·2020-07-28 03:38

按下快门，世界在你手中｜小米周报

开源中国开源世界7月15日，在第十五届“开源中国开源世界”高峰论坛上，小米集团副总裁、集团技术委员会主席崔宝秋博士发表了“Kaldi和小米AIoT生态”主题演讲。

小米手机·2020-07-17 00:00

编辑距离WER/CER计算的一种python实现

一些语音识别框架（如：Kaldi、ESPNet等）中，都会包含wer的计算方法，其中ESPNet的结果展示如下：我们希望用python实现上面的效果，首先来看看wer是怎么计算的。

zwglory·2020-07-16 14:45

基于WFST的语音识别热词定制化

最近学习了kaldi的"Supportforgrammarsandgraphswithon-the-flyparts"，感觉看英文看着挺费劲，而且中间有许多概念需要有对应的图才能方便理解，所以撰写此文给有需要的同仁

Good_ASR·2020-07-13 18:22

Kaldi语音识别工具运行TIMIT数据库实例

Kaldi安装后运行TIMIT例子：1.对于Kaldi-master版本中，/egs/timit/s5下面的关键三个文件cmd.sh，path.sh，run.sh,运行前只需要修改将run.sh中的timit

JamesJuZhang·2020-07-13 15:09

基于kaldi的声纹识别

声纹识别基本原理：1、建立通用背景模型（UBM）使用大量的非目标语音构建一个通用背景模型（exp/full_ubm_1024/final.ubm）。2、得到目标说话人的混合高斯模型（GMM）采用目标说话人数据进行基于最大后验概率（MaximumAPosterior，MAP）的自适应训练，得到目标说话人的混合高斯模型（GMM）。3、映射到i-vectorGMM通过全局差异空间建模（TotalVari

liangym·2020-07-13 10:06

音视频技术开发周刊 53期

我们发布了基于流行的Kaldi语音识别工具包的DFSMN的

LiveVideoStack_·2020-07-12 21:36

kaldi中的egs文件夹中的demo都是干什么的

kaldi官网对egs的介绍在这里：http://kaldi-asr.org/doc/examples.html下面只是简单记录下，如果你需要哪个，请细看每个文件夹里面的README。

Grace_yanyanyan·2020-07-12 18:56

Kaldi TIMIT x-vector 说话人识别 (声纹识别)

x-vector进行说话人识别,现有的资料都是i-vector.本文参考了很多资料,如果想要了解如何使用TIMIT和ivector进行说话人识别,那么建议从https://github.com/lr2582858/kaldi-timit-sre-ivector

RanleyYu·2020-07-11 16:19

基于kaldi的在线中文识别，online的操作介绍

最近研究了下kaldi，也看了好多文章，感觉这方面的有用文章太少！大多停留在编译和深层理论方面。对于我们这种没有基础的人，除了看完编译，就只能很茫然的看哪些高高在上的理论了。本文章，适合那些。

代码医生·2020-07-11 10:31

GMM-HMM语音识别模型2

以下放上这段时间浏览博客的网址：1.kaldi语音识别的资料http://blog.csdn.net/sheshou199/article/details/53

诸葛村姑·2020-07-11 09:39

ASR: DNN训练

本文通过简单kaldi源码，分析DNN训练声学模型时神经网络的输入与输出。

zqh_zy·2020-07-10 11:08

kaldi提取bottleneck特征

基于nnet1的脚本在训练的时候将train.sh中BN层设置一下，然后调用steps/nnet/make_bn_feats.sh脚本，通过生成的final.nneti模型查看BN层的component，设置remove_last_component的数目，生成BNF。注意：要对特征做cmvn基于nnet3调用steps/nnet3/make_bottleneck_feature.sh主要是nne

weixin_34315485·2020-07-10 08:21

Kaldi中声纹识别的流程图

总结了一波Kaldi中声纹识别的流程和所用的可执行文件,.把可执行文件当作一个库来用,自己来仿照这sre08,sre10,或者aishell的run.sh用自己的数据来完成自己的声纹识别系统就好.自己还在研究

RoadmanG·2020-07-10 01:53

Kaldi学习笔记 score-plda.sh 解读

1Usageiswheretostorepretrainedpldamodel.iswheretostorexvectorandcorrespondingspk2utt,etc.output-diriswheretooutputthepldascores.2CodeandCommentsfeats="ark:ivector-subtract-global-mean$pldadir/mean.vec

RanleyYu·2020-07-09 14:35

kaldi ASR pipeline涉及到的知识

kaldi中基于决策树的状态绑定https://blog.csdn.net/asrgreek/article/details/88139638Kaldi学习笔记--构建字典FST脚本--prepare_lang.sh

qq_27292549·2020-07-07 20:23

Kaldi单步完美运行AIShell v1 S5之三：三音tri1,tri2,tri3,tri4,tri5

Kaldi单步完美运行AIShellv1S5之三：三音tri12345致谢机器配置Kaldi下AIShellv1详细输出之三：三音triphone第五部分：三音结果更新第六部分：三音Tri1训练、解码、

见性见声·2020-07-07 14:26

ASR之Kaldi

Kaldi官方github地址：https://github.com/kaldi-asr/kaldiKaldi目录结构./tools,./src,./egs这三个目录是比较重要的。.

huang_yx005·2020-07-07 10:48

准备做个魔镜（树莓派+HTK(或者Kaldi)+Opencv+apache）

想法来源几年前就听过别人用树莓派做魔镜的想法，看了下别人的流程感觉挺不错的。不过那时候他们应该还没有完全实现，看来下演示应该只能简单的进行文字交流，不是很智能。现在这个已经是个开源项目，大家可以在下面这里看下详情。上次不小心在哪看到微软已经收购了这个项目，不知道是不是真的。http://michaelteeuw.nl/post/111886383522/magic-mirrors-around-t

cscshaha·2020-07-07 05:15

对于ASR流程的理解

2)格式化标注为Kaldi需要的格式在声学

Xwei1226·2020-07-07 01:21

thchs30跑的输出记录（Mac os）

[riemann@bogon:~/documents/riemann/kaldi/egs/thchs30/s5onmaster]%zsh-x./run.sh✹✭+./run.sh:3>..

RiemannLee·2020-07-06 22:09

ubuntu18.04安装CUDA10-1-local-10.1.168-418.67_1.0-1_amd.deb 以及配置kaldi

ubuntu18.04安装CUDA10-1-local-10.1.168-418.67_1.0-1_amd.deb以及配置kaldi官网下载下来CUDA安装包，然后根据里面的（install）安装提示进行一步步安装

河妖鱼鱼·2020-07-06 12:32

kaldi中的声纹识别

kaldi中的声纹识别文章目录kaldi中的声纹识别kaldi的安装运行aishell例程使用TIMIT数据库进行声纹识别kaldi中声纹识别的流程我的博客：https://yutouwd.github.io

yutouwd·2020-07-06 11:11

5分钟读完 kaldi-pytorch 论文

THEPYTORCH-KALDISPEECHRECOGNITIONTOOLKIT1.论文解读本文讲述了一个开源的pytorch与kaldi结合的工具论文地址https://arxiv.org/pdf/1811.07453v2

hyxxxxxx·2020-07-06 09:52

安装kaldi-GridEngine

安装环境ubuntu14.04在master节点安装GridEngine最好不要用源码安装，会非常痛苦sudoapt-getinstallgridengine-mastergridengine-client当出现自动配置时选择yes当出现需要输入cellname时，可以选择default当需要输入nameofthemaster时，要输入选择的masterhostname，如果输错了最好的方法就是运

xljiulong·2020-07-06 09:04

用kaldi平台跑timit实例

首先安装ubuntu14.04平台，安装好后就开始安装各种kaldi需要的组件，代开终端，在其中输入如下代码安装前的配置sudoapt-getinstalllibtoolsudoapt-getinstallautoconfsudoapt-getinstallwgetsudoapt-getinstallperlsudoapt-getinstallsubversionsudoapt-getinstal

wujianhaoren123·2020-07-06 07:55

推荐频道

Kaldi