kaldi 第9页

Kaldi中FST(Finite State Transducer)含义及其可视化

1.FST含义1.1本文仅简单介绍如何利用Kaldi所依赖的工具openfst中的两个函数fstprint和fstdraw可视化FST。默认使用者已经顺利产生了.fst文件。

白水煮蝎子·2020-06-22 12:09

快商通李稀敏：近场声纹识别将普及，本地化的AI能力是刚需

10月26日，第四届Kaldi线下交流会在北京·小米科技园举行。李稀敏博士在以“人机语音交互是否必须要先唤醒和离线语音技术在本地端上的实现是否未来的趋势”为题的圆桌讨论。

VoiceSense·2020-06-22 07:01

kaldi中文语音识别(1)

目录kaldi是什么kaldi与中文语音识别编译与安装kaldi用kaldi进行中文语音识别这3篇博客，详细总结和记录了我编译安装kaldi和两种用kaldi进行中文语音识别的过程，包括如何kaldi的简单介绍

zyziszy·2020-06-21 15:53

美国 AI 的秘密武器——中国人才，国际局势影响人才流动

去年，国际语音识别领域大神级人物，Kaldi之父DanielPovey拒绝了Facebook来到中国选择了小米。上周，英特尔芯片设计师JimKeller离职，中国网友纷纷评论欢迎到中国企业就职。

芒果果·2020-06-21 03:44

《评人工智能如何走向新阶段》后记（再续23）

364.DanielPovey领衔开发第二版语音识别开源工具KaldiKaldi集成了多种语音识别模型，包括隐马尔可夫和深度学习神经网络，被认为是世界语音识别框架的基石。

AI科技大本营·2020-06-20 20:30

Kaldi中MFCC计算源码剖析（二）

在上一篇文章中提到以下四块内容将在本文进行进一步剖析：1、计算mel滤波器组：MelBanks&mel_banks=*(GetMelBanks(vtln_warp));2、fft后的信号计算功率谱：ComputePowerSpectrum；3、功率谱过mel滤波器组：mel_banks.Compute；4、dct_matrix_的计算。一、GetMelBanks该函数在src/feat/featu

MorganCui·2020-04-07 16:34

kaldi 常用命令总结（持续更新）

1.查看.mat矩阵的维度信息>matrix-dimexp/tri5a_lstm_train_sp_ali/final.mat401442.查看tree信息>tree-infoexp/tri5a_lstm_train_sp_ali/treenum-pdfs3048context-width3central-position13.特征提取相关提取mfccsteps/make_mfcc.sh--nj1

习惯了千姿百态·2020-04-03 23:08

CVTE 开源模型识别效果

模型下载地址：http://kaldi-asr.org/models/0002_cvte_chain_model.tar.gz解压放到kaldi-trunk/egs下即可，打开终端，链接steps和untils

诸葛村姑·2020-04-02 14:44

Linux kaldi安装教程

环境：Linux1.下载kaldigitclonehttps://github.com/kaldi-asr/kaldi.git2.进入到kaldi/tools目录make-j4可以根据CPU核心数调整，

v-space·2020-03-28 21:27

Kaldi(A2)语音识别术语、HMM拓扑与转移模型

RefKaldiHMMhttp://kaldi-asr.org/doc/hmm.htmlTriphone三音素Ref:语音的基本概念http://blog.csdn.net/zouxy09/article

Seeker_zz·2020-03-23 14:28

Kaldi(A5)语言模型及HCLG.fst生成

RefOnlinedecodinginKaldi(Nnet2)http://kaldi-asr.org/doc/online_decoding.html修改语言模型首先，我们为什么要修改语言模型？

Seeker_zz·2020-03-21 15:46

Kaldi中说话人识别打分流程

参考脚本：egs/voxceleb/v2提取Xvector假设我们已经完成了train.sh的训练，并生成了相应的模型数据，诸如：final.raw,mean.vec.plda.transform.mat等确认必要文件存在模型目录下须有final.raw、min_chunk_size、max_chunk_size数据目录下须有feats.scp、vad.scp根据final.raw和extract

黑白格_0ca6·2020-03-17 09:45

Git-查看当前的远程仓库

来设定远程仓库的名字为，比如如下使用了--originupstream）$gitremoteupstream-v显示对应的克隆地址[email protected]:kaldi-asr

kaituoxu·2020-03-06 19:21

[Kaldi] 特征提取--MFCC(一)

20180629qzd一准备工程目录文件建立在thch30上进行的。s5├───conf├───local├───step├───utils└───data/data_thchs30/(数据)├───train/*.wav├───dev/*.wav└───test/*.wav二数据准备在data内新建train文件夹，这个文件夹内需要三个文件：wav.scp、utt2spk、spk2utt。dat

原来是酱紫呀·2020-03-05 02:32

深度学习 CNTK使用入门

如，Theano，caffe，kaldi，CNTK等。CNTK是微软提供的基于C++的开源工具包。

xiaozhuo12138·2020-02-26 17:56

kaldi-gpu配置

本篇主要介绍cuda的安装以及kaldi下的配置cuda官网下载对应版本https://developer.nvidia.com/compute/cuda/9.2/Prod/patches/1/cuda-repo-ubuntu1604

泉泉酱·2020-02-24 02:34

Kaldi(A4)model文件分析

RefDan'sDNNimplementationhttp://kaldi-asr.org/doc/dnn2.htmlKaldiLecture4DecodersusedintheKalditoolkithttp

Seeker_zz·2020-02-22 02:16

[Kaldi] 特征提取--MFCC(二)

20180701qzd本章讲解mfcc理论知识一基本含义MFCC是Mel-FrequencyCepstralCoefficients的缩写，顾名思义MFCC特征提取包含两个关键步骤：转化到梅尔频率，然后进行倒谱分析。1.梅尔频率梅尔刻度是一种基于人耳对等距的音高(pitch)变化的感官判断而定的非线性频率刻度。和频率的赫兹的关系如下:所以当在梅尔刻度上面上是均匀分度的话，对于的赫兹之间的距离将会越

原来是酱紫呀·2020-02-17 02:18

CUDA的安装和tri2b模型的在线解码

安装过程基本参照kaldi全部资料0.7版的教程来，但发现总是编译不出来./cu-vector-test，期间重装了一次系统，最后终于好

诸葛村姑·2020-02-16 10:50

语音开源代码与平台

----AlanMathisonTuring一.语音开源代码1.KaldiKaldi诞生于2009年的JohnsHopkinsUniversity，刚开始项目重点是子空间高斯模型（SGMM）建模和词汇学习抽样调查

Singularity_·2020-02-13 09:45

在ubuntu16.04上用kaldi运行timit语音库的教程网页

755790032.https://blog.csdn.net/u010837794/article/details/632517253.http://blog.geekidentity.com/asr/kaldi

伊恩的道歉·2020-02-05 03:01

Kaldi中说话人识别尝试|TIMIT

参考资料1.kaldi基础介绍（一）在说话人识别中的数据准备-monsieurliaxiamen的博客-CSDN博客2.kaldi中改写sre10/v1用timitdataset做说话

黑白格_0ca6·2020-02-01 23:28

Kaldi语音识别CVTE模型实战

一.下载训练好的模型下载路径：http://kaldi-asr.org/models/m2二.上传&配置1.上传到kaldi/egs/目录下2.解压，tar-zxvf0002_cvte_chain_model_v2

云山之巅·2020-01-15 09:00

Kaldi基础代码库及建模

云山之巅·2020-01-14 11:00

Kaldi样例实战

一.前提条件在kaldi目录下的子目录kaldi/egs/目录下保存着资源管理示例脚本。查看该目录中的README.txt文件，尤其是查看资源管理部分，它提到与语料库相对应的LDC目录号。

云山之巅·2020-01-13 14:00

我们基于kaldi开发的嵌入式语音识别系统升级成深度学习啦

先前的文章《三个小白是如何在三个月内搭一个基于kaldi的嵌入式在线语音识别系统的》说我们花了不到三个月的时间搭了一个基于kaldi的嵌入式语音识别系统，不过它是基于传统的GMM-HMM的，是给我们练手用的

davidtym·2019-12-30 08:00

Kaldi(A1)语音识别原理

Ref语音识别的原理https://www.zhihu.com/question/20398418HTKBookhttp://www.ee.columbia.edu/ln/LabROSA/doc/HTKBook21/HTKBook.html如何用简单易懂的例子解释隐马尔可夫模型？https://www.zhihu.com/question/20962240/answer/33438846《统计学习

Seeker_zz·2019-12-28 17:56

睡前故事|咖啡的来历

这一天，南柯讲给睡前要吃糖的小喵们讲了一个咖啡来历的故事在1400年前的埃塞俄比亚，有一个叫kaldi的放羊老头在山上放羊，日光正烈，晒得百无聊赖的ka

南柯斯摩·2019-12-24 23:25

食羊记III

很久很久以前，一个生活在非洲埃塞俄比亚的名叫卡尔迪（Kaldi）的少年，有一天发现他饲养的羊兴奋地直跳，就把这个奇怪的现象告诉了附近的修道院。

持明院主·2019-12-19 21:07

Kaldi命令词识别

kaldi刚刚拿到一个简单语料库练手，发现只有语音和对应文字，这篇文章记录了从数据预处理到kaldi对数据进行训练和测试的全过程，这里首先训练单音节模型，其他模型后面再补充。

zqh_zy·2019-12-18 10:02

Kaldi-Timit脚本

数据准备local/timit_data_prep.sh生成的内容放在data/local/data中。对于train、test和dev，分别生成相应的_sph.flist、_sph.scp、.uttids、.trans、.text、_wav.scp、.utt2spk、.spk2utt、.spk2gender、.stm和.glm文件。NOTE:.wavfilesarenotreally.wav,t

kaituoxu·2019-12-18 06:29

kaldi 如何自制语料来做中文识别

跑完thchs30后就琢磨着自己录些语料训练和识别，那就开始从网上看资料，大家都推荐按KaldiforDummiestutorial的例子来做，我也跟着例子来写文件。

知行健康·2019-12-17 02:50

kaldi编译与安装

首先下载kaldi包gitclonehttps://github.com/kaldi-asr/kaldi.git然后安装依赖库进toolscdtoolstools文件运行.

知行健康·2019-12-14 22:38

语音识别

mfcc提取：http://blog.csdn.net/jojozhangju/article/details/18678861语音识别工具箱之kaldi----研究联盟：http://blog.csdn.net

hou_8·2019-12-14 16:45

编译kaldi扩展工具irstlm

版本：Fedorarelease25(TwentyFive)gccversion6.3.120161221(RedHat6.3.1-1)(GCC)为什么单独拿出来这个说呢？因为从GCC6开始，gcc已经提供cstdlib，这时如果在再使用-isystem，就会报错Infileincludedfrom/usr/include/c++/6.3.1/ext/string_conversions.h:41

喜欢看做饭·2019-12-14 11:11

日志

/////////////////////////////////////mengweilun@mengweilun-Lenovo-ideapad-Y700-15ISK:~/kaldi-master/egs

伊恩的道歉·2019-12-14 10:08

timit实例训练

1.进入对应的目录，进行如下操作：zhangju@ubuntu:~$cdkaldi-trunk/egs/timit/s5/zhangju@ubuntu:~/kaldi-trunk/egs/timit/s5

伊恩的道歉·2019-12-14 04:16

Kaldi语音识别快速入门

一.简介Kaldi是使用C++编写的语音识别工具包，ApacheLicensev2.0许可。主要供语音识别研究人员使用。Kaldi的目标和范围与HTK类似。目标是拥有易于修改和扩展的现代而灵活的代码。

云山之巅·2019-12-11 19:00

Kaldi(A0)安装

简介Kaldi是什么大家百度一下就知道了。大概就是一堆语音识别和处理有关的程序包啦。

Seeker_zz·2019-12-08 14:36

kaldi环境配置：ubuntu16.04+nvidia375+cuda8.0避坑安装

配这个环境大概也就重装了三遍吧（微笑）这条针对双系统重装ubuntu的同学：easybcd删除引导然后win+x删除分区启动盘格式化NTFS格式重新做ubuntuU盘镜像（我也不知道为什么！！）分区(参考http://www.jianshu.com/p/2eebd6ad284d)1)分配16G空间给/分区，选择“主分区”、“空间起始位置”、Ext4和“挂载点/”2)分配16G空间给swap分区，选

鱼绿子·2019-12-07 10:54

[Kaldi] 孤立词识别(yesno)(一)

20180627qzd一数据准备waves_yesno总共60个wav文件,采样率都是8k,wav文件里每一个单词要么”ken”要么”lo”(“yes”和”no”)的发音,所以每个文件有8个发音,文件命名中的1代表yes发音,0代表no的发音.数据准备local/prepare_data.shwaves_yesno生成wavelist文件生成waves.test和waves.train将waves

原来是酱紫呀·2019-12-06 14:34

音频工具kaldi部署及模型制作调研学习

语音识别简介语音识别（speechrecognition）技术，也被称为自动语音识别（英语：AutomaticSpeechRecognition,ASR）、计算机语音识别（英语：ComputerSpeechRecognition）或是语音转文本识别（英语：SpeechToText,STT），其目标是以计算机自动将人类的语音内容转换为相应的文字。按照不同纬度如下分类：按词汇量（vocabulary）

努力跑在岁月之前·2019-12-02 18:00

邀你加入小米语音首席科学家Daniel Povey团队

10月19号，语音识别开源工具Kaldi的创始人、语音和AI领域大佬DanielPovey正式加入小米。

小米手机·2019-12-02 00:00

kaldi安装srilm及使用

今天看语言模型如何生成，很多资料都提示用srilm来生成，那就搜索如何安装和使用。在网上查了很多资料都没搞定，花了4个小时左右终于安装完成并能做简单测试，这里简单记录一下整个过程。准备工作先参考SRILM的安装与使用文章，安装各种依赖，其中查看依赖，直接输入which包名即可，例如检查gawk是否安装，输入命令whichgawk查看是否存在，把没有安装的依赖包安装好。要特别注意TCL的安装，下载地

知行健康·2019-11-30 22:45

如此科技的一周 | 小米周报

小米语音首席科学家、语音识别开源工具Kaldi的创始人、语音和AI领域大佬DanielPovey，也带来主题演讲，和大家分享了他即将带领全新团队打造新一代“PyTorch-y”Kaldi的计划

小米手机·2019-11-22 00:00

小爱同学3.0正式发布！对Ta说“立即升级”就能体验

11月20日，语音识别开源工具Kaldi的创始人、语音和AI领域大佬DanielPovey，出席「小米AI生态峰会暨小爱同学3.0发布会」。

小米手机·2019-11-20 00:00

小爱同学3.0正式发布！对Ta说“立即升级”就能体验

11月20日，语音识别开源工具Kaldi的创始人、语音和AI领域大佬DanielPovey，出席「小米AI生态峰会暨小爱同学3.0发布会」。

小米手机·2019-11-20 00:00

小爱同学3.0正式发布！对Ta说“立即升级”就能体验

11月20日，语音识别开源工具Kaldi的创始人、语音和AI领域大佬DanielPovey，出席「小米AI生态峰会暨小爱同学3.0发布会」。

小米手机·2019-11-20 00:00

2019-01-16

I'mtrainingKaldi'sAishellmandarinmodeltoday,andtherecomeserror""Failedtoallocateamemoryregionof5625610240bytes.PossiblythisisduetosharingtheGPU.TryswitchingtheGPUstoexclusivemode

汪汝鹤Carl·2019-11-08 17:10

实验室cuda安装

以下是实验室linux服务器cuda安装和kaldi带cuda编译的流程，在pcc和pc上测试通过。

雨月梵雨时鸢·2019-11-05 22:13

推荐频道

kaldi

Kaldi中FST(Finite State Transducer)含义及其可视化

快商通李稀敏：近场声纹识别将普及，本地化的AI能力是刚需

kaldi中文语音识别(1)

美国 AI 的秘密武器——中国人才，国际局势影响人才流动

《评人工智能如何走向新阶段》后记（再续23）

Kaldi中MFCC计算源码剖析（二）

kaldi 常用命令总结（持续更新）

CVTE 开源模型识别效果

Linux kaldi安装教程

Kaldi(A2)语音识别术语、HMM拓扑与转移模型

Kaldi(A5)语言模型及HCLG.fst生成

Kaldi中说话人识别打分流程

Git-查看当前的远程仓库

[Kaldi] 特征提取--MFCC(一)

深度学习 CNTK使用入门

kaldi-gpu配置

Kaldi(A4)model文件分析

[Kaldi] 特征提取--MFCC(二)

CUDA的安装和tri2b模型的在线解码

语音开源代码与平台

在ubuntu16.04上用kaldi运行timit语音库的教程网页

Kaldi中说话人识别尝试|TIMIT

Kaldi语音识别CVTE模型实战

Kaldi基础代码库及建模

Kaldi样例实战

我们基于kaldi开发的嵌入式语音识别系统升级成深度学习啦

Kaldi(A1)语音识别原理

睡前故事|咖啡的来历

食羊记III

Kaldi命令词识别

Kaldi-Timit脚本

kaldi 如何自制语料来做中文识别

kaldi编译与安装

语音识别

编译kaldi扩展工具irstlm

日志

timit实例训练

Kaldi语音识别快速入门

Kaldi(A0)安装

kaldi环境配置：ubuntu16.04+nvidia375+cuda8.0避坑安装

[Kaldi] 孤立词识别(yesno)(一)

音频工具kaldi部署及模型制作调研学习

邀你加入小米语音首席科学家Daniel Povey团队

kaldi安装srilm及使用

如此科技的一周 | 小米周报

小爱同学3.0正式发布！对Ta说“立即升级”就能体验

小爱同学3.0正式发布！对Ta说“立即升级”就能体验

小爱同学3.0正式发布！对Ta说“立即升级”就能体验

2019-01-16

实验室cuda安装