E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Kaldi
【
kaldi
学习.4】Aishell V1(说话人识别、声纹识别)中的run.sh详解
做声纹识别就要选择aishell/V1,这里是
kaldi
的github地址:https://github.com/
kaldi
-asr/
Colleen_oh
·
2019-05-24 14:11
Kaldi
安装
1.git下载源码gitclonehttps://github.com/
kaldi
-asr/
kaldi
.git
kaldi
-trunk--origingolden2.安装cdtools目录cd
kaldi
-trunk
kyle_liao
·
2019-05-23 17:00
kaldi
语音识别:yesno模型图形化lattice(又叫词图)
article/details/81737937https://blog.csdn.net/yutianzuijin/article/details/77621511那么把lattice打印出来,需要用到
kaldi
boyStray
·
2019-05-18 11:07
【
Kaldi
学习】了解+搭建
kaldi
环境
因为自己工作上的需求,近期接触了很多NLP的领域,所以学习这个强大的
kaldi
模型是肯定不可少的,下面是我的体会,有问题直接提出来啦!!
Colleen_oh
·
2019-04-29 11:31
kaldi
中的i/o机制(代码级)
语音中用得比较多的工具箱就是
kaldi
了,
kaldi
的初步学习是从某个模型的脚本开始,单步运行。可以参考一下网上的一些博客,例如这篇,还是比较容易跑通第一个aishellv1的demo的。
哈哈进步
·
2019-04-28 14:05
语音相关
kaldi
Kaldi
初体验(一):安装
最近对
Kaldi
这个工具箱有了一些粗浅的体验,踩了不少坑。于是就稍微整理了一下。下载代码
Kaldi
托管在GitHub上,首先需要将代码下载到本地。
indes
·
2019-04-17 00:00
语音
kaldi
第一步安装
kaldi
测试yesno
Kaldi
是一个非常强大的语音识别工具库,主要由DanielPovey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。
liuliqun520
·
2019-04-08 21:40
编辑器
语音识别安装包
kaldi
做aishell的nnet3训练耗时44个小时
kaldi
做aishell,其中倒数第3步是local/nnet3/run_tdnn.sh,一共花了44个小时,主机配置32G内存,E31231V3,2个gtx9502G的显卡,机械硬盘。
boyStray
·
2019-04-07 16:01
工具
语音识别传统方法(GMM+HMM+NGRAM)概述
部门起了个新项目,要用到语音识别(准备基于
Kaldi
来做)。我们之前做的传统音频已基本成熟,就开始关注在语音识别上了。
davidtym
·
2019-04-02 19:00
kaldi
解码器在嵌入式平台运行
该博文属于系列文章,其他文章参考总览:
kaldi
嵌入式平台的移植及实现前言前面的博文
kaldi
源码的交叉编译已经将嵌入式平台的解码器编译完成,解码器有GMM、nnet2、nnet3等等,GMM解码器又分为单音素
遇逆境处之泰然
·
2019-03-18 15:35
Linux
C/C++
语音识别
Kaldi
中解码代码解析
以
Kaldi
中LatticeFasterOnlineDecoder为例,解析解码代码。
期望最大化
·
2019-03-15 15:58
kaldi
总结
一、相关软件及包的安装将
kaldi
从github下载到本地,进去
kaldi
目录下,根据INSTALL进入
kaldi
目录下的src和tools,按照目录下的INSTALL将依赖包和库都安装好。
liangym
·
2019-03-14 13:09
kaldi
中的chain model(LFMMI)详解
如下图所示:对应
kaldi
中的结构定义为:12345678…00100.510.51在
kaldi
中,把Sp和Sb看做同一个状态(都对应state0),只是pdfclass不同。ForwardPdfCl
asrgeek
·
2019-03-10 18:42
语音识别
声学模型
chain
model
kaldi
基于
kaldi
训练唤醒词模型的一种方法
本文基于开源语音识别
kaldi
平台,实现一个唤醒模
遇逆境处之泰然
·
2019-03-07 14:59
C/C++
语音识别
kaldi
在工程项目中使用的总结
前面几篇文章在以iOS客户端为例的情况下,大致说了
kaldi
部署在服务端的在线识别,以及
kaldi
在iOS项目中的本地识别。
长风浮云
·
2019-03-05 22:56
kaldi
入门笔记记录
1.参数资料主要参考这个pdf:https://download.csdn.net/download/gui694278452/109831132.
kaldi
安装:https://blog.csdn.net
salonhuang-
·
2019-03-01 15:45
音频处理
语音识别工具
kaldi
安装(一)
Kaldi
是一个非常强大的语音识别工具库,主要由DanielPovey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。
salonhuang-
·
2019-03-01 14:46
音频处理
语音识别——TDNN时延神经网络
richard2357/article/details/16896837https://zhuanlan.zhihu.com/p/28283265http://pelhans.com/2018/02/11/
kaldi
-not
qq_14962179
·
2019-02-28 10:32
语音识别
kaldi
+解码器详解1(非实时流)
kaldi
官方给出的解码命令是online2-wav-nnet3-latgen-faster,它的源码我在“基于
kaldi
的iOS语音识别(本地)+05+解码”已经贴出来了,下面就来详细讲解它解码的过程
长风浮云
·
2019-02-26 10:50
kaldi
语音识别 lattice-free MMI声学训练
KK在语音识别领域,DT训练能显著提高语音识别系统的性能。DT训练需要所有的单词序列组合来做训练。一般而言我们会先利用交叉熵准则训练一个基准模型,配合使用一个相对较弱的语言模型生成相应的词图(lattice).Lattice里面除了包含与正确识别结果相对应的路径外,还包含与正确路径足够接近的其它路径。DT训练就是要提高模型走正确路径的概率,同时压低走相似路径的概率。近年来CTC(Connectio
qq_14962179
·
2019-02-25 11:04
语音识别
2018年实现的工程项目
语音增强&语音增益处理(深度学习)语音分离&说话人的分离语音时序分割,及所属说话人打标签(机器学习)静音检测标记、语速检测标记、情感识别标签预研了TTS-文字转语音的算法&本文处理&预研智能聊天机器人&
kaldi
梅逊雪
·
2019-01-15 14:13
音频开发
文本分类
自然语言处理
机器人开发
Fbank特征与MFCC特征解析
详细的fbank特征介绍见
Kaldi
特征提取之-FBank,可以运行其MATLAB代码,然后结合这篇博客FBank与MFCC的介绍一起看其中需要自己注意的是:FBank与MFCC特征提取的区别:fbank
Bonner1
·
2019-01-15 10:13
语音信号处理
语音识别TDNN-F声学模型
kaldi
中的例
诸葛村姑
·
2019-01-12 17:55
雷神911Target(双显卡)双系统Ubuntu安装显卡驱动和CUDA
因为想要使用笔记本学习
kaldi
,需要使用Ubuntu搭建环境。
Yeelearn
·
2018-12-09 12:35
嵌入式平台
kaldi
源码的交叉编译
该博文属于系列文章,其他文章参考总览:
kaldi
嵌入式平台的移植及实现前言:在编译
kaldi
源码时,请先参照https://www.jianshu.com/p/05e1bbe0ca3a这篇文章在x86平台能够编译后
遇逆境处之泰然
·
2018-11-29 11:58
Linux
语音识别
嵌入式平台Portaudio的交叉编译
该博文属于系列文章,其他文章参考总览:
kaldi
嵌入式平台的移植及实现前言:PortAudio是一个免费的、跨平台的、开放源码的音频I/O库,
kaldi
在onlinegmm针对流式解码时,使用了该开源框架
遇逆境处之泰然
·
2018-11-29 11:10
Linux
语音识别
嵌入式平台Alsa的交叉编译
该博文属于系列文章,其他文章参考总览:
kaldi
嵌入式平台的移植及实现前言:alsa的介绍不多说,自行百度...
遇逆境处之泰然
·
2018-11-29 11:04
Linux
语音识别
嵌入式平台openFst的交叉编译
该博文属于系列文章,其他文章参考总览:
kaldi
嵌入式平台的移植及实现前言:openfst的介绍就不必了,大家自行百度,下面进入正题。
遇逆境处之泰然
·
2018-11-29 11:31
Linux
语音识别
kaldi
嵌入式平台的移植及实现
本系列包含内容分以下几篇文章介绍:1.openFst的交叉编译2.数学库OpenBlas及Clapack的交叉编译3.音频接口Alsa的交叉编译4.音频框架portaudio的交叉编译(基于音频流处理,详细参考
kaldi
遇逆境处之泰然
·
2018-11-29 11:27
Linux
语音识别
声纹识别开源代码工具
3.
kaldi
,当下十分流行的语音识别工具包,也包括声纹识别:覆盖了主流的声纹识别算法(I-vector、x-ve
虚生
·
2018-11-22 14:00
安装
Kaldi
-ctc
流利说将
kaldi
-ctc开源:https://github.com/lingochamp/
kaldi
-ctc训练使用的是warp-ctc接口;解码网络使用的是WFST,在传统的HCLG中加入blank
麻羽人三
·
2018-11-09 11:49
kaidi
Kaldi
学习笔记--实例yesno
参考:https://blog.csdn.net/nsh119/article/details/81587462https://blog.csdn.net/shichaog/article/details/73264152https://www.cnblogs.com/welen/p/7485151.htmlyesno是关于yes和no两个孤立词的识别,该实例是一个非常小的数据集,每一条记录都是一
哆啦A梦~~~
·
2018-10-31 17:09
kaldi
运行cvte开源chain模型
kaldi
ASRmodelcvtechain编译
kaldi
下载
kaldi
包gitclonehttps://github.com/
kaldi
-asr/
kaldi
.git然后安装依赖库进cdtoolstools
YoungMiao
·
2018-10-23 18:59
语音识别
Kaldi
(一)
Kaldi
Kaldi
是一个语音识别的工具包。它由DanielPovey于2009年创建。DanielPovey,JohnsHopkinsUniversity副教授。
antkillerfarm
·
2018-10-22 09:52
语音识别
kaldi
中文语音识别thchs30模型训练
1.准备thchs30中文数据集今天开始做语言模型啦,数据集采用的是清华大学的中文数据集thchs30,下载地址在http://www.openslr.org/18/,由于是在服务器做训练,以下步骤均采用shell语句进行。1.1在服务器上使用shell命令(wget-P目录网址)下载thchs30,并保存到指定文件(egs/thchs30/s5/thchs30-openslr)wget–pegs
Dreamy_Z
·
2018-10-09 15:03
语音识别
kaldi
中文语音识别thchs30模型训练
1.准备thchs30中文数据集今天开始做语言模型啦,数据集采用的是清华大学的中文数据集thchs30,下载地址在http://www.openslr.org/18/,由于是在服务器做训练,以下步骤均采用shell语句进行。1.1在服务器上使用shell命令(wget-P目录网址)下载thchs30,并保存到指定文件(egs/thchs30/s5/thchs30-openslr)wget–pegs
Dreamy_Z
·
2018-10-09 15:03
语音识别
开源语音数据集
它已被分割并正确对齐,如果你正在寻找一个起点,请查看已准备好的声学模型,这些模型在
kaldi
-asr.org和语言模型上进行了训练,适合评估。
chenghaoy
·
2018-09-25 17:10
音频处理
kaldi
中文语音识别平台的搭建——运行thchs30
kaldi
资料的准备:《
Kaldi
学习笔记(三)——运行thchs30(清华大学中文语料库)》运行
kaldi
中的自带样例:《
Kaldi
学习笔记(四)——thchs30中文在线识别》thchs30的主要搭建过程参照以上两篇博客
Alexwym
·
2018-09-25 15:19
大数据与机器学习
Kaldi
的安装
Kaldi
的安装
Kaldi
是一个用C++编写的语音识别工具包,旨在供语音识别研究人员使用。
Dreamy_Z
·
2018-09-20 11:48
语音识别
Kaldi
的安装
Kaldi
的安装
Kaldi
是一个用C++编写的语音识别工具包,旨在供语音识别研究人员使用。
Dreamy_Z
·
2018-09-20 11:48
语音识别
Kaldi
(一)安装编译
需要克隆下来
kaldi
源码,编译安装从github克隆下来源码:gitclonehttps://github.com/
kaldi
-asr/
kaldi
.git代码里有3个目录比较重要,分别是egs;src
圆滚滚的大营子
·
2018-09-19 21:03
MAC Anaconda创建python2环境 安装
kaldi
MACAnaconda创建python2环境安装
kaldi
1.什么是
kaldi
kaldi
是一个用于语音是识别的开发平台(工具包),目前已经较为成熟,文档很多,相关资料很多。
aidanmo
·
2018-09-19 21:01
kaldi
中一些文件的可视化
可视化命令位于编译好的
kaldi
路径中,以下是自己实际中的例子,其它的情况可以类推:ali文件可视化/home/gpu-server02/
kaldi
-master-20171215/src/bin/copy-int-vector
Xiao_Song_PKU
·
2018-09-14 11:24
学习记录——机器学习
Kaldi
aishell2 GMM训练步骤(含aishell1语料转aishell2组织方式)
0前言中文语音识别的aishell2推出已经有一段时间了,由于没有aishell2的语料库,有资格的可以申请,所以拿aishell1的15G语料进行训练,所以写了相关的脚本处理aishell1的语料库,来适配aishell2,可以参考我的github仓库aishell2_gmm_train1语料转换下载完aishell1的语料后,将data_aishell.tgz解压后的语料放在egs/aishe
遇逆境处之泰然
·
2018-09-12 22:42
语音识别
Kaldi
运行thchs30中文语音识别教程
:Ubuntu16.04建议:仔细地按照此教程来,有些人中间出错是因为没仔细按照教程的步骤和细节文档更新时间:20180713使用thchs30训练最后的识别准确率约:64%运行thchs30步骤安装
kaldi
顺其灬自然丨
·
2018-09-09 19:28
Kaldi语音识别
kaldi
中文语音识别_基于thchs30(8)
接上回,我们继续看run.sh#copyfeatsandcmvntotest.ph,avoidduplicatedmfcc&cmvn#拷贝mfcc特征和cmvn到test.ph,避免重复的mfcc和cmvncpdata/mfcc/test/feats.scpdata/mfcc/test_phone&&cpdata/mfcc/test/cmvn.scpdata/mfcc/test_phone||ex
52Babara
·
2018-09-07 13:32
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
【
Kaldi
新手入门】手把手教你搭建简易英文数字ASR系统
*写作本文的目的:一方面是为了帮助
Kaldi
的新手更好的入门这个语音识别工具,另一方面是为自己的学习做一个笔记,也方便日后的学习查阅.
顺其灬自然丨
·
2018-09-05 15:58
Kaldi语音识别
kaldi
test for yesno
check_depend.sh3sudoapt-getsoftwaresneededbystep24sudoapt-getinstalllibatlas-devubuntu18.08'slibatlas-devversionisnewerthan
kaldi
needed
安装怪
·
2018-08-24 16:15
kaldi
中文语音识别_基于thchs30(7)
接上回,mfcc特征咱们暂时看完了,总结一下,此处引用别人的分析:特征提取MFCCcompute-mfcc-feats.ccCreateMFCCfeaturefiles.Usage:compute-mfcc-feats[options...]其中参数rspecifier用于读取.wav文件,wspecifier用于写入得到的MFCC特征。典型应用中,特征将被写入到一个大的”archive”文件,同
52Babara
·
2018-08-22 17:45
语音识别
ASR
中文识别
语音处理
音视频开发系统技术专题
语音识别——
kaldi
HMM-GMM全部训练脚本分解
文章目录train_mono.shtrain_deltas.shtrain_lda_mllt.shtrain_sat.shtrain_mono.sh单音素训练脚本://初始化,[topofeats]->[0.mdltree]gmm-init-mono//生成训练图,[0.mdltextl.fst]->[train.fst]compile-train-graph//对标签进行初始化对齐[train.
Audior
·
2018-08-20 18:55
语音识别
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他