E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Kaldi
Kaldi
nnet3 -------- Data Type
本文为
kaldi
官网关于nnet3的译文:简介本文覆盖最新的nnet3。为了了解
Kaldi
里的所有DNN,例如karel的版本,参考DeepNeuralNetworksin
Kaldi
。
会飞行的小蜗牛
·
2017-11-14 15:28
语音识别
音频视频自动提取字幕(extract subtitle from audios and vedios)
自动提取字幕的功能,在国外视频网站Youtube和社交巨头Facebook都已经上线多年,但国内各类视频和音频站都没有类似的功能,所有花了点时间调研了一下subtitle的自动提取功能:1.开源语音识别库,比如
Kaldi
chijiaodaxie
·
2017-10-31 17:14
API
kaldi
训练thchs30详细步骤
一、下载源码,https://github.com/
kaldi
-asr。二、进入thchs30/s5文件夹,修改run.sh里面的数据路径,我才用了直接下载的方式,因为之前没有这方面的数据。
AllyLi0022
·
2017-10-26 16:22
语音
Kaldi
在虚拟机里面安装
建议安装4.8以上版本,登陆最好是root,废话不多说,开始,首先安装虚拟机,虚拟机安装,完成的示意图,快捷键Ctrl+Alt+t打开终端:在终端中键入sudoapt-getupdate命令然后输入密码回车
kaldi
张念
·
2017-10-25 09:00
语音识别
关于咖啡的这些知识你知道吗?
最广泛流传的是:一位名为
Kaldi
的埃塞俄比亚牧羊人发现自己的动物在吃完成熟的咖啡豆后,变得异常兴奋。2、一株咖啡树能活200年以上,当它开始发芽时,顶端的嫩
小星酱01
·
2017-10-10 11:07
Unbuntu16.04+
Kaldi
本地运行timit语料(完整版)
首先准备数据集将数据集放再
kaldi
/egs/timit/data/中解压rarxtimit.rar注:若没有安装rar,可根据相应的提示安装然后修改s
binglel
·
2017-10-03 20:44
Unbuntu16.04+
Kaldi
本地运行thchs30语料(完整版)
之前已经写过如何源码安装
Kaldi
,在此不再赘述,直奔主题!首先,准备清华语料thchs30数据有两种,一种是HTK版,另一种就是
Kaldi
版。
binglel
·
2017-10-01 21:34
kaldı、
kaldi
-ctc的安装(CUDA+CUDNN)
操作系统:Ubuntu14.04(64位)显卡:GTX750TiCUDA版本:7.5(后缀为cuda_7.5.18_linux.run)(截止2019-3-1,
kaldi
仅支持cuda7.5和cuda8.0
落红灬有丶情
·
2017-09-24 21:23
kaldi
语音识别
Kaldi
现在提供 TensorFlow 集成
许多语音识别团队都依靠
Kaldi
,这是一款广受欢迎的开放源代码语音识别工具包。今天,我们宣布
Kaldi
现在提供TensorFlow集成。
DemonHunter211
·
2017-09-18 09:32
深度学习
kaldi
学习笔记-单音素训练
本人初入语音识别一个月,最近开始学习
kaldi
源码。本文介绍
kaldi
语音识别对单音素训练的大致流程。欢迎指正纠错,谢谢。
fengzhou_
·
2017-09-15 22:55
语音识别
kaldi
简单使用笔记***
blog.csdn.net/foolsnowman/article/details/51115204http://blog.csdn.net/quhediegooo/article/details/709414551
Kaldi
AllyLi0022
·
2017-09-14 17:21
语音
kaldi
使用入门
有些内容复制不过来,只好将其链接写到这个地方: 参考资料:http://www.360doc.com/content/15/0203/17/2036337_446008889.shtmlhttp://blog.csdn.net/amds123/article/details/70313780http://blog.csdn.net/hongmaodaxia/article/details/4422
AllyLi0022
·
2017-09-14 16:11
语音识别工具
kaldi
在linux环境下的安装步骤
最近需要进行语音识别的学习,选择了
kaldi
作为开发平台,在尝试了网上的很多安装方法后,寻找了一种最简洁的安装方法,总结如下:第一步:先安装git命令:sudoapt-getinstallgit第二步:
BITgaol
·
2017-09-10 10:29
Kaldi
语音识别工具包简介及安装说明
1
Kaldi
简介
Kaldi
是一个开源的语音识别工具,整合了HTK的基本功能,同时也加入了深度神经网络的分类器(DNN)。
Pandora91
·
2017-09-05 10:42
语音识别
kaldi
kaldi
的timit例子运行到SGMM2 Training & Decoding部分突然中断
跑timit时到SGMM2Training&Decoding部分突然中断,终端中断程序时显示如下:============================================================================SGMM2Training&Decoding=====================================================
lindadasummer
·
2017-08-30 23:20
kaldi例程
kaldi
安装
一、预习安装包(系统Ubuntu)#installsomepackagefirstsudoapt-getinstalllibtoolsudoapt-getinstallautoconfsudoapt-getinstallwgetsudoapt-getinstallperlsudoapt-getinstallsubversionsudoapt-getinstallbuild-essentialsud
Tiger-Gao
·
2017-08-25 19:11
kaldi
Kaldi
脚本分析(6)——解码图构建
Kaldi
中对FST的很多操作与参考文献[1]中稍有不同,尤其是对消歧符号和权重推移等的处理上。其中,G为语言模型FST,输入输出标签相同,都是词,本质为FSA。
Pandora91
·
2017-08-25 11:00
语音识别
kaldi
Kaldi
学习之如何运行脚本
学习
Kaldi
也有两三个星期了,基本上就是对
Kaldi
官网上的说明简单摸索了下,顺便跑了跑自带的例子。
llearner
·
2017-08-25 00:17
语音识别
语音
多媒体
Kaldi
Kaldi
WFST HCLG.fst 构图 学习
HCLG.fst由四部分构成1.G:语言模型WFST,输入输出符号相同,实际是一个WFSA(acceptor接受机),为了方便与其它三个WFST进行操作,将其视为一个输入输出相同的WFST。2.L:发音词典WFST,输入符号:monophone,输出符号:词;3.C:上下文相关WFST,输入符号:triphone(上下文相关),输出符号:monophnoe;4.H:HMM声学模型WFST,输入符号
lucky_ricky
·
2017-08-23 20:12
kaldi
关于找不到库文件.so,.h的万能debug方法
安装使用
kaldi
时,今天又碰到了.so库文件找不到的问题,感觉时编译的时候出了问题,因为要tools里下载依赖(opentsp等),然后去src里安装编译,第一次跑yesnosample的时候通过,后来给
chijiaodaxie
·
2017-08-19 17:12
插件
kaldi
的语音识别数据timit例子详解
本文将以
kaldi
中timit的例程来看整个run.sh脚本的执行过程。数据准备请先进入
kaldi
\egs\timit\s5\这个目录。
DanyHgc
·
2017-07-17 11:47
kaldi
kaldi
安装及yesno实例
Kaldi
是一个非常强大的语音识别工具库,主要由DanielPovey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。
Shmily_Young
·
2017-07-03 16:44
语音识别
使用
kaldi
进行语音自动切分、模型训练和强制对齐
1.只有原始录音和音素标注,进行初次以及多轮的单音素、三音素模型训练,并且基于这些模型进行语音切分:http://pages.jh.edu/~echodro1/tutorial/
kaldi
/
kaldi
-training.html
mx_windforce
·
2017-06-17 23:19
linux
kaldi
force-alignment
kaldi
001 -- 树的内部结构
有关解释整个实现算法以及工具包如何使用,请参阅“如何在
Kaldi
中使用决策树”一节。EventMap类构建决策树代码的主要概念是“事件映射”,由EventMap类型表示。
u012361418
·
2017-06-03 13:00
Kaldi
学习笔记(二)
本文主要解读thchs30/s5/run.sh的主要步骤,以及一些编写脚本过程中可能遇到的问题。对于文中的差错,欢迎各位指正!1.数据准备在处理数据之前,我们要知道thchs30数据集包含三部分:train(训练集)、dev(开发集)和test(测试集)。其中dev的作用是在某些步骤与train进行交叉验证的,如local/nnet/run_dnn.sh同时用到exp/tri4b_ali和exp/
看什么看
·
2017-05-06 11:44
kaldi
thchs30
run-sh
语音识别
Kaldi
学习笔记(一)
工欲善其事,必先利其器,机器、数据、算法对深度学习都非常重要。1机器我先后尝试两台机器以及虚拟机,处理速度差距还是很大的。当前配置:i76700+gtx1060+16G+240GSSD。至少现在的实验流程可以在一天之内完成,用旧机器可能3天都不一定能完成。cpu对于大部分的计算都是至关重要的,尤其是解码步骤,最为耗时,如果能用上可以超频的cpu,速度会快不少吧。gpu主要可以加速dnn训练,据说与
看什么看
·
2017-05-05 11:36
语音识别
有趣的开源软件:语音识别工具
Kaldi
(二)
在上一篇blog中简单的介绍了
Kaldi
的安装方法 有趣的开源软件:语音识别工具
Kaldi
(一) 在这篇blog中继续
Kaldi
模型训练的步骤,介绍一下在模型训练之前的一些数据准备的工作。
算法学习者
·
2017-04-21 13:58
speech
有趣的开源软件:语音识别工具
Kaldi
(一)
最新人工智能论文:http://paperreading.club
Kaldi
是一个非常强大的语音识别工具库,主要由DanielPovey开发和维护。
算法学习者
·
2017-04-21 13:22
speech
kaldi
上第一个免费的中文语音识别例子
今天在清华大学cslt实验室王东老师的分享下,
kaldi
终于有了免费的中文语音识别的例子,网址为:https://github.com/
kaldi
-asr/
kaldi
/tree/master/egs/thchs30
算法学习者
·
2017-04-21 13:14
speech
基于
kaldi
的在线中文识别,online的操作介绍
最近研究了下
kaldi
,也看了好多文章,感觉这方面的有用文章太少!大多停留在编译和深层理论方面。对于我们这种没有基础的人,除了看完编译,就只能很茫然的看哪些高高在上的理论了。本文章,适合那些。
算法学习者
·
2017-04-21 13:21
speech
Kaldi
中文语音识别需要考虑的问题
转自:点击打开链接原文作者:英语流利说团队李飞腾
Kaldi
语音识别1.声学建模单元的选择1.1对声学建模单元加入位置信息2.输入特征3.区分性技术4.多音字如何处理?
会飞行的小蜗牛
·
2017-04-13 09:03
语音识别
如何用
Kaldi
训练一个 DNN 声学模型
英文原文地址:点击打开链接本人译文如下:1.介绍:首先,需要完成标准的GMM-HMM声学模型的训练训练monophonemodel是通过GMM-HMMSystem做utterance-leveltranscriptions,即训练label-audio的映射训练triphonemodel是通过GMM-HMMSystem做phoneme-to-audioaglignments因此,DNN是严格依赖于
会飞行的小蜗牛
·
2017-04-11 21:11
语音识别
Kaldi
HCLG 深入理解
1.相关部分包含的主要任务1.1WFSTKeyConceptsdeterminizationminimizationcompositionequivalentepsilon-freefunctionalon-demandalgorithmweight-pushingepsilonremoval1.2HMMKeyConceptsMarkovChainHiddenMarkovModelForward-
会飞行的小蜗牛
·
2017-04-11 15:10
语音识别
Kaldi
-dnn 学习
1.
Kaldi
中实现的dnn共4种:a.nnet1-基于Karel's的实现,特点:简单,仅支持单GPU,由Karel维护b.nnet2-基于DanielPoveyp-norm的实现,特点:灵活,支持多
会飞行的小蜗牛
·
2017-03-14 21:36
语音识别
Kaldi
学习总结
0.看语音识别相关英文著作时,word的理解1.声学训练时,HMM,GMM都用在什么地方2.P(W|O)的深入理解likelihood的简单理解:P(O|W):给定O,调整W,使得P(O|W)最大3.语音识别过程理解参看这个链接就可以了!点击打开链接3.1解码阶段的总结解码阶段可总结为:教材上的总结--------------------------------------------------
会飞行的小蜗牛
·
2017-02-16 17:26
语音识别
kaldi
run.sh 执行
用于公司研究记录#preparelanguagestuff#buildalargelexiconthatinvovleswordsinboththetraininganddecoding.(echo"makewordgraph..."cd$H;mkdir-pdata/{dict,lang,graph}&&\cp$thchs/resource/dict/{extra_questions.txt,no
dzp443366
·
2017-01-11 14:45
kaldi
数据准备部分,文件解释
若想用已识别的系统对你的数据解码,要重写“数据部分”.直接以thchs30项目为例里面或许会有cmvn.scpfeats.scpreco2file_and_channelsegmentsspk2utttextutt2spkwav.scp文件”text”:包含每段语音的文字意思每行的第一项是录音编号(utterance-id),发音编号后面跟着的是每段录音的标注。文件wav.scp这个文件的格式是大
dzp443366
·
2017-01-05 16:27
kaldi
kaldi
第一阶段:./cmd.sh../path.sh(设置执行路径以及命令脚本名字)ps:decode解码train训练第二阶段:datapreparation(数据准备阶段)执行local/thchs-30_data_prep.sh为了创建:wav.scp,utt2spk.scp,spk2utt.scp,text还有words.txtphone.txt-循环遍历thchs30/thchs30-open
dzp443366
·
2017-01-05 16:34
kaldi
数据准备(快速构建ASR系统)
数据准备在
Kaldi
官方文档中已经有了较为全面、详尽的说明。然而在自己拿到语音数据后,要快速构建一个简单的ASR语音识别系统,对于新手来说,思路可能并不清晰。
lujian1989
·
2017-01-03 17:22
语音识别
Ubuntu16下安装编译
kaldi
kaldi
是一个开源的语音识别工具箱,是基于c++编写的,可以在windows和unix平台上编译首先安装一些依赖的库:执行以下命令udoapt-getinstallautoconfautomakegcclibtoolsubversionlibatlas-devlibatlas-base-devgfortrang
atcmy
·
2016-11-18 15:01
kaldi
笔记——
kaldi
中关于声学模型final.mdl的打印
初学
kaldi
语音识别,在Linux上查看文件不像Windows那么简单易行。
Toby_fbby
·
2016-10-12 10:14
笔记
如何用
kaldi
训练好的DNN模型做在线识别
在已经训练好模型的情况下,需要针对一个新任务做在线识别应该怎么做呢?一种情况是,用已有的声学模型和新训练的语言模型。语言模型可以同srilm等工具训练,但是怎样将语言模型与DNN声学模型一起来进行识别的。SRILM可以用来训练ARPA格式的LM,假设train.txt是语料,wordlist是词汇,假设语言模型的字典和识别器的字典一样,可以按如下办法训练LMngram-count-texttrai
Inger_H
·
2016-10-11 17:55
ASR
kaldi
学习笔记 -- 训练单音素(monophone)模型脚本 -- steps/train_mono.sh
本文介绍了
kaldi
训练monophone脚本的过程,脚本中每个程序的作用以及相关参数配置对训练结果的影响。#!
DuishengChen
·
2016-09-18 17:48
Kaldi
Ubuntu上安装
Kaldi
什么是
Kaldi
?
我把葡萄酿成酒
·
2016-09-01 20:51
语音识别
kaldi
中文语音识别thchs30模型训练代码功能和配置参数解读
Monophone单音素模型的训练#Flatstartandmonophonetraining,withdelta-deltafeatures.#Thisscriptappliescepstralmeannormalization(perspeaker).#monophone训练单音素模型steps/train_mono.sh--boost-silence1.25--nj$n--cmd"$trai
Anymake
·
2016-08-22 11:44
语音识别
kaldi
中lattice操作的几个工具
latgen-faster-mapped:生成latticelattice-scale:Applyscalingtolatticeweightslattice-add-penalty:Addwordinsertionpenaltytothelatticelattice-best-path:Generate1-bestpaththroughlattices;outputastranscription
huchad
·
2016-08-10 16:58
kaldi
一些错误
因为这个例程建立语言模型是用irstlm工具建立的,但是在最新版本的
kaldi
里面,irstlm不是默认编译的。首先进入
kaldi
目录下的tools/extras目录,执行in
蓝色天空2014-09
·
2016-05-30 15:34
语音识别
语音识别工具
Kaldi
环境配置及安装手册(更新加强版)
首先的首先,需要感谢所在研究团队的男神李健和女神姬艳这两位ASR担当。 从硕士到博士,弃武从文(从语音识别到语音生成)。心有不甘,觉得放下太可惜。于是,决定两手抓,两手都要硬,两个领域相辅相成,互相促进。参加今年的ICASSP的时候,感觉到ASR发展的真是太快了,回来之后就觉得应该迅速拾起来,并乐在其中。心血来潮,今天搞了一天,重新“入门”,做个云笔记,希望能帮助他人。一、安装操作系
u013538664
·
2016-05-05 22:00
语音识别
automatic
speech
REC
kaldi
Kaldi
使用笔记
1
Kaldi
安装gitclonehttps://github.com/
kaldi
-asr/
kaldi
.git
kaldi
-trunk--origingoldencd
kaldi
-trunkcdtools/extras
奋斗啊哈
·
2016-04-10 21:34
语音识别
Kaldi
使用笔记
1
Kaldi
安装gitclonehttps://github.com/
kaldi
-asr/
kaldi
.git
kaldi
-trunk--origingolden cd
kaldi
-trunk cdtools
foolsnowman
·
2016-04-10 21:00
上一页
8
9
10
11
12
13
14
15
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他