E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
【kaldi】
kaldi
中CD-DNN-HMM网络参数更新公式手写推导
在基于DNN-HMM的语音识别中,DNN的作用跟GMM是一样的,即它是取代GMM的,具体作用是算特征值对每个三音素状态的概率,算出来哪个最大这个特征值就对应哪个状态。只不过以前是用GMM算的,现在用DNN算了。这是典型的多分类问题,所以输出层用的激活函数是softmax,损失函数用的是crossentropy(交叉熵)。不用均方差做损失函数的原因是在分类问题上它是非凸函数,不能保证全局最优解(只有
davidtym
·
2019-11-05 08:00
声音的响度Python
kaldi
Cntkhttps://segmentfault.com/q/1010000009158922提取语音的响度https://github.com/faroit/awesome-python-scientific-audiogit
美环花子若野
·
2019-11-03 04:40
4.
kaldi
平台运行yesno的例子
1.
kaldi
平台运行yesno的例子运行run.sh(键入.
诸葛村姑
·
2019-11-02 16:15
咖啡起源与历史
牧羊人的故事图片发自App公元6世纪前后,在非洲埃塞俄比亚的高原上,牧羊人卡尔迪(
Kaldi
)突然发现羊群疯狂地喧闹起来,经过多次探查,才发现每当羊群吃了一种野生灌木的果实之后,就会不由自主地呈兴奋状态
半盏蔷薇
·
2019-11-02 06:21
kaldi
例程timit运行与理解
语料准备首先是语料的获取,我是从
kaldi
新手QQ群上获取到的语料,而该语料的文件与yesno有较大区别,除了wav文件外还包含了三个描述文件,具体含义可以参考readme文档了解。
知行健康
·
2019-11-01 22:07
语音识别大牛Daniel Povey为何加入小米?“手机+AIoT”强大生态,开源战略是关键...
utm_source=aicamp整理|夕颜出品|AI科技大本营(ID:rgznai100)10月17日,语音识别开源工具
Kaldi
创始人,语音和AI领域大牛DanielPovey在10月19日,小米集团副总裁
AI科技大本营
·
2019-10-21 12:42
[
kaldi
] 特征文件格式转换
20190108qzd1.
kaldi
中的ark文件与htk中的mfcc文件的互相转换(1)ark转mfcc使用底层命令copy-feats-to-htkSavefeaturesasHTKfiles:每个发音会转化为一个对应的
原来是酱紫呀
·
2019-10-19 17:48
拒绝美式政治正确,他负气出走,选择来中国
关键词:DanielPovey,
Kaldi
,入职小米当地时间10月17日凌晨3点,开源语音识别工具包
Kaldi
之父DanielPovey,发布推特透露,自己即将跟小米签合同,并于今年年底正
超神经HyperAI
·
2019-10-19 14:50
人工智能
nlp
拒绝美式政治正确,他负气出走,选择来中国
关键词:DanielPovey,
Kaldi
,入职小米当地时间10月17日凌晨3点,开源语音识别工具包
Kaldi
之父DanielPovey,发布推特透露,自己即将跟小米签合同,并于
HyperAI超神经
·
2019-10-18 17:02
美国AI语音大牛转投小米!因政治正确遭名校JHU开除,其后怒拒FB百万美元合同...
他打造的语音识别开源工具包
Kaldi
,集成了各种用于语音识别的模型,是语音识别领域的重要基础。此前Facebook邀约加盟,据说直接开出百万美元合同。△Via褚明宇:Dan在上海但因不堪
QbitAl
·
2019-10-18 12:54
怒拒 Facebook 后,语音识别大牛、
Kaldi
之父将加盟小米
文|I/O雷锋网消息,10月17日,国际语音识别领域的大神级人物、前约翰霍普金斯大学(JonhsHopkinsUniversity)教授、语音识别开源工具
Kaldi
之父DanielPovey在个人Twitter
机器学习算法与Python学习-公众号
·
2019-10-18 12:00
确认!语音识别大牛Daniel Povey将入职小米,曾遭霍普金斯大学解雇,怒拒Facebook
(ID:rgznai100)【导读】10月17日,语音界传奇DanielPovey发布推特,宣布自己2019年末将要入职小米,目前正在签订合同阶段,入职后,他将带领一支团队研发下一代PyTorch-y
Kaldi
AI科技大本营
·
2019-10-18 10:35
随想录(从
kaldi
学习语音识别)
今天晚上,趁着有时间,看了一下
kaldi
的基本代码,心里有了一些基本的概念。1、代码地址https://github.com/
kaldi
-asr/
kaldi
2、主要目录tools/,提示
费晓行
·
2019-10-17 23:28
怒拒 Facebook 后,语音识别大牛、
Kaldi
之父将加盟小米
文:I/O雷锋网消息,10月17日,国际语音识别领域的大神级人物、前约翰霍普金斯大学(JonhsHopkinsUniversity)教授、语音识别开源工具
Kaldi
之父DanielPovey在个人Twitter
itwriter
·
2019-10-17 17:00
分析一套源代码的代码规范和风格并讨论如何改进优化代码
这个选题需要研究机器学习的基本方法,需要使用到
kaldi
和TensorFlow,目前仍处
remainjjh
·
2019-10-13 11:00
结合工程实践选题调研分析同类软件产品
这个选题需要研究机器学习的基本方法,需要使用到
kaldi
和TensorFlow,而这些在
remainjjh
·
2019-10-12 21:00
OpenFST概览
学习
Kaldi
首先需要了解OpenFST,之后才能够深入的学习
Kaldi
,很多概念都是和OpenFSTaging相关的,而且如果要调整模型的准确率和速度也离不开OpenFST。
lawenliu
·
2019-09-29 19:21
OpenFST
text.fst
isyms.txt
osyms.txt
kaldi
学习笔记 -- 训练单音素(monophone)模型脚本 -- steps/train_mono.sh
本文介绍了
kaldi
训练monophone脚本的过程,脚本中每个程序的作用以及相关参数配置对训练结果的影响。#!
DuishengChen
·
2019-09-26 18:03
Kaldi
Kaldi
入门教程 aishell脚本
Kaldi
入门教程aishell脚本文章目录
Kaldi
入门教程aishell脚本@[toc]准备词典准备数据,分为test、dev、train集词典、语言文件准备,生成对应的数据关系训练语言模型使用语言模型生成有限状态机单音素训练构建单音素解码图
倚剑笑紅尘
·
2019-09-16 20:47
语音
kaldi
语音识别
aishell
kaldi
学习笔记1
#指定bash#!/bin/bash#包含文件../path.sh||exit1../cmd.sh||exit1#配置nj=1#numberofparalleljobs-1isperfectforsuchasmalldatasetlm_order=1#languagemodelorder(n-gramquantity)-1isenoughfordigitsgrammar#安全检查.utils/pa
Ephemeroptera
·
2019-09-09 15:37
kaldi
三个小白是如何在三个月内搭一个基于
kaldi
的嵌入式在线语音识别系统的
一段时间后老板就布置了具体任务:在我们公司自己的ARM芯片上基于
kaldi
搭建一个在线语音识别系统,三个人花三个月左右的时间完成。由于我们都是语音识别领域的小白,要求
davidtym
·
2019-09-09 08:00
kaldi
LibriSpeech教程
前言因为我这里在服务器上下载数据很慢,所以,选择在别的地方下载好数据,然后上传过去的方式。稍微复杂一点。写个教程记录下.1下载训练数据&字典数据data_url=www.openslr.org/resources/12lm_url=www.openslr.org/resources/11⚠️data_url下的数据需要做解压,lm_url的数据不可以.1data_url的数据可以随便放,按照下面修
杨建利
·
2019-08-19 09:56
kaldi
kaldi
安装教程(CentOs GPU机器)
官网:https://
kaldi
-asr.org/代码:https://github.com/
kaldi
-asr/
kaldi
centos7安装
kaldi
下载:gitclonehttps://github.com
杨建利
·
2019-08-19 09:25
kaldi
以
kaldi
中的yesno为例谈谈transition
在基于GMM-HMM的传统语音识别里,比音素(phone)更小的单位是状态(state)。一般每个音素由三个状态组成,特殊的是静音(SIL)由五个状态组成。这里所说的状态就是指HMM里的隐藏的状态,而每帧数据就是指HMM里的观测值。每个状态可以用一个GMM模型表示(这个GMM模型的参数是通过训练得到的)。在识别时把每帧数据对应的特征值放进每个状态的GMM里算概率,概率最大的那个就是这帧对应的状态。
davidtym
·
2019-08-12 08:00
以
kaldi
中的yesno为例谈谈transition
在基于GMM-HMM的传统语音识别里,比音素(phone)更小的单位是状态(state)。一般每个音素由三个状态组成,特殊的是静音(SIL)由五个状态组成。这里所说的状态就是指HMM里的隐藏的状态,而每帧数据就是指HMM里的观测值。每个状态可以用一个GMM模型表示(这个GMM模型的参数是通过训练得到的)。在识别时把每帧数据对应的特征值放进每个状态的GMM里算概率,概率最大的那个就是这帧对应的状态。
david_tym
·
2019-08-09 21:03
智能语音
如何正确安装
kaldi
--同时安装sph2pipe
如何正确安装
kaldi
如何正确安装
kaldi
--同时解决sph2pipe安装问题git克隆
kaldi
配置
kaldi
sph2pipe的使用如何正确安装
kaldi
--同时解决sph2pipe安装问题众所周知
重复是俗套的
·
2019-07-26 15:56
安装
语音关键词识别分类和介绍
Wiesner,M.,Peddinti,V.,Zhang,X.,Ghahremani,P.,Wang,Y.,Manohar,V.,Xu,H.,Povey,D.,Khudanpur,S.(2017)The
Kaldi
OpenKWSSystem
qq_33216029
·
2019-07-18 11:14
kaldi
nnet3在线解码和chain在线解码
chain在线解码可以参考https://blog.csdn.net/it_king1/article/details/80109398我补充一下nnet3在线解码:nnet3跟chain不同之处在于nnet3没有HCLG.fst,用的还是tri5a的HCLG.fst(也就是hmm所代表的信息)这倒是证明了dnn只是代替gmm,可以参考如下的图示(来源http://www.jianshu.com/
boyStray
·
2019-07-08 21:29
kaldi
的优化
1、
kaldi
的脚本中的decode.sh步骤都可以注释掉,减少训练的时间。decode是计算test语料的正确率。2、lexicon.txt其实直接用dacidian就可以,不用从语料中训练。
boyStray
·
2019-07-07 15:27
kaldi
中SHELL调用C++程序过程源码分析
引入
kaldi
真正的核心源码,都是C++写成的,这个结论可以从如下两点得以确认:(1)在
kaldi
的源码
kaldi
/src目录下,能看到很多扩展名为.cc的源程序,这是linux下C++源码;(2)在源码中
ybdesire
·
2019-07-05 23:20
Machine
Learning
源码分析
Mac 下编译
Kaldi
Android (arm) .so 库
于是在TelegramChannel里面咨询了下,@nshmyrev回复建议可以利用
Kaldi
DNN模型,应该会有显著提升。于是考虑转向研究
Kaldi
。首先碰到的一个问题是跨平台编译。
raywalker
·
2019-07-01 10:51
基于WFST的语音识别解码器
老板要求我们基于
Kaldi
搭一个语音识别系统,在设备上通过MIC讲话,连着设备的PC的console上就能基本实时显示出讲话的内容。
davidtym
·
2019-06-23 22:00
Ubuntu16.04下安装
Kaldi
Ubuntu16.04下安装
Kaldi
CUDA的安装CUDA安装注意的几点:
Kaldi
环境配置
Kaldi
的编译CUDA的安装在配置
Kaldi
环境之前,需要在Ubuntu里安装CUDA。
He_yuan_hong
·
2019-06-23 16:46
kaldi
lattice(网格)
https://shiweipku.gitbooks.io/chinese-doc-of-
kaldi
/content/lattice.html一、lattice基础1、Lattice①它是一个FST;②
liangym
·
2019-06-20 16:45
基于
kaldi
的iOS实时语音识别(在线)+03+librispeech
由于最近一直在弄
kaldi
本地化,所以这系列文件一直来不及更新。这篇主要是讲解librispeech运行的run.sh脚本#!
长风浮云
·
2019-06-14 22:14
区分性训练与mmi(二):fst、lattice、supervision
目录FSTFST与FSASemiringsTropicalSemiringLogSemiring不同的Semiring可能用到的特性WFST的基础操作(超级简略版本)Lattice什么是Lattice
Kaldi
兔子的熊
·
2019-06-01 21:01
思考总结
解析
kaldi
中yesno的hmm的用法
在yesno/s5/exp/mono0a/graph_tgpr目录下打印Ha.fst的内容boystray@boystray-All-Series:~/
kaldi
/egs/yesno/s5/exp/mono0a
boyStray
·
2019-06-01 17:54
语音识别系列7-chain model 之分子部分
一、简介现在有越来越多的公司和团体开始使用chainmodel了,得益于
kaldi
社区日益活跃和
kaldi
作者povey的大力推荐,chainmodel的优越性在于:1,使用了单状态的biphone,建模粒度更大
心学-知行合一
·
2019-06-01 14:21
c++
kaldi
ctc
asr
aishell的说话人识别资料
跑脚本请参考
kaldi
/egs/aishell/v1数学公式请参考https://www.zhihu.com/question/63978977/answer/215215119
kaldi
代码请参考https
boyStray
·
2019-05-28 23:35
kaldi
+cuda安装
1.下载
kaldi
2.在tools下面按照步骤安装3.vim.bashrc修改环境变量exportPATH=/usr/local/cuda-8.0/bin:$PATHexportLD_LIBRARY_PATH
AliceXingFree
·
2019-05-26 20:34
【
kaldi
学习.4】Aishell V1(说话人识别、声纹识别)中的run.sh详解
做声纹识别就要选择aishell/V1,这里是
kaldi
的github地址:https://github.com/
kaldi
-asr/
Colleen_oh
·
2019-05-24 14:11
Kaldi
安装
1.git下载源码gitclonehttps://github.com/
kaldi
-asr/
kaldi
.git
kaldi
-trunk--origingolden2.安装cdtools目录cd
kaldi
-trunk
kyle_liao
·
2019-05-23 17:00
kaldi
语音识别:yesno模型图形化lattice(又叫词图)
article/details/81737937https://blog.csdn.net/yutianzuijin/article/details/77621511那么把lattice打印出来,需要用到
kaldi
boyStray
·
2019-05-18 11:07
【
Kaldi
学习】了解+搭建
kaldi
环境
因为自己工作上的需求,近期接触了很多NLP的领域,所以学习这个强大的
kaldi
模型是肯定不可少的,下面是我的体会,有问题直接提出来啦!!
Colleen_oh
·
2019-04-29 11:31
kaldi
中的i/o机制(代码级)
语音中用得比较多的工具箱就是
kaldi
了,
kaldi
的初步学习是从某个模型的脚本开始,单步运行。可以参考一下网上的一些博客,例如这篇,还是比较容易跑通第一个aishellv1的demo的。
哈哈进步
·
2019-04-28 14:05
语音相关
kaldi
Kaldi
初体验(一):安装
最近对
Kaldi
这个工具箱有了一些粗浅的体验,踩了不少坑。于是就稍微整理了一下。下载代码
Kaldi
托管在GitHub上,首先需要将代码下载到本地。
indes
·
2019-04-17 00:00
语音
kaldi
第一步安装
kaldi
测试yesno
Kaldi
是一个非常强大的语音识别工具库,主要由DanielPovey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。
liuliqun520
·
2019-04-08 21:40
编辑器
语音识别安装包
kaldi
做aishell的nnet3训练耗时44个小时
kaldi
做aishell,其中倒数第3步是local/nnet3/run_tdnn.sh,一共花了44个小时,主机配置32G内存,E31231V3,2个gtx9502G的显卡,机械硬盘。
boyStray
·
2019-04-07 16:01
工具
语音识别传统方法(GMM+HMM+NGRAM)概述
部门起了个新项目,要用到语音识别(准备基于
Kaldi
来做)。我们之前做的传统音频已基本成熟,就开始关注在语音识别上了。
davidtym
·
2019-04-02 19:00
kaldi
解码器在嵌入式平台运行
该博文属于系列文章,其他文章参考总览:
kaldi
嵌入式平台的移植及实现前言前面的博文
kaldi
源码的交叉编译已经将嵌入式平台的解码器编译完成,解码器有GMM、nnet2、nnet3等等,GMM解码器又分为单音素
遇逆境处之泰然
·
2019-03-18 15:35
Linux
C/C++
语音识别
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他