E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
【kaldi】
kaldi
中查看深度学习模型参数
cdpath/of/
kaldi
/src/nnetbin/./nnet-infopath/of/final.nnet
jiangtopaz
·
2020-08-25 03:29
语音识别
kaldi
平台上aishell运行时出现的问题及解决办法
问题1:ThisscriptisintendedtobeusedwithGPUsbutyouhavenotcompiled
Kaldi
withCUDAIfyouwanttouseGPUs(andhavethem
程序猿-博客
·
2020-08-25 03:50
语音识别
语音识别工具
Kaldi
笔记
`本文翻译来自:[http://white.ucc.asn.au/
Kaldi
-Notes/tidigits/train]水平有限,翻译有不准确的地方望指出。
gwpjiayou
·
2020-08-25 03:38
Kaldi语音识别
KALDI
之aishell模型说话人识别之V1
1.首先,成功安装
kaldi
在服务器上,用gitclone那种方式安装(和在本地Unbuntu乌班图环境安装没区别)。
落雪snowflake
·
2020-08-25 02:23
KALDI工具
说话人识别
kaldi
中声纹识别例子大概步骤综述
如何利用
kaldi
搭建说话人识别的例子。仅仅是搭建,具体的很多参数的调整需要大家根据数据集的不同慢慢调整。
落雪snowflake
·
2020-08-25 02:52
深度学习声纹识别
KALDI工具
kaldi
---get_egs.sh和get_egs_targets.sh区别
get_egs.sh和get_egs_targets.sh文件理解get_egs.sh和get_egs_targets.sh文件实现的功能相同,都是生成label标签和帧之间的对应,并划分训练-验证样本数据集。不同的是,get_egs.sh是通过上步已经生成的对齐文件夹(ali)及其相关文件生成帧级别的样本标签,而get_egs_targetes.sh文件是通过上步已经准备好的targets_sc
陌上阳光
·
2020-08-24 17:22
kaldi
kaldi
数据集下载(swbd)
kaldi
数据集下载(swbd)LDC:https://catalog.ldc.upenn.edu/byyear(97年LDC97S62Switchboard-1Release2)https://linguistics.cornell.edu
陌上阳光
·
2020-08-24 17:22
kaldi
全新mac安装
kaldi
1.安装xcode官网下载xcodehttps://developer.apple.com/download/2.安装Xcode命令行工具$xcode-select--install3.安装homebrew命令获取网址:https://brew.sh//usr/bin/ruby-e"$(curl-fsSLhttps://raw.githubusercontent.com/Homebrew/inst
陌上阳光
·
2020-08-24 17:50
kaldi
Kaldi
特征提取之-VAD
Kaldi
特征提取之-VAD背景VAD即VoiceActivityDetection,用于检测静音和非静音。
wxb_blog
·
2020-08-24 16:34
Kaldi
kaldi
——用shellscript(bash)制作yesno的recipe(一)
先从
kaldi
的安装说起吧一,
kaldi
的安装与编译首先cd到安装的目录下cd /wangyu #wangyu是我建的一个文件夹然后安装
kaldi
gitclonehttps:
Wang_yu09
·
2020-08-24 13:53
软件安装
AI
Kaldi
杂记
台式机器:I5-6500GTX950,ubuntu14.04(新手建议不要太新的ubutnu,出现问题不好百度)1.安装CUDA7.5到NVIDIA下载CUDA安装包,然后在安装一些可能需要的库:sudoapt-getinstallppa-purgesudoapt-add-repositoryppa:xorg-edgerssudoapt-getupdatesubversion,automake,a
Aderic
·
2020-08-24 11:39
杂陈
make_mfcc_pitch.sh阅读笔记
steps/make_mfcc_pitch.sh--cmd"xexp/make_mfcc/mfccdir||exit1;提取特征代码:compute-mfcc-feats#提取mfcc特征compute-
kaldi
-pitch-feats
诸葛村姑
·
2020-08-24 04:57
Kaldi
HMM拓扑和状态转换模型
我的书:淘宝购买链接当当购买链接京东购买链接##HMM拓扑使用c++的HmmTopology来描述音素的HMM拓扑。其描述的一个实例(3-stateBakis模型)如下:123456780000.510.51110.520.52220.530.53在这个实例中只有一个TopologyEntry,其包括了音素1~8(所以这个例子总共8个音素,这些音素共享相同的拓扑)。有三个发射状态,每个状态包括一个
shichaog
·
2020-08-24 02:24
语音识别
Kaldi
查看ark,fst,tree等文件用到的命令
*1.ark,scp文件~/
kaldi
/src/featbin/copy-featsark:raw_mfcc_dev.10.arkark,t:-|headark存的试二进制文件,scp可以直接用cat命令看
诸葛村姑
·
2020-08-23 19:42
[
Kaldi
] 查看不同文件
20190108qzd1.ark,scp文件~/
kaldi
/src/featbin/copy-featsark:raw_mfcc_dev.10.arkark,t:-|headark存的试二进制文件,scp
原来是酱紫呀
·
2020-08-22 15:59
美国 AI 的秘密武器——中国人才,国际局势影响人才流动
去年,国际语音识别领域大神级人物,
Kaldi
之父DanielPovey拒绝了Facebook来到中国选择了小米。上周,英特尔芯片设计师JimKeller离职,中国网友纷纷评论欢迎到中国企业就职。
芒果果
·
2020-08-22 15:31
人工智能
google
microsoft
斯坦福大学
kaldi
tutorial
https://eleanorchodroff.com/tutorial/
kaldi
/index.html
·Barton·
·
2020-08-22 14:57
Kaldi
thchs30手札(七) DNN-HMM模型的训练
欢迎大家关注我的博客http://pelhans.com/,所有文章都会第一时间发布在那里~本部分是对
Kaldi
thchs30中run.sh的代码的line106-107行研究和知识总结,主要内容为
Kaldi
Pelhans
·
2020-08-22 13:36
ASR
kaldi
源码分析(三) - run.pl 分析
在
kaldi
样本(egs/xxx/s5)目录下,大都会存在如下文件及文件夹:cmd.sh#并行执行命令,通常分run.pl,queue.pl两种config#参数定制化配置文件,mfcc,decode,
走在成长的道路上
·
2020-08-21 11:45
杂记:腾讯暑期实习 Web 后端开发面试经历
可能是因为我在简历中有过一个语音识别的项目经验,但那只是大二的一个课程作业,我对其中的原理并不十分了解,只说了什么
Kaldi
的内部是GMM+HMM模型实现的,唉。接下来是四道编程题,
weixin_33774615
·
2020-08-20 01:36
wav 文件按起止时间切割
step1:sox不能直接切,先转化为sphos.system(‘sox{}-fsph{}’.format(wav_filepath,sph_filepath))step2:用
kaldi
的sph2pipe
jinmingz
·
2020-08-19 22:00
kaldi
kaldi
常用工具(原理分析)
kaldi
/src/gmmbin/gmm-copy–binary=false
jinmingz
·
2020-08-19 06:42
ASR
kaldi
Kaldi
中的plda的训练以及computer-socre
最近一直有个疑惑,plda是怎么训练的?就是plda是怎么计算得分的?又是怎么根据得分进行判断说话人的?EER跟准确率之间又是什么关系?时间很紧,论文还没写,需要静一静,好好弄明白这个来清醒一下。提取完i-vector之后,计算出每一句话的ivector特征,然后计算了sreivector-meanscp:exp/ivectors_sre/ivector.scpexp/ivectors_sre/m
jinmingz
·
2020-08-19 06:42
kaldi
sre
特征提取I-VECTOR算法源码01
#include#include"ivector/agglomerative-clustering.h"namespace
kaldi
{voidAgglomerativeClusterer::Cluster
落雪snowflake
·
2020-08-19 05:41
KALDI工具
说话人识别
KALDI
中声纹识别学习流程及资源
KALDI
工具包中的例子首先最基础的就是egs/aishell/V1,先跑通它,并理解代码和基础理论知识。egs/sre08REMAD.TXT系统开发所需的数据(除了所描述的测试数据之外) 在..
落雪snowflake
·
2020-08-19 05:40
KALDI工具
说话人识别
kaldi
用ivector计算plda出错
运行结果如下:=====FEATURESEXTRACTION=====steps/make_mfcc.sh--cmdrun.pl--nj1data/trainexp/make_mfcc/trainmfccsteps/make_mfcc.sh:movingdata/train/feats.scptodata/train/.backupsteps/make_mfcc.sh:[info]:nosegme
新一姬
·
2020-08-19 04:32
Kaldi学习
KALDI
中ivector提取过程
/local/data_prep.sh/home/yixin/
kaldi
/egs/clarinet/data/clarinet_audio/wav/home/yixin/
kaldi
/egs/clarinet
新一姬
·
2020-08-19 04:32
Kaldi学习
语音识别
语音识别主流开源框架:HTK、
Kaldi
、CMUSphinx。因为目前只接触了Sphinx,对于另外两个框架没有太深入研究。
飞星
·
2020-08-19 03:14
语音识别
kaldi
强制对齐相关代码介绍
CorpusPhoneticsTutorialEleanorChodroffIntroPennForcedAlignerAutoVOT
Kaldi
OtherResourcesPrerequisitesFamiliarizationTrainingAcousticModelsConceptuallyTrainingAcousticModelsForcedAlignment
Kaldi
ForcedAlig
dlx59140096
·
2020-08-19 01:43
kaldi
kaldi
训练mono-phone——强制对齐
kaldi
中训练声学模型,首先是训练单音素模型,即mono-phone过程,本文主要讲述mono-phone训练的过程。
audiocool
·
2020-08-19 01:29
kaldi
中基于决策树的状态绑定
为什么要做状态绑定假如我们有218monophone,然后现在要考虑上下文音素对发音的影响,这时候我们通常使用triphone。那么会有几个triphone呢?答案是218的3次方。如果不进行聚类,我们需要建立(218的3次方)*3个混合gmm模型(假设每个triphone有3个状态),计算量巨大,另一方面会引起数据稀疏。所以通常我们会根据数据特征对triphone的状态进行绑定。常见的状态绑定方
nlpgeek
·
2020-08-19 01:28
语音识别
声学模型
kaldi
语音特征预处理-mfcc特征与标签对齐(一)
学习
kaldi
已经接近两个月了,终于将
kaldi
中语音的特征数据提取出来,对于其分帧的标签进行对齐,即将输入到TensorFlow搭建的模型中,下面详细的讲解一下如何提取语音的特征以及对音素标签进行对齐
Xwei1226
·
2020-08-19 01:38
kaldi
PYTORCH-
KALDI
语音识别工具包
PYTORCH-
KALDI
语音识别工具包MircoRavanelli1,TitouanParcollet2,YoshuaBengio1*Mila,Universit´edeMontr´eal,∗CIFARFellowLIA
king_audio_video
·
2020-08-18 11:23
webrtc
多媒体
ASP
语音质量评价
ASR
Kaldi
结果文件可视化查看
转载:https://blog.csdn.net/zjm750617105/article/details/52540823目录L.fstMFCC&FBANKmonophone,triphonetreeali.1.gzshow-transitions样例是用自己的数据跑的,改编自wsj,文件名称不是很标准,但重点是工具的使用,加路径是为了好理解,内容暂时不解释,以后有时间来补充。这个文档太棒了,理
我是个粉刷匠
·
2020-08-17 08:52
语音解码网络结果
【
kaldi
】
Kaldi
+CUDA安装向问题(含libtool is not installed.的解决方法)
现在汇总一下出现的问题。(1)Ubuntu16.04更新Nvidia驱动后,图形登录界面无限循环H:目前(请右上看眼发文时间),最新版本的Ubuntu16.04不兼容Nvidia驱动。14.04或者14.10版本是安全的。这里,提供一个站点:厦门大学的信息与网络中心。里面有很多linux版本。有Deepin/CenOS/ubuntu等。(2)虚拟机是(几乎)无法调用GPU的/不能运行CUDA的吗?
HH_Lab
·
2020-08-16 02:41
【kaldi】
【新手第一篇】
win10+cuda8.0+vs2013+kinectv2+bundlefusion的安装配置
bundlefusion下载下来https://github.com/niessner/BundleFusion6.下载mLibExtrernal,放在与bundlefusion同级文件夹下:http://
kaldi
r
CptM
·
2020-08-16 01:40
bundlefusion
语音识别—Viterbi解码
曾看过很多语音识别书(余栋的语音识别实战、陈果果的
kaldi
实战以及张雪英的数位语音处理等书)、课程(七月在线、深蓝学院等课程),上述研究对
Xwei1226
·
2020-08-15 22:58
语音识别-深度学习
语音识别技术(AI VQ HMM),语音样本及开源工具
Kaldi
等,双麦阵列
--AI:计算机视觉、语音识别、NLP(NaturalLanguageProcessing)人工智能正从比较初级的计算智能向更高层次的智能过渡。更高层次的智能包括3个阶段:感知(perception)智能,计算机视觉(computervision),认知(cognition)阶段,第一个阶段是感知(perception)智能,机器要听得见、看得见。听得见是我们常说的语音识别,机器把人说的一句话,由
desaco
·
2020-08-15 22:15
个人研究与计划
热点(hot)技术
在树莓派上搭建
kaldi
离线语音识别系统(交叉编译)
在树莓派上搭建
kaldi
离线语音识别系统(交叉编译)一、系统功能和环境概述1.1、实现功能1.2、开发环境二、
kaldi
语音识别工具箱三、树莓派的相关配置四、
kaldi
交叉编译过程4.1、配置Ubuntu
麻城明歌
·
2020-08-15 11:47
kaldi
理解WFST,HCLG,lattice
文章目录WFST,HCLGlattice两种lattice结构TheLatticetype和CompactlatticesLattice的产生获取rawlattice,并将其转换为最终形式。Latticesinarchives再lattices上的一些操作Pruninglattices剪枝Computingthebestpaththroughalattice计算最优路径ComputingtheN-
倚剑笑紅尘
·
2020-08-13 17:40
语音
ubuntu下安装kaidl实用教程
1.介绍
Kaldi
语音识别工具将HTK比较零碎的各种各样的指令和功能进行整理集合,使用perl脚本调用。
chenxiaoliang0303
·
2020-08-11 03:15
Kaldi
编译问题
今天编译
Kaldi
,总是冒出“Couldnotfindanylibraries/usr/local/lib/liblapack,liblapack_atlas,libclapackthatseemtobeanATLASCLAPACKlibrary
yinger4972
·
2020-08-10 12:09
linux
语音
开源语音识别工具包 - CMUSphinx
以下是目前比较流行的语音识别工具包:CMUSphinx
Kaldi
HTKJuliusISIP作为语音识别小白,我将从CMUSphinx入手
muxiue
·
2020-08-09 05:12
语音识别
语音识别学习资料入门整理
语音信号处理/模式识别/统计分析,1.算法:常用的深度学习算法,包括cnn/dnn/rnn/lstm;GMM/SVM/CRF/MaxEnt/HMM;对CTC有经验;2.框架:熟悉至少一种深度学习框架,包括
kaldi
weixin_34262482
·
2020-08-09 00:11
Kaldi
特征提取之-FBank
Kaldi
特征提取之-FBank背景人耳对声音频谱的响应是非线性的,经验表明:如果我们能够设计一种前端处理算法,以类似于人耳的方式对音频进行处理,可以提高语音识别的性能。
wxb_blog
·
2020-08-08 22:51
Kaldi
Kaldi
WFST最小化算法
WFST最小化算法最小化算法主要是在保证DFA识别的语言不变的条件下,将DFA中等价状态合并,减少状态数、转移边数,简化DFA结构,从而减少存储空间和运算时间。比较有名的最小化算法有Moore,Hopcroft以及Brzozowski等,本章主要针对Hopcroft算法进行优化。WFSTHopcroft最小化算法原理Hopcroft算法在初始阶段将所有状态划分为终结状态和非终结状态两个等价类,然后
shakingWaves
·
2020-08-08 21:35
语音识别
Kaldi
WFST确定化算法
Kaldi
中采用的确定化算法叫“子集构造法”,该算法原本是为了处理FSA的确定化,然而,
Kaldi
shakingWaves
·
2020-08-08 21:35
语音识别
语音识别
kaldi
语音识别
WFST
确定化
有限状态自动机
MFCC一些知识与
Kaldi
中的MFCC特征解读
因为想用
Kaldi
去实现一个GMM-UBM的说话人识别和loglike打分,所以想把
Kaldi
计算的统计量对一对,看能不能把二进制文件里的数值单独拿出来,自己写个代码做结合
Kaldi
中的MAP做统计量计算
RoadmanG
·
2020-08-08 21:50
Kaldi
声纹识别
kaldi
解码流程
字典文件)此外还要提供带解码音频文件或路径.scp文件:wav.scp(音频路径.scp文件)2.流程图:2.使用compute-mfcc-feats提取特征,有时也会加上基音周期,用compute-
kaldi
-pitch
qq_14962179
·
2020-08-08 18:34
语音识别
有趣的开源软件:语音识别工具
Kaldi
(二)
在上一篇blog中简单的介绍了
Kaldi
的安装方法有趣的开源软件:语音识别工具
Kaldi
(一)在这篇blog中继续
Kaldi
模型训练的步骤,介绍一下在模型训练之前的一些数据准备的工作。
brandonyue
·
2020-08-08 14:01
语音识别
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他