E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Kaldi
利用
kaldi
提取mfcc特征
前言1)由于
kaldi
的集成性很高,这样如果只是想实现一个小功能,就需要很多准备东西,比如如果要提取mfcc就需要利用steps/make_mfcc.sh脚本,需要为其准备一些文件。
长虹剑
·
2020-08-08 12:13
深度学习算法/有关工具
音声合成:音高、泛音、谐波、基频 到底是什么概念?
工具
Kaldi
,虽然非常高效,表现也好,但是忒难用,不灵活,总得改C++代码;Py
Kaldi
,虽然用上了机器学习界宠儿Python,但本质上跟
Kaldi
还是一回事嘛;PyTorch-
Kaldi
,虽然灵活了一些
缠禅可禅
·
2020-08-08 11:13
语音合成原理与经典论文解读
歌声合成合成实战练习
歌声合成从入门到实战
[实验室环境配置]
kaldi
安装
下载
kaldi
包gitclonehttps://github.com/
kaldi
-asr/
kaldi
.git检查并自动安装依赖库cdtools.
ASR_THU
·
2020-08-06 13:46
实验室环境搭建
kaldi
中文件的写入及读取
文件名有“rxfilename”和“wxfilename”两种类型“-”或者“”表示标准的输入;filename:12345定位到12345Table有两种形式:“archive”和“script”文件。它们之间的差别在于:archive包含实际的数据,而script文件则指出数据的具体位置从Tabla中读数据的程序需要一个“rspecifier”输入,该字符串指明了如何读取索引数据写数据到Tab
wuxianfeng1987
·
2020-08-04 21:39
Decoding-graph creation recipe (training time) (
kaldi
翻译+个人理解)
kaldi
的图创建过程在训练阶段与测试阶段相比而言要相对简单一点,主要是因为不需要消歧符号,我们假定你已经读了这个recipe的test阶段,然而我没读,,,。
少游223
·
2020-08-04 00:06
kaldi
kaldi
kaldi
中TransitionModel介绍
kaldi
中的HMM模型,实际就是一个TransitionModel对象。这个对象描述了音素的HMM拓扑结构,并保存了pdf-id和transition-id相关的信息,并且可以进行各种变量的转换。
lbaihao
·
2020-08-03 18:46
kaldi
kaldi
中文语音识别(1)
这3篇博客,详细总结和记录了我编译安装
kaldi
和两种用
kaldi
进行中文语音识别的过程,包括如何
kaldi
的简单介绍、环境的配置、相关模型的训练、导入,算是自己近期学习的一个总结,也希望可以帮助到需要的人
shenzhiping12
·
2020-08-03 04:27
kaldi
win10 vs2019 CPU和GPU下遇到的问题
kaldi
win10visualstudio2019CPU和GPU下遇到的问题1需要组件1.1nvidiadriver1.2vs2019社区版1.3cmake1.4git和TortoiseGit2
kaldi
vs
zhulinniao
·
2020-08-02 15:13
语音
Kaldi
(二)中文模型识别
目前
kaldi
中文识别数据集aishell:AISHELL公司开源178小时中文语音语料及基本训练脚本,见
kaldi
-master/egs/aishellaishell-1:http://www.openslr.org
圆滚滚的大营子
·
2020-08-01 01:48
win7安装UBUNTU18 双系统流程 中途出现GRUB失败(已解决)
最近开始学习
KALDI
开始装的虚拟机无奈渣本是6年前的4g内存根本带不动所以开始安装双系统。
赤崎Akasaki
·
2020-07-30 21:25
环境安装
Win10下启动内置Linux子系统
目录最近想要重新把
Kaldi
装上来复习一下以前的项目内容,以前是在Windows+Cygwin的配置下跑
Kaldi
,这次安装过程中出现了一些问题,据说是64位最新版的Cygwin好像会出现这些问题,在网上找解决方案无果后
Yogurt0928
·
2020-07-30 19:23
linux
Ubuntu16.04安装
Kaldi
toolkit
sudoapt-getinstallautoconfautomakelibtoolsubversionlibatlas-devlibatlas-base-devzlib1g-devgawkgitgfortrangccg++二、在github(https://github.com/
kaldi
-asr
z小白
·
2020-07-29 13:05
声音识别
声音识别教程
从说话人识别demo开始学习
kaldi
--(5)compute_vad_decision.sh
#!/bin/bash#Copyright2017VimalManohar#Apache2.0#Toberunfrom..(onedirectoryupfromhere)#see../run.shforexample#ComputeenergybasedVADoutputnj=4cmd=run.plvad_config=conf/vad.confecho"$0$@"#Printthecommand
Grace_yanyanyan
·
2020-07-29 13:36
kaldi
feature extraction
支持提取mfcc/plp特征,和HTK特征的主要差别在于默认参数值的设定。使用选项-htk-compat=true以及合适的参数,可以得到htk特征。全局CMVNcompute-cmvn-stats假设帧数为i,特征维度为j,cmvn计算得到两个矩阵:(A1,A2,...,Aj,Aj+1)(B1,B2,...,Bj)第Aj+1表示总的帧数N假设特征为fij,其中变量的计算公式如下:Aj=∑ifij
xmucas
·
2020-07-29 13:36
kaldi
基于深度神经网络的语音识别方法
2019独角兽企业重金招聘Python工程师标准>>>
Kaldi
语音工具箱的简介
Kaldi
语音工具箱[61]是由微软研究院Povey等人研究的应用于语音识别方面的开源工具箱。
weixin_33957648
·
2020-07-29 12:06
如何利用
kaldi
提自己想要的特征(mfcc plp pitch)
转自:http://blog.csdn.net/wbgxx333/article/details/27705939首先,确保你的s5文件夹有conflocalsteputils文件夹。然后你把你的数据保存为test文件夹,比如test文件夹里有test1.wavtest2.wavtest3.wav。然后,新建个data文件夹,data文件夹新建个test文件夹,这个test文件夹里需要三个文件:w
JamesJuZhang
·
2020-07-29 11:46
Speech
Recognition
kaldi
中的特征提取
本翻译原文http://
kaldi
.sourceforge.net/feat.html,由@煮八戒翻译,@wbglearn校对和修改。
wbglearn
·
2020-07-29 11:08
语音
MFCC & PLP
kaldi
特征提取默认参数设置:###预加重将信号通过高通滤波器:s2(n)=s(n)−a∗s(n−1)s_2(n)=s(n)-a^{*}s(n-1)s
shichaog
·
2020-07-29 11:33
语音识别
MFCC
【声纹识别】
kaldi
callhome diarization
callhomediarization
kaldi
中专门用来进行混合录音文件聚类分别的,主要参考blog-->操作指南学会自己看
kaldi
中的指令demo。
SoWhat1412
·
2020-07-29 10:34
声纹识别
Kaldi
-MFCC模块源码主流程分析
那么趁着这个机会,研究一下
kaldi
源码中MFCC部分的内容。
爱国者002
·
2020-07-29 10:43
语音识别
kaldi
基础介绍(一)在说话人识别中的数据准备
在
kaldi
说话人识别示例(egs/sre10,egs/sre16)中,数据总共有两大类,一是训练集(training),二是评估数据集(evaluation)。
monsieurliaxiamen
·
2020-07-29 10:45
说话人识别
基于x-vector的文本无关说话人识别
这篇文章分两部分,第一部分介绍x-vector的说话人识别细节算法,第二部分是对最新技术的跟进,本质是对训练数据做了dataaugmentation,x-vector方法在
kaldi
上的实现细节将在下一篇文章中展示
monsieurliaxiamen
·
2020-07-29 10:45
说话人识别
语音识别传统方法(GMM+HMM+NGRAM)概述
部门起了个新项目,要用到语音识别(准备基于
Kaldi
来做)。我们之前做的传统音频已基本成熟,就开始关注在语音识别上了。
david_tym
·
2020-07-29 09:20
智能语音
语音特征提取学习笔记--对比
kaldi
、htk、w2l的语音提取过程。
不过在
KALDI
和HTK软件中,除了MFCC,其实还提供了其他一些特性提取方法,其中就包括PLP和FilterBank。本文又加入了
golfbears
·
2020-07-29 08:21
asr
语音特征
人工智能
Kaldi
在ubuntu 18.04下编译小结
sctk-2.4.10-20151007-1312Z.tar.bz2这个文件在https://github.com/
kaldi
-asr/
kaldi
中下载是通过tools/Makefile文件中该行实现的
奔跑的Levi
·
2020-07-28 03:38
语音识别
按下快门,世界在你手中|小米周报
开源中国开源世界7月15日,在第十五届“开源中国开源世界”高峰论坛上,小米集团副总裁、集团技术委员会主席崔宝秋博士发表了“
Kaldi
和小米AIoT生态”主题演讲。
小米手机
·
2020-07-17 00:00
编辑距离WER/CER计算的一种python实现
一些语音识别框架(如:
Kaldi
、ESPNet等)中,都会包含wer的计算方法,其中ESPNet的结果展示如下:我们希望用python实现上面的效果,首先来看看wer是怎么计算的。
zwglory
·
2020-07-16 14:45
语音识别
Python
python
语音识别
WER
CER
基于WFST的语音识别热词定制化
最近学习了
kaldi
的"Supportforgrammarsandgraphswithon-the-flyparts",感觉看英文看着挺费劲,而且中间有许多概念需要有对应的图才能方便理解,所以撰写此文给有需要的同仁
Good_ASR
·
2020-07-13 18:22
Kaldi
语音识别工具运行TIMIT数据库实例
Kaldi
安装后运行TIMIT例子:1.对于
Kaldi
-master版本中,/egs/timit/s5下面的关键三个文件cmd.sh,path.sh,run.sh,运行前只需要修改将run.sh中的timit
JamesJuZhang
·
2020-07-13 15:09
Speech
Recognition
基于
kaldi
的声纹识别
声纹识别基本原理:1、建立通用背景模型(UBM)使用大量的非目标语音构建一个通用背景模型(exp/full_ubm_1024/final.ubm)。2、得到目标说话人的混合高斯模型(GMM)采用目标说话人数据进行基于最大后验概率(MaximumAPosterior,MAP)的自适应训练,得到目标说话人的混合高斯模型(GMM)。3、映射到i-vectorGMM通过全局差异空间建模(TotalVari
liangym
·
2020-07-13 10:06
音视频技术开发周刊 53期
我们发布了基于流行的
Kaldi
语音识别工具包的DFSMN的
LiveVideoStack_
·
2020-07-12 21:36
音视频技术开发周刊
kaldi
中的egs文件夹中的demo都是干什么的
kaldi
官网对egs的介绍在这里:http://
kaldi
-asr.org/doc/examples.html下面只是简单记录下,如果你需要哪个,请细看每个文件夹里面的README。
Grace_yanyanyan
·
2020-07-12 18:56
kaldi学习
Kaldi
TIMIT x-vector 说话人识别 (声纹识别)
x-vector进行说话人识别,现有的资料都是i-vector.本文参考了很多资料,如果想要了解如何使用TIMIT和ivector进行说话人识别,那么建议从https://github.com/lr2582858/
kaldi
-timit-sre-ivector
RanleyYu
·
2020-07-11 16:19
基于
kaldi
的在线中文识别,online的操作介绍
最近研究了下
kaldi
,也看了好多文章,感觉这方面的有用文章太少!大多停留在编译和深层理论方面。对于我们这种没有基础的人,除了看完编译,就只能很茫然的看哪些高高在上的理论了。本文章,适合那些。
代码医生
·
2020-07-11 10:31
语音识别
GMM-HMM语音识别模型2
以下放上这段时间浏览博客的网址:1.
kaldi
语音识别的资料http://blog.csdn.net/sheshou199/article/details/53
诸葛村姑
·
2020-07-11 09:39
ASR: DNN训练
本文通过简单
kaldi
源码,分析DNN训练声学模型时神经网络的输入与输出。
zqh_zy
·
2020-07-10 11:08
kaldi
提取bottleneck特征
基于nnet1的脚本在训练的时候将train.sh中BN层设置一下,然后调用steps/nnet/make_bn_feats.sh脚本,通过生成的final.nneti模型查看BN层的component,设置remove_last_component的数目,生成BNF。注意:要对特征做cmvn基于nnet3调用steps/nnet3/make_bottleneck_feature.sh主要是nne
weixin_34315485
·
2020-07-10 08:21
Kaldi
中 声纹识别的流程图
总结了一波
Kaldi
中声纹识别的流程和所用的可执行文件,.把可执行文件当作一个库来用,自己来仿照这sre08,sre10,或者aishell的run.sh用自己的数据来完成自己的声纹识别系统就好.自己还在研究
RoadmanG
·
2020-07-10 01:53
声纹识别
机器学习
Kaldi
Kaldi
学习笔记 score-plda.sh 解读
1Usageiswheretostorepretrainedpldamodel.iswheretostorexvectorandcorrespondingspk2utt,etc.output-diriswheretooutputthepldascores.2CodeandCommentsfeats="ark:ivector-subtract-global-mean$pldadir/mean.vec
RanleyYu
·
2020-07-09 14:35
kaldi
ASR pipeline涉及到的知识
kaldi
中基于决策树的状态绑定https://blog.csdn.net/asrgreek/article/details/88139638
Kaldi
学习笔记--构建字典FST脚本--prepare_lang.sh
qq_27292549
·
2020-07-07 20:23
Kaldi
单步完美运行AIShell v1 S5之三:三音tri1,tri2,tri3,tri4,tri5
Kaldi
单步完美运行AIShellv1S5之三:三音tri12345致谢机器配置
Kaldi
下AIShellv1详细输出之三:三音triphone第五部分:三音结果更新第六部分:三音Tri1训练、解码、
见性见声
·
2020-07-07 14:26
Kaldi
ASR之
Kaldi
Kaldi
官方github地址:https://github.com/
kaldi
-asr/
kaldi
Kaldi
目录结构./tools,./src,./egs这三个目录是比较重要的。.
huang_yx005
·
2020-07-07 10:48
ASR
准备做个魔镜(树莓派+HTK(或者
Kaldi
)+Opencv+apache)
想法来源几年前就听过别人用树莓派做魔镜的想法,看了下别人的流程感觉挺不错的。不过那时候他们应该还没有完全实现,看来下演示应该只能简单的进行文字交流,不是很智能。现在这个已经是个开源项目,大家可以在下面这里看下详情。上次不小心在哪看到微软已经收购了这个项目,不知道是不是真的。http://michaelteeuw.nl/post/111886383522/magic-mirrors-around-t
cscshaha
·
2020-07-07 05:15
start
对于ASR流程的理解
2)格式化标注为
Kaldi
需要的格式在声学
Xwei1226
·
2020-07-07 01:21
kaldi
thchs30跑的输出记录(Mac os)
[riemann@bogon:~/documents/riemann/
kaldi
/egs/thchs30/s5onmaster]%zsh-x./run.sh✹✭+./run.sh:3>..
RiemannLee
·
2020-07-06 22:09
ubuntu18.04安装CUDA10-1-local-10.1.168-418.67_1.0-1_amd.deb 以及配置
kaldi
ubuntu18.04安装CUDA10-1-local-10.1.168-418.67_1.0-1_amd.deb以及配置
kaldi
官网下载下来CUDA安装包,然后根据里面的(install)安装提示进行一步步安装
河妖鱼鱼
·
2020-07-06 12:32
kaldi学习日记
kaldi
中的声纹识别
kaldi
中的声纹识别文章目录
kaldi
中的声纹识别
kaldi
的安装运行aishell例程使用TIMIT数据库进行声纹识别
kaldi
中声纹识别的流程我的博客:https://yutouwd.github.io
yutouwd
·
2020-07-06 11:11
声纹识别
5分钟读完
kaldi
-pytorch 论文
THEPYTORCH-
KALDI
SPEECHRECOGNITIONTOOLKIT1.论文解读本文讲述了一个开源的pytorch与
kaldi
结合的工具论文地址https://arxiv.org/pdf/1811.07453v2
hyxxxxxx
·
2020-07-06 09:52
语音识别
安装
kaldi
-GridEngine
安装环境ubuntu14.04在master节点安装GridEngine最好不要用源码安装,会非常痛苦sudoapt-getinstallgridengine-mastergridengine-client当出现自动配置时选择yes当出现需要输入cellname时,可以选择default当需要输入nameofthemaster时,要输入选择的masterhostname,如果输错了最好的方法就是运
xljiulong
·
2020-07-06 09:04
深度学习
软件工程
ubuntu
kaldi
GridEngine
用
kaldi
平台跑timit实例
首先安装ubuntu14.04平台,安装好后就开始安装各种
kaldi
需要的组件,代开终端,在其中输入如下代码安装前的配置sudoapt-getinstalllibtoolsudoapt-getinstallautoconfsudoapt-getinstallwgetsudoapt-getinstallperlsudoapt-getinstallsubversionsudoapt-getinstal
wujianhaoren123
·
2020-07-06 07:55
语音识别
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他