E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
kaldi
Kaldi
中FST(Finite State Transducer)含义及其可视化
1.FST含义1.1本文仅简单介绍如何利用
Kaldi
所依赖的工具openfst中的两个函数fstprint和fstdraw可视化FST。默认使用者已经顺利产生了.fst文件。
白水煮蝎子
·
2020-06-22 12:09
快商通李稀敏:近场声纹识别将普及,本地化的AI能力是刚需
10月26日,第四届
Kaldi
线下交流会在北京·小米科技园举行。李稀敏博士在以“人机语音交互是否必须要先唤醒和离线语音技术在本地端上的实现是否未来的趋势”为题的圆桌讨论。
VoiceSense
·
2020-06-22 07:01
声纹采集
声纹识别
声纹数据库
kaldi
中文语音识别(1)
目录
kaldi
是什么
kaldi
与中文语音识别编译与安装
kaldi
用
kaldi
进行中文语音识别这3篇博客,详细总结和记录了我编译安装
kaldi
和两种用
kaldi
进行中文语音识别的过程,包括如何
kaldi
的简单介绍
zyziszy
·
2020-06-21 15:53
kadi
机器学习
深度学习
语音识别
kaldi
神经网络
美国 AI 的秘密武器——中国人才,国际局势影响人才流动
去年,国际语音识别领域大神级人物,
Kaldi
之父DanielPovey拒绝了Facebook来到中国选择了小米。上周,英特尔芯片设计师JimKeller离职,中国网友纷纷评论欢迎到中国企业就职。
芒果果
·
2020-06-21 03:44
人工智能
google
microsoft
斯坦福大学
《评人工智能如何走向新阶段》后记(再续23)
364.DanielPovey领衔开发第二版语音识别开源工具
Kaldi
Kaldi
集成了多种语音识别模型,包括隐马尔可夫和深度学习神经网络,被认为是世界语音识别框架的基石。
AI科技大本营
·
2020-06-20 20:30
Kaldi
中MFCC计算源码剖析(二)
在上一篇文章中提到以下四块内容将在本文进行进一步剖析:1、计算mel滤波器组:MelBanks&mel_banks=*(GetMelBanks(vtln_warp));2、fft后的信号计算功率谱:ComputePowerSpectrum;3、功率谱过mel滤波器组:mel_banks.Compute;4、dct_matrix_的计算。一、GetMelBanks该函数在src/feat/featu
MorganCui
·
2020-04-07 16:34
kaldi
常用命令总结(持续更新)
1.查看.mat矩阵的维度信息>matrix-dimexp/tri5a_lstm_train_sp_ali/final.mat401442.查看tree信息>tree-infoexp/tri5a_lstm_train_sp_ali/treenum-pdfs3048context-width3central-position13.特征提取相关提取mfccsteps/make_mfcc.sh--nj1
习惯了千姿百态
·
2020-04-03 23:08
CVTE 开源模型识别效果
模型下载地址:http://
kaldi
-asr.org/models/0002_cvte_chain_model.tar.gz解压放到
kaldi
-trunk/egs下即可,打开终端,链接steps和untils
诸葛村姑
·
2020-04-02 14:44
Linux
kaldi
安装教程
环境:Linux1.下载
kaldi
gitclonehttps://github.com/
kaldi
-asr/
kaldi
.git2.进入到
kaldi
/tools目录make-j4可以根据CPU核心数调整,
v-space
·
2020-03-28 21:27
Kaldi
安装教程
linux
Kaldi
(A2)语音识别术语、HMM拓扑与转移模型
Ref
Kaldi
HMMhttp://
kaldi
-asr.org/doc/hmm.htmlTriphone三音素Ref:语音的基本概念http://blog.csdn.net/zouxy09/article
Seeker_zz
·
2020-03-23 14:28
Kaldi
(A5)语言模型及HCLG.fst生成
RefOnlinedecodingin
Kaldi
(Nnet2)http://
kaldi
-asr.org/doc/online_decoding.html修改语言模型首先,我们为什么要修改语言模型?
Seeker_zz
·
2020-03-21 15:46
Kaldi
中说话人识别打分流程
参考脚本:egs/voxceleb/v2提取Xvector假设我们已经完成了train.sh的训练,并生成了相应的模型数据,诸如:final.raw,mean.vec.plda.transform.mat等确认必要文件存在模型目录下须有final.raw、min_chunk_size、max_chunk_size数据目录下须有feats.scp、vad.scp根据final.raw和extract
黑白格_0ca6
·
2020-03-17 09:45
Git-查看当前的远程仓库
来设定远程仓库的名字为,比如如下使用了--originupstream)$gitremoteupstream-v显示对应的克隆地址
[email protected]
:
kaldi
-asr
kaituoxu
·
2020-03-06 19:21
[
Kaldi
] 特征提取--MFCC(一)
20180629qzd一准备工程目录文件建立在thch30上进行的。s5├───conf├───local├───step├───utils└───data/data_thchs30/(数据)├───train/*.wav├───dev/*.wav└───test/*.wav二数据准备在data内新建train文件夹,这个文件夹内需要三个文件:wav.scp、utt2spk、spk2utt。dat
原来是酱紫呀
·
2020-03-05 02:32
深度学习 CNTK使用入门
如,Theano,caffe,
kaldi
,CNTK等。CNTK是微软提供的基于C++的开源工具包。
xiaozhuo12138
·
2020-02-26 17:56
kaldi
-gpu配置
本篇主要介绍cuda的安装以及
kaldi
下的配置cuda官网下载对应版本https://developer.nvidia.com/compute/cuda/9.2/Prod/patches/1/cuda-repo-ubuntu1604
泉泉酱
·
2020-02-24 02:34
Kaldi
(A4)model文件分析
RefDan'sDNNimplementationhttp://
kaldi
-asr.org/doc/dnn2.html
Kaldi
Lecture4Decodersusedinthe
Kaldi
toolkithttp
Seeker_zz
·
2020-02-22 02:16
[
Kaldi
] 特征提取--MFCC(二)
20180701qzd本章讲解mfcc理论知识一基本含义MFCC是Mel-FrequencyCepstralCoefficients的缩写,顾名思义MFCC特征提取包含两个关键步骤:转化到梅尔频率,然后进行倒谱分析。1.梅尔频率梅尔刻度是一种基于人耳对等距的音高(pitch)变化的感官判断而定的非线性频率刻度。和频率的赫兹的关系如下:所以当在梅尔刻度上面上是均匀分度的话,对于的赫兹之间的距离将会越
原来是酱紫呀
·
2020-02-17 02:18
CUDA的安装和tri2b模型的在线解码
安装过程基本参照
kaldi
全部资料0.7版的教程来,但发现总是编译不出来./cu-vector-test,期间重装了一次系统,最后终于好
诸葛村姑
·
2020-02-16 10:50
语音开源代码与平台
----AlanMathisonTuring一.语音开源代码1.
Kaldi
Kaldi
诞生于2009年的JohnsHopkinsUniversity,刚开始项目重点是子空间高斯模型(SGMM)建模和词汇学习抽样调查
Singularity_
·
2020-02-13 09:45
在ubuntu16.04上用
kaldi
运行timit语音库的教程网页
755790032.https://blog.csdn.net/u010837794/article/details/632517253.http://blog.geekidentity.com/asr/
kaldi
伊恩的道歉
·
2020-02-05 03:01
Kaldi
中说话人识别尝试|TIMIT
参考资料1.
kaldi
基础介绍(一)在说话人识别中的数据准备-monsieurliaxiamen的博客-CSDN博客2.
kaldi
中改写sre10/v1用timitdataset做说话
黑白格_0ca6
·
2020-02-01 23:28
Kaldi
语音识别CVTE模型实战
一.下载训练好的模型下载路径:http://
kaldi
-asr.org/models/m2二.上传&配置1.上传到
kaldi
/egs/目录下2.解压,tar-zxvf0002_cvte_chain_model_v2
云山之巅
·
2020-01-15 09:00
Kaldi
基础代码库及建模
一.通用工具在
kaldi
/src/base/目录下,查看
kaldi
-common.h文件,内容如下://base/
kaldi
-common.h//Copyright2009-2011MicrosoftCorporation
云山之巅
·
2020-01-14 11:00
Kaldi
样例实战
一.前提条件在
kaldi
目录下的子目录
kaldi
/egs/目录下保存着资源管理示例脚本。查看该目录中的README.txt文件,尤其是查看资源管理部分,它提到与语料库相对应的LDC目录号。
云山之巅
·
2020-01-13 14:00
我们基于
kaldi
开发的嵌入式语音识别系统升级成深度学习啦
先前的文章《三个小白是如何在三个月内搭一个基于
kaldi
的嵌入式在线语音识别系统的》说我们花了不到三个月的时间搭了一个基于
kaldi
的嵌入式语音识别系统,不过它是基于传统的GMM-HMM的,是给我们练手用的
davidtym
·
2019-12-30 08:00
Kaldi
(A1)语音识别原理
Ref语音识别的原理https://www.zhihu.com/question/20398418HTKBookhttp://www.ee.columbia.edu/ln/LabROSA/doc/HTKBook21/HTKBook.html如何用简单易懂的例子解释隐马尔可夫模型?https://www.zhihu.com/question/20962240/answer/33438846《统计学习
Seeker_zz
·
2019-12-28 17:56
睡前故事|咖啡的来历
这一天,南柯讲给睡前要吃糖的小喵们讲了一个咖啡来历的故事在1400年前的埃塞俄比亚,有一个叫
kaldi
的放羊老头在山上放羊,日光正烈,晒得百无聊赖的ka
南柯斯摩
·
2019-12-24 23:25
食羊记III
很久很久以前,一个生活在非洲埃塞俄比亚的名叫卡尔迪(
Kaldi
)的少年,有一天发现他饲养的羊兴奋地直跳,就把这个奇怪的现象告诉了附近的修道院。
持明院主
·
2019-12-19 21:07
Kaldi
命令词识别
kaldi
刚刚拿到一个简单语料库练手,发现只有语音和对应文字,这篇文章记录了从数据预处理到
kaldi
对数据进行训练和测试的全过程,这里首先训练单音节模型,其他模型后面再补充。
zqh_zy
·
2019-12-18 10:02
Kaldi
-Timit脚本
数据准备local/timit_data_prep.sh生成的内容放在data/local/data中。对于train、test和dev,分别生成相应的_sph.flist、_sph.scp、.uttids、.trans、.text、_wav.scp、.utt2spk、.spk2utt、.spk2gender、.stm和.glm文件。NOTE:.wavfilesarenotreally.wav,t
kaituoxu
·
2019-12-18 06:29
kaldi
如何自制语料来做中文识别
跑完thchs30后就琢磨着自己录些语料训练和识别,那就开始从网上看资料,大家都推荐按
Kaldi
forDummiestutorial的例子来做,我也跟着例子来写文件。
知行健康
·
2019-12-17 02:50
kaldi
编译与安装
首先下载
kaldi
包gitclonehttps://github.com/
kaldi
-asr/
kaldi
.git然后安装依赖库进toolscdtoolstools文件运行.
知行健康
·
2019-12-14 22:38
语音识别
mfcc提取:http://blog.csdn.net/jojozhangju/article/details/18678861语音识别工具箱之
kaldi
----研究联盟:http://blog.csdn.net
hou_8
·
2019-12-14 16:45
编译
kaldi
扩展工具irstlm
版本:Fedorarelease25(TwentyFive)gccversion6.3.120161221(RedHat6.3.1-1)(GCC)为什么单独拿出来这个说呢?因为从GCC6开始,gcc已经提供cstdlib,这时如果在再使用-isystem,就会报错Infileincludedfrom/usr/include/c++/6.3.1/ext/string_conversions.h:41
喜欢看做饭
·
2019-12-14 11:11
日志
/////////////////////////////////////mengweilun@mengweilun-Lenovo-ideapad-Y700-15ISK:~/
kaldi
-master/egs
伊恩的道歉
·
2019-12-14 10:08
timit实例训练
1.进入对应的目录,进行如下操作:zhangju@ubuntu:~$cd
kaldi
-trunk/egs/timit/s5/zhangju@ubuntu:~/
kaldi
-trunk/egs/timit/s5
伊恩的道歉
·
2019-12-14 04:16
Kaldi
语音识别快速入门
一.简介
Kaldi
是使用C++编写的语音识别工具包,ApacheLicensev2.0许可。主要供语音识别研究人员使用。
Kaldi
的目标和范围与HTK类似。目标是拥有易于修改和扩展的现代而灵活的代码。
云山之巅
·
2019-12-11 19:00
Kaldi
(A0)安装
简介
Kaldi
是什么大家百度一下就知道了。大概就是一堆语音识别和处理有关的程序包啦。
Seeker_zz
·
2019-12-08 14:36
kaldi
环境配置:ubuntu16.04+nvidia375+cuda8.0避坑安装
配这个环境大概也就重装了三遍吧(微笑)这条针对双系统重装ubuntu的同学:easybcd删除引导然后win+x删除分区启动盘格式化NTFS格式重新做ubuntuU盘镜像(我也不知道为什么!!)分区(参考http://www.jianshu.com/p/2eebd6ad284d)1)分配16G空间给/分区,选择“主分区”、“空间起始位置”、Ext4和“挂载点/”2)分配16G空间给swap分区,选
鱼绿子
·
2019-12-07 10:54
[
Kaldi
] 孤立词识别(yesno)(一)
20180627qzd一数据准备waves_yesno总共60个wav文件,采样率都是8k,wav文件里每一个单词要么”ken”要么”lo”(“yes”和”no”)的发音,所以每个文件有8个发音,文件命名中的1代表yes发音,0代表no的发音.数据准备local/prepare_data.shwaves_yesno生成wavelist文件生成waves.test和waves.train将waves
原来是酱紫呀
·
2019-12-06 14:34
音频工具
kaldi
部署及模型制作调研学习
语音识别简介语音识别(speechrecognition)技术,也被称为自动语音识别(英语:AutomaticSpeechRecognition,ASR)、计算机语音识别(英语:ComputerSpeechRecognition)或是语音转文本识别(英语:SpeechToText,STT),其目标是以计算机自动将人类的语音内容转换为相应的文字。按照不同纬度如下分类:按词汇量(vocabulary)
努力跑在岁月之前
·
2019-12-02 18:00
邀你加入小米语音首席科学家Daniel Povey团队
10月19号,语音识别开源工具
Kaldi
的创始人、语音和AI领域大佬DanielPovey正式加入小米。
小米手机
·
2019-12-02 00:00
kaldi
安装srilm及使用
今天看语言模型如何生成,很多资料都提示用srilm来生成,那就搜索如何安装和使用。在网上查了很多资料都没搞定,花了4个小时左右终于安装完成并能做简单测试,这里简单记录一下整个过程。准备工作先参考SRILM的安装与使用文章,安装各种依赖,其中查看依赖,直接输入which包名即可,例如检查gawk是否安装,输入命令whichgawk查看是否存在,把没有安装的依赖包安装好。要特别注意TCL的安装,下载地
知行健康
·
2019-11-30 22:45
如此科技的一周 | 小米周报
小米语音首席科学家、语音识别开源工具
Kaldi
的创始人、语音和AI领域大佬DanielPovey,也带来主题演讲,和大家分享了他即将带领全新团队打造新一代“PyTorch-y”
Kaldi
的计划
小米手机
·
2019-11-22 00:00
小爱同学3.0正式发布!对Ta说“立即升级”就能体验
11月20日,语音识别开源工具
Kaldi
的创始人、语音和AI领域大佬DanielPovey,出席「小米AI生态峰会暨小爱同学3.0发布会」。
小米手机
·
2019-11-20 00:00
小爱同学3.0正式发布!对Ta说“立即升级”就能体验
11月20日,语音识别开源工具
Kaldi
的创始人、语音和AI领域大佬DanielPovey,出席「小米AI生态峰会暨小爱同学3.0发布会」。
小米手机
·
2019-11-20 00:00
小爱同学3.0正式发布!对Ta说“立即升级”就能体验
11月20日,语音识别开源工具
Kaldi
的创始人、语音和AI领域大佬DanielPovey,出席「小米AI生态峰会暨小爱同学3.0发布会」。
小米手机
·
2019-11-20 00:00
2019-01-16
I'mtraining
Kaldi
'sAishellmandarinmodeltoday,andtherecomeserror""Failedtoallocateamemoryregionof5625610240bytes.PossiblythisisduetosharingtheGPU.TryswitchingtheGPUstoexclusivemode
汪汝鹤Carl
·
2019-11-08 17:10
实验室cuda安装
以下是实验室linux服务器cuda安装和
kaldi
带cuda编译的流程,在pcc和pc上测试通过。
雨月梵雨时鸢
·
2019-11-05 22:13
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他