E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
声学模型
FAAC源码阅读(5)——AAC编码模块的功能
1、心理
声学模型
心理
声学模型
主要利用了下面的声学原理:最小掩蔽阈值、临界子带频率分析、频域掩蔽、时域掩蔽和感知熵。
nb_vol_1
·
2017-02-09 21:56
Android 之NDK实战系列(3)——Android Studio下使用lame 进行简单的转换
是一款出色的MP3压缩程序,它使用了独创的人体听音心理学模型和
声学模型
,改变了人们对MP3高音发哑、低音发破的音质的印象。——百度百科通过前两篇博文,大家已经对C、NDK的使用有了一定的认识,现在就
Adrian24
·
2016-12-05 14:08
ndk
c语言
Android
Lame
Android
NDK
Lame
笔记——kaldi中关于
声学模型
final.mdl的打印
初学kaldi语音识别,在Linux上查看文件不像Windows那么简单易行。在kaldi的egs文件夹中有许多的示例程序,当你成功跑完之后,在相应的示例程序目录下有exp文件夹,这里面包括示例训练出来的一些模型文件。跑完Thchs30之后,exp目录,在mono目录下有final.mal,想看看这文件中是什么内容,但就是打不开,试了好多查看文件软件,在网上也查阅了很多关于.mdl文件的信息,初步
Toby_fbby
·
2016-10-12 10:14
笔记
如何用kaldi训练好的DNN模型做在线识别
一种情况是,用已有的
声学模型
和新训练的语言模型。语言模型可以同srilm等工具训练,但是怎样将语言模型与DNN
声学模型
一起来进行识别的。
Inger_H
·
2016-10-11 17:55
ASR
语音专题第三讲,
声学模型
出现这种趋势的原因,首先是计算能力的不断提升,通用GPU等高计算能力设备的发展,使得训练更复杂、更强大的
声学模型
(AcousticModel,AM)变得可能,高性能的嵌入式处理器的出现,使语音识别的终端应用变得可能
我把葡萄酿成酒
·
2016-09-01 10:06
语音识别
宾西法尼亚大学强制对齐标注软件(P2FA)介绍以及使用说明
它包括美式英语的
声学模型
,用来强制对齐的python文件以及readme文件和一些例子。
JamesJuZhang
·
2016-07-19 01:09
自动标注
P2FA
Speech
Recognition
语音识别中基于规则的语言模型
语音识别中基于规则的语言模型一语言模型的选择语音识别一般分为两个阶段:1)语音识别阶段:这个阶段利用语音的
声学模型
,把自然的声音信号转换为机器可以处理的数字表达的音节形式。
lihaitao000
·
2016-04-17 13:00
数据挖掘
机器学习
自然语言处理
语音识别
语音识别之语言模型----前缀搜索算法
本文我们来讲一下语言模型之前缀搜索算法,我们知道通过
声学模型
神经网络出来会产生一个概率矩阵,当然根据这个矩阵,我们可以直接使用最大概率法来找到一个看似概率最大的字符链,但是,那样并不是最优的序列.由于我们这里使用的是
断桥残雪zzw
·
2016-04-10 17:00
语言模型
CTC前缀搜索
GPU训练的快速大规模分布式扩展-GPU多机多卡Machine Learning Middleware
面对如此复杂的语音数据,我们后端的语音识别
声学模型
就一定要尽可能的覆盖各种可能的场景,包括各种对话、各种声道、各种噪音甚至各种口音,而要覆盖这些场景,就要求我们用海量的数
weixin_33937499
·
2016-03-28 13:51
人工智能
大数据
后端
教你如何在树莓派上搭建语音识别服务
最近项目原因需要我完成一个在树莓派上的离线语音识别,忙活了近一周,起初用了开源的PocketSphinx,但是不得不说,识别率低的惊人,甚至可以说有些字词根本没法识别,除非你自己制作
声学模型
,不然这玩意儿就是个摆设
9ian1i
·
2016-03-27 18:40
树莓派
【sphinx】sphinx文档学习笔记
按平台来说,sphinx2可以作为嵌入式平台的选择按研究来说,如果研究
声学模型
和快速GMM计算的研究,选sphinx3;如果研究搜索算法,选sphinx4;如果做自适应和
声学模型
生成,可以用sphinxtrain
luoyinqq
·
2015-11-26 18:00
GMM-HMM语音识别模型
GMM-HMM语音识别模型原理篇http://blog.csdn.net/abcjennifer/article/details/27346787
声学模型
https://zh.wikipedia.org
u012176591
·
2015-11-22 16:00
Sphinx武林秘籍(上)
Sphinx武林秘籍(上) ――使用现有的语言模型与
声学模型
一、 使用平台 Windows XP、VMware workstation+ Ubuntu10.10
·
2015-11-13 11:35
sphinx
Sphinx语音识别学习记录 (五)-错误调试
CMUSphinx系列目录 如何解决使用别的
声学模型
的时候出现的问题 使用别人训练好的hmm模型的时候一直报以下错误(我这里使用的Communicator_40.cd_cont
·
2015-11-13 10:37
sphinx
PocketSphinx语音识别系统语言模型的训练和
声学模型
的改进
PocketSphinx语音识别系统语言模型的训练和
声学模型
的改进 zouxy09@qq.com http://blog.csdn.net/zouxy09
·
2015-11-09 12:59
sphinx
sphinx 语音识别搜索的总结
我们知道语音识别一般包括语言模型和
声学模型
。而语音识别就是要在搜索空间中找到最有可能的字的序列。我们一般是按句来处理的。一句话有许多词所组成,我们所要做的就是确定一句话,中的那些词即字。
taiyb
·
2015-06-15 22:00
sphinx
语音识别
HMMStateState API
本类的属性: privateHMMStatehmmState;为一个hmm模型的hmm状态此为
声学模型
中的。
taiyb
·
2015-06-15 22:00
sphinx
语音识别
区分性训练
声学模型
的初始模型训练都是基于MLE(MaximumLikelihoodEstimation)准则的,该方法简单,训练速度快,但是没有考虑到模型之间的区分性,导致识别中易发生混淆.解决:区分性训练(MMIMaximumMutualInformation
jiaobei2354717
·
2015-04-22 11:13
一个典型的语音识别系统
其关键技术包括选择识别单元、语音端点检测、特征参数提取、
声学模型
及语音模型的建立。语音识别技术目前在桌面系统、智能手机、导航设备等嵌入式领域均有一定程度的应用。其主要技
u012637501
·
2015-01-05 16:00
语音识别
六、改进现有的
声学模型
改进现有的
声学模型
Jiangdg_VIPhttp://blog.csdn.net/u012637501译自:http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx
裂缝中的阳光JDG
·
2014-11-10 14:57
自然语言识别研究
sphinx
应用程序
语音识别
六、改进现有的
声学模型
改进现有的
声学模型
Jiangdg_VIPhttp://blog.csdn.net/u012637501译自:http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx
u012637501
·
2014-11-10 14:00
sphinx
应用程序
语音识别
七、训练自己的
声学模型
训练自己的
声学模型
Jiangdg_VIPhttp://blog.csdn.net/u012637501 译自: http://cmusphinx.sourceforge.net/wiki/tutorialam
u012637501
·
2014-11-10 00:00
sphinx
应用程序
语音识别
三、Pocketsphinx_Android中英文小范围高准确率
这和pocketsphinx语音识别所用的语言模型和
声学模型
相关。pocketsphinx-0.8源码自带几个语言模型和
声学模型
,pocketsphinx-0.7/model/hmm
u012637501
·
2014-10-27 12:00
android
sphinx
语音识别
一、PocketSphinx-Android DNK环境搭建
PocketSphinx-AndroidDNK环境搭建 基于Pocketsphinx_Android语音识别实际上就是一个通过jni编程调用微软写的sphinx和pocketsphinx函数库(这两个库都是C语言写的),然后通过
声学模型
分析录入的语音
u012637501
·
2014-10-26 21:00
android
sphinx
语音识别
Sphinx武林秘籍(下)
――使用训练好的语言模型与
声学模型
一、第一次使用#cp-rfmy_db.cd_cont_1000/usr/local/bin#cd..
mirkerson
·
2014-09-01 14:00
Sphinx武林秘籍(中)
――训练自已的中文语言模型与
声学模型
一、训练语言模型 (1) 安装语言模型训练工具CMUCLMTK .
mirkerson
·
2014-09-01 14:00
Sphinx武林秘籍(上)
Sphinx武林秘籍(上)――使用现有的语言模型与
声学模型
一、 使用平台WindowsXP、VMwareworkstation+Ubuntu10.10(1)Soundrecorder测试下能否使用
mirkerson
·
2014-09-01 14:00
Shohix3
声学模型
的训
1训练的基本步骤:...32模拟未绑定状态的场景依赖音素的注意事项:...43你所需准备的数据...44,训练之前需检查的项...56当你有一个非常小的闭合的词汇表(字典)(50—60字):...67“base”集合和高阶特征向量...68特征流(featuresstreams)...69训练连续模型...710创建模型定义文件:文件后缀为.mdef711,创建HMM拓扑文件文件后缀为.topo.
taiyb
·
2014-08-14 23:00
翻译
Android离线语音识别-中英文,小范围,高准确率
这和pocketsphinx语音识别所用的语言模型和
声学模型
相关。
Vintage_1
·
2014-07-30 21:00
android
sphinx
语音识别
Pocketsphinx语音识别--重新训练
声学模型
研究如何提高识别率的问题。1.重新训练。找到正确的训练方法。工具:http://sourceforge.net/projects/cmusphinx/files/依次下载最新版的:Pocketsphinx—用C语言编写的轻量级识别库,主要是进行识别的。Sphinxbase—Pocketsphinx所需要的支持库,主要完成的是语音信号的特征提取;CMUclmtk—语言模型训练工具Sphinxtrai
皮熊
·
2014-03-26 11:23
语音识别与语音合成
语音识别系统原理介绍---从gmm-hmm到dnn-hmm
按照上图的说法,语音识别是由语言模型和
声学模型
构成的。下面我就根据图上的流程说
u010384318
·
2014-01-19 21:00
语音识别
gmm-hmm
dnn-hmm
dbn-hmm
语音识别系统的声学建模:隐马尔可夫模型(HMM)
转自:http://blog.1688.com/article/i25547966.html【导读】语音识别系统的模型通常由
声学模型
和语言模型两部分组成,分别对应于语音到音节概率的计算和音节到字概率的计算
caiye917015406
·
2013-08-07 09:00
语音识别概念的简单理解
2,语言模型语言模型可以提供字或词之间的上下文信息和语义信息,通过语言模型可以提高
声学模型
的区分度,语言模型主要分为规则模型和统计模型两种,当前,统计语言模型在实际应用中处于主流地位。
j_am_jack
·
2013-02-05 18:00
隐含马尔可夫模型在语言处理中的应用~~“
声学模型
”
前言:隐含马尔可夫模型是一个数学模型,到目前为之,它一直被认为是实现快速精确的语音识别系统的最成功的方法。复杂的语音识别问题通过隐含马尔可夫模型能非常简单地被表述、解决,让我不由由衷地感叹数学模型之妙。自然语言是人类交流信息的工具。很多自然语言处理问题都可以等同于通信系统中的解码问题--一个人根据接收到的信息,去猜测发话人要表达的意思。这其实就象通信中,我们根据接收端收到的信号去分析、理解、还原发
hhko12322
·
2012-12-12 15:00
语音识别中
声学模型
得分计算优化方法
摘要语音是人们沟通交流最直接、最自然的交互方式。自计算机问世以来,人们就一直希望可以通过语音实现人和计算机之间的交互,而语音识别技术,目标就是通过把人类的语音中的词汇内容转换为相应的文本,架起了人机交互的桥梁。对于一个语音识别系统,速度和精度是两个核心指标,直接决定着系统是否可用。其中,识别速度的提升意味着可以降低成本,同时提供更多的语音服务,一直是语音识别技术研究的重点方向。在语音识别系统中,声
百度技术
·
2012-10-22 14:36
性能
快速高斯计算
语音识别
多媒体技术
语音识别中
声学模型
得分计算优化方法
摘要 语音是人们沟通交流最直接、最自然的交互方式。自计算机问世以来,人们就一直希望可以通过语音实现人和计算机之间的交互,而语音识别技术,目标就是通过把人类的语音中的词汇内容转换为相应的文本,架起了人机交互的桥梁。对于一个语音识别系统,速度和精度是两个核心指标,直接决定着系统是否可用。其中,识别速度的提升意味着可以降低成本,同时提供更多的语音服务,一直是语音识别技术研究的重点方向。在语
百度技术
·
2012-10-22 14:36
性能
语音识别
快速高斯计算
PocketSphinx语音识别系统
声学模型
的训练与使用
PocketSphinx语音识别系统
声学模型
的训练与使用zouxy09@qq.comhttp://blog.csdn.net/zouxy09
声学模型
主要用于计算语音特征和每个发音模板之间的似然度
zouxy09
·
2012-09-10 10:00
list
Parameters
Dictionary
Training
variables
PocketSphinx语音识别系统语言模型的训练和
声学模型
的改进
PocketSphinx语音识别系统语言模型的训练和
声学模型
的改进zouxy09@qq.comhttp://blog.csdn.net/zouxy09 关于语音识别的基础知识和sphinx的知识
zouxy09
·
2012-09-06 09:00
search
语言
工具
Matrix
模型工具
CMU_Sphinx语音识别补充
1.XP下最终能成功的识别英语的,不过用的是训练好的
声学模型
,直接拷贝sphinx中的hub4wsj_sc_8k的模型,语言模型就如博客中所述,根据需求要识别的单词。
taniya001
·
2012-06-19 16:00
XP
语言
语音识别中
声学模型
得分计算优化方法
摘要 语音是人们沟通交流最直接、最自然的交互方式。自计算机问世以来,人们就一直希望可以通过语音实现人和计算机之间的交互,而语音识别技术,目标就是通过把人类的语音中的词汇内容转换为相应的文本,架起了人机交互的桥梁。对于一个语音识别系统,速度和精度是两个核心指标,直接决定着系统是否可用。其中,识别速度的提升意味着可以降低成本,同时提供更多的语音服务,一直是语音识别技术研究的重点方向。在语
百度技术
·
2012-06-18 09:54
性能
语音识别
快速高斯计算
语音识别中
声学模型
得分计算优化方法
摘要语音是人们沟通交流最直接、最自然的交互方式。自计算机问世以来,人们就一直希望可以通过语音实现人和计算机之间的交互,而语音识别技术,目标就是通过把人类的语音中的词汇内容转换为相应的文本,架起了人机交互的桥梁。对于一个语音识别系统,速度和精度是两个核心指标,直接决定着系统是否可用。其中,识别速度的提升意味着可以降低成本,同时提供更多的语音服务,一直是语音识别技术研究的重点方向。在语音识别系统中,声
百度技术
·
2012-06-18 09:54
性能
快速高斯计算
语音识别
其他技术
MP3编码技术原理
www.eefocus.com/jjbearustc/blog/07-09/3460_8d0d0.html#articletopMP3编码主要由3大功能模块组成,包括混合滤波器组(子带滤波器和MDCT),心理
声学模型
sunnylgz
·
2012-05-30 10:00
CMU sphinx学习(――训练自已的中文语言模型与
声学模型
)
http://www.cnblogs.com/huanghuang/archive/2011/07/18/2109101.html同样是在该博客的基础上针对XP系统一、训练语言模型(1)安装语言模型训练工具CMUCLMTKVS2010直接编译即可(2)准备训练的文档在.txt中输入如下内容,记住结尾不可留“\n”(实验证明了这一点)。切记后有空格啊前也有空格,我不知道怎么就没了空格,找了好久的原因
tina
·
2011-12-19 17:14
语言
search
dictionary
variables
parameters
parsing
CMU sphinx学习(――训练自已的中文语言模型与
声学模型
)
http://www.cnblogs.com/huanghuang/archive/2011/07/18/2109101.html同样是在该博客的基础上针对XP系统 一、训练语言模型 (1)安装语言模型训练工具CMUCLMTK VS2010直接编译即可 (2)准备训练的文档在.txt中输入如下内容,记住结尾不可留“\n”(实验证明了这一点)。切记后有空格啊前也有空格,我不知道
taniya001
·
2011-12-19 17:00
search
语言
Parameters
Dictionary
Parsing
variables
Sphinx4语音识别的框架
Linguist把任何类型的标准语言模型,字典的发音信息以及一些
声学模型
的结构信息转换为一个SearchGraph。
rfc2008
·
2011-12-09 17:50
开源
语音识别
sphinx
LAME
是一款出色的MP3压缩程序,它使用了独创的人体听音心理学模型和
声学模型
,改变了人们对MP3高音发哑、低音发破的音质的印象。http://lame.sourceforge.net/
qingkong8832
·
2011-09-08 16:00
AC3简介及压制攻略
AC3(AudioCoding3)是Dolby(R)杜比公司于1996年开发的一种先进的音频编码模式,它是DVD音频的标准,其编码完全是数字的,压缩比约为1:9~10,但解码后可得符合人耳
声学模型
(0~
Siobhan
·
2010-10-28 10:00
filter
dll
音乐
工具
影视
audio
心理
声学模型
table读取之介绍
一、l3psy.c简单介绍 只要做过心理
声学模型
的,对l3psy.c这个文件应该不陌生,该文件由 voidL3_psycho_initialise(void) voidL3_psycho_analize
sshcx
·
2008-01-13 22:00
function
table
存储
扩展
Parameters
Signal
上一页
1
2
3
4
5
6
7
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他