E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
说话人识别
Kaldi学习笔记:01(kaldi/egs/sitw/v1)run.sh解析
kaldi学习笔记-01-sitw简介脚本修改run.sh简介研究生阶段入坑了
说话人识别
方向,最近在学习如何使用Kaldi提取i-vector进行
说话人识别
,在这里记录一下学习的笔记。
qijiajun97
·
2020-08-25 03:29
KALDI之aishell模型
说话人识别
之V1
1.首先,成功安装kaldi在服务器上,用gitclone那种方式安装(和在本地Unbuntu乌班图环境安装没区别)。2数据准备部分然后进入目录cdegs/aishell/V12.1首先改cmd的配置:vimcmd.sh1改为:exporttrain_cmd=run.pl#"queue.pl--mem2G":wq保存后。2.2输入:vimrun.sh看见data=/export/a05/xna/d
落雪snowflake
·
2020-08-25 02:23
KALDI工具
说话人识别
VoxCeleb2:深度
说话人识别
VoxCeleb2:DeepSpeakerRecognitionJoonSonChung†,ArshaNagrani†,AndrewZissermanVisualGeometryGroup,DepartmentofEngineeringScience,UniversityofOxford,UK{joon,arsha,az}@robots.ox.ac.ukVoxCeleb2数据集可以从http下载:
落雪snowflake
·
2020-08-25 02:23
论文翻译
深度学习声纹识别
kaldi中声纹识别例子大概步骤综述
如何利用kaldi搭建
说话人识别
的例子。仅仅是搭建,具体的很多参数的调整需要大家根据数据集的不同慢慢调整。
落雪snowflake
·
2020-08-25 02:52
深度学习声纹识别
KALDI工具
声纹识别中PLDA的域自适应的通用框架
AGENERALIZEDFRAMEWORKFORDOMAINADAPTATIONOFPLDAINSPEAKERRECOGNITION2020顶会论文学习提出了一种用于
说话人识别
中的概率线性判别分析(PLDA
落雪snowflake
·
2020-08-25 02:52
深度学习声纹识别
使用未经监督的对抗性不变进行强力
说话人识别
ROBUSTSPEAKERRECOGNITIONUSINGUNSUPERVISEDADVERSARIALINVARIANCERaghuveerPeri,MonisankhaPal,ArindamJati,KrishnaSomandepalli,ShrikanthNarayananSignalAnalysisandInterpretationLaboratory,UniversityofSouthe
落雪snowflake
·
2020-08-25 02:52
深度学习声纹识别
声扬科技CTO陈东鹏:声纹识别将是金融风控的下一个“爆点”
声纹识别也被称为「
说话人识别
」,它最主要的功能是确认说话人的身份。和其他生物
itwriter
·
2020-08-21 08:00
矢量量化(VQ)
http://www.cnblogs.com/xingshansi/p/6925955.html前言VQ(VectorQuantization)是一个常用的压缩技术,本文主要回顾:1)VQ原理2)基于VQ的
说话人识别
大盗零妖qaq
·
2020-08-20 05:40
测试分类沙漠
语音识别技术
与
说话人识别
及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。简介:语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。
云计算小百科
·
2020-08-19 23:38
说话人识别
中训练通用背景模型(UBM)的研究
摘要:以高斯分布为基础的
说话人识别
系统使用通用背景的模型(UBM)需要广泛的数据资源尤其是多信道和多个麦克风种类下采集语音。
夕夕如盼
·
2020-08-19 06:52
机器学习
声纹识别
语音入门
说话人识别
之GMM-UBM系统
SpeakerVerificationUsingAdaptedGaussianMixtureModels每个人的声音都有独特的特征,这个特征由两个音素决定:1.声腔的尺寸2.发声器官被操纵的方式这些因素使得声音变得独一无二一:
说话人识别
流程先进行特征提取
唐维康
·
2020-08-19 04:24
语音识别基本概念
说话人识别
的基础知识1.语音的产生声门:两片声带之间的空间叫声门主声道:声带即声门以上,经过咽喉,口腔的通道鼻道:经过小舌和鼻的管道声道是分布参数系统,为谐振腔分布参数系统即系统状态变化不能只由有限个参数变化描述
贻我彤管
·
2020-08-19 03:13
语音识别
声纹识别GMM-UBM
背景:
说话人识别
过程主要有三个模块,分别为:特征提取,模型训练以及模式匹配与判决。
林林宋
·
2020-08-19 03:26
合成基础
转发大神关于
说话人识别
的ivector系统的说明,看了瞬间懂了
作者:Leon晋链接:https://www.zhihu.com/question/63978977/answer/215215119来源:知乎1、先用一部分训练集(包含多个说话人),通过EM期望最大化算法,训练UBM通用背景模型;通常我们会先训练一个协方差对角矩阵,再训练全矩阵,理由如下:1、M阶高斯的稠密全矩阵UBM效果等同于一个更大高斯分量的对角矩阵;2、对角UBM较为稀疏,计算量低效率快;
qq_27292549
·
2020-08-19 03:09
声纹识别之PLDA算法描述
之前我写过《我对
说话人识别
/声纹识别的研究综述》,本篇基本上可以是这个综述的续写。其实,写的也没有什么深度,想获得深度信息的朋友们可以不用往下看了,还不如下载几篇领域内的国内博士论文看看。
Orange先生
·
2020-08-19 02:28
机器学习
PLDA
声纹识别
机器学习
多麦克风降噪—DS(窄带)
噪声环境:不可控,由干扰源组成并且统计上不稳定(这样的噪声环境将导致单通道降噪使目标语音失真)
说话人识别
理想
徐有容迷妹
·
2020-08-15 15:03
多麦克风降噪
MFCC一些知识与Kaldi中的MFCC特征解读
因为想用Kaldi去实现一个GMM-UBM的
说话人识别
和loglike打分,所以想把Kaldi计算的统计量对一对,看能不能把二进制文件里的数值单独拿出来,自己写个代码做结合Kaldi中的MAP做统计量计算
RoadmanG
·
2020-08-08 21:50
Kaldi
声纹识别
语音信号处理入门书籍
语音信号处理一般包括以下几个部分:(1)语音信号的声学基础及产生模型(2)语音信号的特征分析(时域,频域以及时频)(3)语音编码(4)语音识别和
说话人识别
(5)语音合成本文列出了以下三本书籍,个人感觉第一本最适合初学者入门使用
qq_33874667
·
2020-08-08 19:28
语音识别
基音周期估计
基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、
说话人识别
、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等
晏温
·
2020-08-08 19:29
基于Kersa实现的声纹识别
记录优秀的Doi技术团队学习经历本文链接:基于Kersa实现的声纹识别基于Kersa实现的声纹识别本项目是基于VGG-Speaker-Recognition开发的,本项目主要是用于声纹识别,也有人称为
说话人识别
夜雨飘零1
·
2020-08-04 23:17
TensorFlow
深度学习
深度学习
tensorflow
Keras
声纹识别
说话人识别
语音识别技术
与
说话人识别
及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。简介:语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。
云计算小百科
·
2020-07-31 16:00
语音识别技术
与
说话人识别
及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。简介:语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。
云计算小百科
·
2020-07-30 19:02
语音识别技术
与
说话人识别
及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。简介:语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。
云计算小百科
·
2020-07-30 17:26
基于GMM-UBM的
说话人识别
MSR Identity Toolkit
说话人识别
MSRIdentityToolkit使用微软的声纹识别工具箱,记录使用步骤该工具箱包含了常规的基于GMM-UBM方法以及state-of-the-art的基于i-vector方法,本文记录的是
373955482
·
2020-07-30 12:17
语音识别
语音识别技术
与
说话人识别
及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。简介:语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。
云计算小百科
·
2020-07-30 01:04
一些常用的语音特征提取算法
说话人识别
是指软件或硬件接收语音信号,识别语音信号中出现的说话人,然后识别说话人的能力。特征提取是通过将语音波形以相对最小的数据速率转换为参数表示形式进行后续处理和分析来实现的。
凌逆战
·
2020-07-29 22:14
从
说话人识别
demo开始学习kaldi--(5)compute_vad_decision.sh
#!/bin/bash#Copyright2017VimalManohar#Apache2.0#Toberunfrom..(onedirectoryupfromhere)#see../run.shforexample#ComputeenergybasedVADoutputnj=4cmd=run.plvad_config=conf/vad.confecho"$0$@"#Printthecommand
Grace_yanyanyan
·
2020-07-29 13:36
文本无关的
说话人识别
综述(一)----简介
一引言
说话人识别
简介:也叫做声纹识别,通过声音识别说话的人是谁。(注意跟语音识别的区别)
说话人识别
的可行性:1、物理层面
whu_paprika
·
2020-07-29 12:16
说话人识别
文本无关的
说话人识别
综述(三)----说话人模型
本文是读书笔记。个人比较浅显的理解,其中有一些专业词汇也是个人自己的翻译,如果有不对的希望大家指正。来自论文《Anoverviewoftext-independentspeakerrecognition:Fromfeaturestosupervectors》的第四章节===========================分界线================================这篇博客
whu_paprika
·
2020-07-29 12:16
说话人识别
说话人识别
声纹识别
说话人模型
学习
说话人识别
和验证的判别特征
LearningDiscriminativeFeaturesforSpeakerIdentificationandVerification学习
说话人识别
和验证的判别特征摘要任何文本独立的说话者识别和/或验证系统的成功依赖于系统学习辨别特征的能力
落雪snowflake
·
2020-07-29 12:31
论文翻译
深度学习声纹识别
MFCC & PLP
##MFCC对于语音/
说话人识别
,最常用的声学特征是梅尔导谱系数(mel-scalefrequencycepstralcoefficient,MFCC)。
shichaog
·
2020-07-29 11:33
语音识别
MFCC
Linear Discriminant Analysis(LDA)
该算法在很多地方都有使用:语音识别,
说话人识别
等等,那么今天在这里就为大家详细介绍一下,最终把matlab代码放在我的git上,有兴趣的可以去看一下,好了不多说,直接进入主题。
爱国者002
·
2020-07-29 10:43
语音识别
kaldi基础介绍(一)在
说话人识别
中的数据准备
在kaldi
说话人识别
示例(egs/sre10,egs/sre16)中,数据总共有两大类,一是训练集(training),二是评估数据集(evaluation)。
monsieurliaxiamen
·
2020-07-29 10:45
说话人识别
基于x-vector的文本无关
说话人识别
这篇文章分两部分,第一部分介绍x-vector的
说话人识别
细节算法,第二部分是对最新技术的跟进,本质是对训练数据做了dataaugmentation,x-vector方法在kaldi上的实现细节将在下一篇文章中展示
monsieurliaxiamen
·
2020-07-29 10:45
说话人识别
文本无关的
说话人识别
综述(二)----特征提取
本文是读书笔记。个人比较浅显的理解,其中有一些专业词汇也是个人自己的翻译,如果有不对的希望大家指正。来自论文《Anoverviewoftext-independentspeakerrecognition:Fromfeaturestosupervectors》的第三章节的特征提取部分。===================================分割线====================
whu_paprika
·
2020-07-29 09:32
说话人识别
基于深度神经网络特征提取的文本无关的
说话人识别
部分转自https://blog.csdn.net/monsieurliaxiamen/article/details/79638227对文章“Deepneuralnetworkembeddingsfortext-independentspeakerverification”的解读。1.概要在实际应用中,往往被测试者或被验证者的语音长度相对较短,若使用传统的PLDA/ivector模型效果会相对一
wxn704414736
·
2020-07-29 00:01
深度学习
【声纹识别】 EER
EqualErrorRate,这个在
说话人识别
,说话人确认中最常用的评价标准,是一种使错误接受
SoWhat1412
·
2020-07-16 05:51
声纹识别
语音信号处理第十章
说话人识别
系统设计系统框图
说话人识别
系统框图
说话人识别
是一个二值问题,只需判定是否为申请者所讲。
jieyannnhereCREAM
·
2020-07-14 12:15
语音信号处理
kaldi中的egs文件夹中的demo都是干什么的
aishell:里面有两文件夹,S5是一种语音识别方法的demo,V1是一种
说话人识别
的demo。数据用的就是aishell1。aishell2:只有S5,也就是语音识别。
Grace_yanyanyan
·
2020-07-12 18:56
kaldi学习
Milvus 实战|生物多因子认证系列 (一):声纹识别
|什么是声纹识别声纹识别(又称
说话人识别
)是从说话人发出的语音信号中提取声纹信息,并对说话人进行身份验证的一种生物识别技术。简单来说,声纹识别技术可以“确认说话人是谁”。
ZILLIZ RDS
·
2020-07-12 14:14
Milvus
深度学习
声纹识别
语音识别
特征向量
embedding
Kaldi TIMIT x-vector
说话人识别
(声纹识别)
1前言本文使用TIMIT语料库,参考aishell使用x-vector进行
说话人识别
,现有的资料都是i-vector.本文参考了很多资料,如果想要了解如何使用TIMIT和ivector进行
说话人识别
,那么建议从
RanleyYu
·
2020-07-11 16:19
01-说话人语音识别
语音转文本的github项目:https://github.com/buriburisuri/speech-to-text-wavenetGMM(GaussMixtureModel高斯混合模型)在
说话人识别
中的应用
cbd_2012
·
2020-07-11 03:09
语音识别
如何三步搭建一套声纹系统
背景介绍声纹检索,顾名思义就是
说话人识别
,通过声音来验证或者识别说话人的声音。声纹识别的关键步骤就是声音向量化,将说话人的声音将其转化成结构化的向量。
阿里云云栖号
·
2020-07-10 14:32
我是程序员
声纹识别中深度学习实践应用之一-------------------------------------------------------------------------------特征提取方面
声纹识别,也就是
说话人识别
,利用计算机识别说话人的身份ID,相当于说话人的身份证一样的标识。通过建立声纹识别系统模型,通过数据训练,更新参数计算,最后确立一个比较不错的模型。
落雪snowflake
·
2020-07-10 09:45
深度学习声纹识别
机器学习
深度学习
语音信号处理(2):文本相关的声纹识别系统(MFCC、VQ)
声纹识别又叫
说话人识别
,它和语音识别存在一点差别。 b.梅尔频率倒谱系数(MFCC)
雨寒sgg
·
2020-07-10 04:26
Speech
Signal
Processing
声纹识别
也称为
说话人识别
,有两类,即说话人辨认和说话
haima1998
·
2020-07-09 16:04
音频处理
声纹采集是什么?标准声纹采集终端设备的作用是什么?
声纹识别,也叫做
说话人识别
是一项根据语音波形中反映说话人生理和行为特征的语音参数,来识别语音说话者身份的技术。
快商通AI
·
2020-07-09 11:32
干货
声纹识别2
声纹识别,也称作
说话人识别
,是一种通过声音判别说话人身份的技术。
twinkle_star1314
·
2020-07-09 09:04
声纹识别
声纹识别:走出实验室,迈向产业化 | 会员专栏
对计算机来说,这种能力就是声纹识别,又称
说话人识别
,它基于语音中所包含的说话人特有的个性信息,自动鉴别当前语音对应的说话人身份,是一种简单、优雅、安全的生物特征识别技术。
DatapiTHU
·
2020-07-09 07:44
kaldi中声纹识别ivector模型
1.数据准备:无论使用kaldi来做语音识别还是
说话人识别
,第一步就是数据准备,对于
说话人识别
来说,需要准备的几个文件为wav.scp,utt2spk,spk2utt这三个文件。
aliceyixin
·
2020-07-05 19:46
Kaldi学习
上一页
1
2
3
4
5
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他