E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
i-vector
【论文阅读】X-vectors: Robust DNN Embedding for Speaker Recognition
(在训练数据量不足的情况下,采用了数据增强)(与
i-vector
对比,发现数据增强对
i-vector
没有帮助,但对x-vectorDNN帮助很大)本文所用DNN的结构可参见另一篇文章(文章链接),如图所示
abcdhhhh_
·
2023-04-06 17:22
论文阅读
dnn
深度学习
GE2E Speaker Verification复现
之前看过一点kaldi的关于声纹识别的代码,基本还是基于
i-vector
的,不得不说这是比较传统的,过时的方法。现在深度学习在声纹确认/识别上的优势比较明显。
hjx5200
·
2023-01-12 11:51
声纹识别
说话人识别
声纹编码
GE2E
pytorch
x-vector:Deep Neural Network Embeddings for Text-Independent Speaker Verification
会议:2017interspeech机构:TheJohnsHopkinsUniversity作者:DavidSnyderabstract 用dnn提取的embedding取代
i-vector
表示说话人特征
林林宋
·
2023-01-02 07:44
paper笔记
语音识别SV
文献阅读:基于时延深度神经网络的说话人识别通用背景模型
论文论文:TIMEDELAYDEEPNEURALNETWORK-BASEDUNIVERSALBACKGROUNDMODELSFORSPEAKERRECOGNITION摘要 DNN被引入
i-vector
Tristespirit
·
2023-01-02 07:37
文献阅读
神经网络
深度学习
微软说话人识别工具箱(MSR Identity Toolbox)应用与实践教程
主要包含了GMM-UBM和
I-Vector
两种声纹识别核心算法源代码以及说明文档,但是并不涉及特征提取、语音端点检测(VoiceActivityDetection,VAD)等内容,对于初学者来说想要使用该工具箱训练自己的模型并建立起完整的声纹识别系统并不是一件容易的事情
NonDay
·
2022-12-25 03:37
声纹识别
vpr
ivector
gmm-ubm
声纹识别:x-vector 的特征提取原理
文章目录框架细节(待完成)x-vector基于DNN编码(详细可查看论文DeepNeuralNetworkEmbeddingsforText-IndependentSpeakerVerification)框架##
i-vector
Robin_Pi
·
2022-12-24 10:42
#
项目相关
#
声纹
因子分析、联合因子分析(JFA)、
i-vector
GMM-UBM的缺点关于GMM-UBM的具体过程可以参考GMM、GMM-UBM、GMM-SVM。GMM-UBM方法可以得到一个超向量,将该超向量作为声纹嵌入码,然后使用分类器(如:SVM)进行分类,逐渐称为GMM时代的经典说话人识别方法。但超向量存在下列缺点:超向量的维度过高:假设采用MFCC特征,通常为39维,并假设GMM具有512个高斯分量,得到的超向量维度为39×512=1996839\ti
DEDSEC_Roger
·
2022-12-23 04:30
说话人识别
人工智能
语音识别
音频
声纹识别概述(3)声纹识别系统
1.0.2只讲了一个阶段:测试/应用阶段(包括注册和验证)1.0.3声纹识别系统的三个阶段1.1特征提取1.2模型建立1.3打分判决1.3.1判决方式1.3.2分数规整(正则化)1.4主流的声纹识别建模技术
i-vector
Robin_Pi
·
2022-11-30 19:42
#
声纹
#
项目相关
文献阅读:X-VECTOR--用于说话人识别的鲁棒深度神经网络嵌入
先前的研究发现这种embedding在利用大规模的训练数据集后性能优于了
i-vector
,但是搜集大量高质量的标记的训练数据是一个挑战,所以我们使用包含增加噪声和混响的数
Tristespirit
·
2022-11-30 15:52
文献阅读
神经网络
深度学习
语音识别
【论文学习】《Adversarial Attacks on GMM
i-vector
based Speaker Verification Systems》
论文学习文章目录《AdversarialAttacksonGMMi-vectorbasedSpeakerVerificationSystems》论文学习摘要1介绍2自动说话人验证系统2.1高斯混合模型
i-vector
FallenDarkStar
·
2022-11-29 07:06
语音对抗
对抗样本
说话人验证
i-vector
x-vector
迁移攻击
语言处理 之 xvector
厦门大学智能语音实验室(XMUSPEECH)提供了基于Kaldi和Pytorch两个开源平台的基线系统:基于Kaldi的
i-vector
系统和x-vector系统,基于Pytorch的x-vector系统
才大难为用
·
2022-11-23 01:22
自然语言处理
语音识别
人工智能
linux搭建声纹识别,声纹识别SDK-FreeSR
https://github.com/NonDay/FreeSR1.实现算法:gmm-ubm/
i-vector
/x-vector2.功能说话人识别(验证),包括注册/识别两个阶段(gmm-ubm/
i-vector
早起也得缝袜子
·
2022-11-22 12:59
linux搭建声纹识别
声纹识别开源工具
声纹识别,也称为说话人识别,主要的开源工具有:1.MSRIdentityToolkit,微软开源的工具箱,MATLAB版本,包含GMM-UBM和
I-vector
的demo,简单易用。
THMAIL
·
2022-11-22 12:21
Python
SPEAKER-AWARE SPEECH-TRANSFORMER
2019ASRUabstracte2e-ASR存在的问题是train和test的说话人mismatch的问题,做法是:在speech-Transformer的基础上加speakerattentionmodule.SAM有一个
i-vector
林林宋
·
2022-11-21 18:45
paper笔记
声纹识别的语言依赖前端分析
AnalysisofLanguageDependentFront-EndforSpeakerRecognition声纹识别的语言依赖前端分析摘要在基于深度神经网络(DNN)
i-vector
的说话人识别系统中
落雪snowflake
·
2020-08-25 05:29
论文翻译
深度学习声纹识别
Kaldi学习笔记:01(kaldi/egs/sitw/v1)run.sh解析
kaldi学习笔记-01-sitw简介脚本修改run.sh简介研究生阶段入坑了说话人识别方向,最近在学习如何使用Kaldi提取
i-vector
进行说话人识别,在这里记录一下学习的笔记。
qijiajun97
·
2020-08-25 03:29
Kaldi中的plda的训练以及computer-socre
提取完
i-vector
之后,计算出每一句话的ivector特征,然后计算了sreivector-meanscp:exp/ivectors_sre/ivector.scpexp/ivectors_sre/
jinmingz
·
2020-08-19 06:42
kaldi
sre
特征提取
I-VECTOR
算法源码01
#include#include"ivector/agglomerative-clustering.h"namespacekaldi{voidAgglomerativeClusterer::Cluster(){KALDI_VLOG(2)min_clust_&&!queue_.empty()){std::pair>pr=queue_.top();int32i=(int32)pr.second.fir
落雪snowflake
·
2020-08-19 05:41
KALDI工具
说话人识别
I-Vector
的推导详解
在深度学习的路上,从头开始了解一下各项技术。本人是DL小白,连续记录我自己看的一些东西,大家可以互相交流。一、前言目前UBM-MAP-GMM是一种说话人确认技术的标准系统,在JFA模型下,我们可以把生成式模型扩展成为具有说话人部分(本征音空间矩阵V)和信道部分(本征信道空间矩阵U)这两个联合模型。但是,在JFA的实际使用中,我们发现说话人部分和信道部分没办法完美分离,还会存在一定的干扰。受到JFA
Dominic221
·
2020-08-19 05:34
声纹识别之Alize入门教程(三):
I-vector
Alize完整的ivector例程,包括:数据准备、特征提取、训练以及测试等。最终生成的得分文件res/scores_PLDA_lengthnorm.txt,其含义参考GMM-UBM。MS00021BAC009S0002W01220.644295MS00031BAC009S0002W01220.520998MS00041BAC009S0002W01220.48462MS00021BAC009S00
NonDay
·
2020-08-19 04:09
声纹识别
声纹识别之
i-vector
/plda
文章目录gmm-ubmi-vectorpldaReference最近做声纹识别的项目,要用到
i-vector
/plad,通过查阅各种资料,大概弄清楚了整个过程的来龙去脉,在此记录一下。
子耶
·
2020-08-19 03:46
SR
声纹识别-3.i-vector/PLDA(上篇)
i-vector
是代表说话人的向量,PLD
白水煮蝎子
·
2020-08-19 00:21
语音信号处理
声纹识别之
I-Vector
在深度学习的路上,从头开始了解一下各项技术。本人是DL小白,连续记录我自己看的一些东西,大家可以互相交流。本文参考:https://blog.csdn.net/u014688145/article/details/53046765?locationNum=7&fps=1https://blog.csdn.net/qq_27292549/article/details/79128964https:/
Dominic221
·
2020-08-05 03:00
I-vector
在实际应用中,由于说话人语音中说话人信息和各种干扰信息掺杂在一起,不同的采集设备的信道之间也具有差异性,会使我们收集到的语音中掺杂信道干扰信息。这种干扰信息会引起说话人信息的扰动。传统的GMM-UBM方法,没有办法克服这一问题,导致系统性能不稳定。在GMM-UBM模型里,每个目标说话人都可以用GMM模型来描述。因为从UBM模型自适应到每个说话人的GMM模型时,只改变均值,对于权重和协方差不做任何调
人总是要有梦想的QAQ
·
2020-08-03 23:44
机器学习
基于GMM-UBM的说话人识别 MSR Identity Toolkit
说话人识别MSRIdentityToolkit使用微软的声纹识别工具箱,记录使用步骤该工具箱包含了常规的基于GMM-UBM方法以及state-of-the-art的基于
i-vector
方法,本文记录的是
373955482
·
2020-07-30 12:17
语音识别
kaldi中的声纹识别
的安装运行aishell例程使用TIMIT数据库进行声纹识别kaldi中声纹识别的流程我的博客:https://yutouwd.github.io/前段时间一直到在使用kaldi来做声纹识别,算是可以把整个
i-vector
yutouwd
·
2020-07-06 11:11
声纹识别
声纹识别知识整理
关于声纹识别的算法及知识层出不穷,一文带你了解声纹识别:一、算法总览1.最早的GMM-UBMi-vector利用GMM高斯混合模型提取特征
i-vector
;克服训练数据不多的情况,引入UBM;将语音分为说话人空间和环境空间
James_Bobo
·
2020-07-06 04:35
#
声纹识别
声纹识别SDK-FreeSR
https://github.com/NonDay/FreeSR1.实现算法:gmm-ubm/
i-vector
/x-vector2.功能说话人识别(验证),包括注册/识别两个阶段(gmm-ubm/
i-vector
NonDay
·
2020-07-05 17:37
声纹识别
使用x-Vector的流程
1预处理Preprocessing与
i-vector
一样。2特征提取FeatureExtraction使用TDNN(TimeDelayNeuralNetwork)时延神经网络来提取特征。
RanleyYu
·
2020-06-23 19:39
基于SincNet的原始波形说话人识别
speakerrecognitionfromrawwaveformwithSincNetMircoRavanelli,YoshuaBengio作为一种可行的替代
i-vector
的说话人识别方法,深度学习正日益受到欢迎
凌逆战
·
2019-10-24 09:00
aishell的说话人识别资料
说话人识别采用
i-vector
技术,保证能识别出某一段话是哪个人说的。
boyStray
·
2019-05-28 23:35
声纹识别开源代码工具
声纹识别,也称为说话人识别,主要的开源工具有:1.MSRIdentityToolkit,微软开源的工具箱,MATLAB版本,包含GMM-UBM和
I-vector
的demo,简单易用。
虚生
·
2018-11-22 14:00
PLDA本质剖析
1.为什么会有PLDA,解决了什么问题上一篇文章讲解了声纹领域开创式进展
i-vector
方案,该方案为了简化操作,将所有的可变因子视为一个总的变化因子,这估计也是TV系统(totalvariabililty
chinabing
·
2018-10-20 13:31
声纹识别
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他