i-vector

【论文阅读】X-vectors: Robust DNN Embedding for Speaker Recognition

（在训练数据量不足的情况下，采用了数据增强）（与i-vector对比，发现数据增强对i-vector没有帮助，但对x-vectorDNN帮助很大）本文所用DNN的结构可参见另一篇文章（文章链接），如图所示

abcdhhhh_·2023-04-06 17:22

GE2E Speaker Verification复现

之前看过一点kaldi的关于声纹识别的代码，基本还是基于i-vector的，不得不说这是比较传统的，过时的方法。现在深度学习在声纹确认/识别上的优势比较明显。

hjx5200·2023-01-12 11:51

x-vector：Deep Neural Network Embeddings for Text-Independent Speaker Verification

会议：2017interspeech机构：TheJohnsHopkinsUniversity作者：DavidSnyderabstract 用dnn提取的embedding取代i-vector表示说话人特征

林林宋·2023-01-02 07:44

文献阅读：基于时延深度神经网络的说话人识别通用背景模型

论文论文：TIMEDELAYDEEPNEURALNETWORK-BASEDUNIVERSALBACKGROUNDMODELSFORSPEAKERRECOGNITION摘要 DNN被引入i-vector

Tristespirit·2023-01-02 07:37

微软说话人识别工具箱(MSR Identity Toolbox)应用与实践教程

主要包含了GMM-UBM和I-Vector两种声纹识别核心算法源代码以及说明文档，但是并不涉及特征提取、语音端点检测(VoiceActivityDetection,VAD)等内容，对于初学者来说想要使用该工具箱训练自己的模型并建立起完整的声纹识别系统并不是一件容易的事情

NonDay·2022-12-25 03:37

声纹识别：x-vector 的特征提取原理

文章目录框架细节（待完成）x-vector基于DNN编码（详细可查看论文DeepNeuralNetworkEmbeddingsforText-IndependentSpeakerVerification）框架##i-vector

Robin_Pi·2022-12-24 10:42

因子分析、联合因子分析（JFA）、i-vector

GMM-UBM的缺点关于GMM-UBM的具体过程可以参考GMM、GMM-UBM、GMM-SVM。GMM-UBM方法可以得到一个超向量，将该超向量作为声纹嵌入码，然后使用分类器（如：SVM）进行分类，逐渐称为GMM时代的经典说话人识别方法。但超向量存在下列缺点：超向量的维度过高：假设采用MFCC特征，通常为39维，并假设GMM具有512个高斯分量，得到的超向量维度为39×512=1996839\ti

DEDSEC_Roger·2022-12-23 04:30

声纹识别概述（3）声纹识别系统

1.0.2只讲了一个阶段：测试/应用阶段（包括注册和验证）1.0.3声纹识别系统的三个阶段1.1特征提取1.2模型建立1.3打分判决1.3.1判决方式1.3.2分数规整（正则化）1.4主流的声纹识别建模技术i-vector

Robin_Pi·2022-11-30 19:42

文献阅读：X-VECTOR--用于说话人识别的鲁棒深度神经网络嵌入

先前的研究发现这种embedding在利用大规模的训练数据集后性能优于了i-vector，但是搜集大量高质量的标记的训练数据是一个挑战，所以我们使用包含增加噪声和混响的数

Tristespirit·2022-11-30 15:52

【论文学习】《Adversarial Attacks on GMM i-vector based Speaker Verification Systems》

论文学习文章目录《AdversarialAttacksonGMMi-vectorbasedSpeakerVerificationSystems》论文学习摘要1介绍2自动说话人验证系统2.1高斯混合模型i-vector

FallenDarkStar·2022-11-29 07:06

语言处理之 xvector

厦门大学智能语音实验室(XMUSPEECH)提供了基于Kaldi和Pytorch两个开源平台的基线系统：基于Kaldi的i-vector系统和x-vector系统，基于Pytorch的x-vector系统

才大难为用·2022-11-23 01:22

linux搭建声纹识别,声纹识别SDK-FreeSR

https://github.com/NonDay/FreeSR1.实现算法：gmm-ubm/i-vector/x-vector2.功能说话人识别(验证)，包括注册/识别两个阶段(gmm-ubm/i-vector

早起也得缝袜子·2022-11-22 12:59

声纹识别开源工具

声纹识别，也称为说话人识别，主要的开源工具有：1.MSRIdentityToolkit，微软开源的工具箱，MATLAB版本，包含GMM-UBM和I-vector的demo，简单易用。

THMAIL·2022-11-22 12:21

SPEAKER-AWARE SPEECH-TRANSFORMER

2019ASRUabstracte2e-ASR存在的问题是train和test的说话人mismatch的问题，做法是：在speech-Transformer的基础上加speakerattentionmodule.SAM有一个i-vector

林林宋·2022-11-21 18:45

声纹识别的语言依赖前端分析

AnalysisofLanguageDependentFront-EndforSpeakerRecognition声纹识别的语言依赖前端分析摘要在基于深度神经网络（DNN）i-vector的说话人识别系统中

落雪snowflake·2020-08-25 05:29

Kaldi学习笔记：01(kaldi/egs/sitw/v1)run.sh解析

kaldi学习笔记-01-sitw简介脚本修改run.sh简介研究生阶段入坑了说话人识别方向，最近在学习如何使用Kaldi提取i-vector进行说话人识别，在这里记录一下学习的笔记。

qijiajun97·2020-08-25 03:29

Kaldi中的plda的训练以及computer-socre

提取完i-vector之后，计算出每一句话的ivector特征，然后计算了sreivector-meanscp:exp/ivectors_sre/ivector.scpexp/ivectors_sre/

jinmingz·2020-08-19 06:42

特征提取I-VECTOR算法源码01

#include#include"ivector/agglomerative-clustering.h"namespacekaldi{voidAgglomerativeClusterer::Cluster(){KALDI_VLOG(2)min_clust_&&!queue_.empty()){std::pair>pr=queue_.top();int32i=(int32)pr.second.fir

落雪snowflake·2020-08-19 05:41

I-Vector的推导详解

在深度学习的路上，从头开始了解一下各项技术。本人是DL小白，连续记录我自己看的一些东西，大家可以互相交流。一、前言目前UBM-MAP-GMM是一种说话人确认技术的标准系统，在JFA模型下，我们可以把生成式模型扩展成为具有说话人部分(本征音空间矩阵V)和信道部分(本征信道空间矩阵U)这两个联合模型。但是，在JFA的实际使用中，我们发现说话人部分和信道部分没办法完美分离，还会存在一定的干扰。受到JFA

Dominic221·2020-08-19 05:34

声纹识别之Alize入门教程(三)：I-vector

Alize完整的ivector例程，包括：数据准备、特征提取、训练以及测试等。最终生成的得分文件res/scores_PLDA_lengthnorm.txt，其含义参考GMM-UBM。MS00021BAC009S0002W01220.644295MS00031BAC009S0002W01220.520998MS00041BAC009S0002W01220.48462MS00021BAC009S00

NonDay·2020-08-19 04:09

声纹识别之i-vector/plda

文章目录gmm-ubmi-vectorpldaReference最近做声纹识别的项目，要用到i-vector/plad，通过查阅各种资料，大概弄清楚了整个过程的来龙去脉，在此记录一下。

子耶·2020-08-19 03:46

声纹识别-3.i-vector/PLDA（上篇）

i-vector是代表说话人的向量，PLD

白水煮蝎子·2020-08-19 00:21

声纹识别之I-Vector

在深度学习的路上，从头开始了解一下各项技术。本人是DL小白，连续记录我自己看的一些东西，大家可以互相交流。本文参考：https://blog.csdn.net/u014688145/article/details/53046765?locationNum=7&fps=1https://blog.csdn.net/qq_27292549/article/details/79128964https:/

Dominic221·2020-08-05 03:00

I-vector

在实际应用中，由于说话人语音中说话人信息和各种干扰信息掺杂在一起，不同的采集设备的信道之间也具有差异性，会使我们收集到的语音中掺杂信道干扰信息。这种干扰信息会引起说话人信息的扰动。传统的GMM-UBM方法，没有办法克服这一问题，导致系统性能不稳定。在GMM-UBM模型里，每个目标说话人都可以用GMM模型来描述。因为从UBM模型自适应到每个说话人的GMM模型时，只改变均值，对于权重和协方差不做任何调

人总是要有梦想的QAQ·2020-08-03 23:44

基于GMM-UBM的说话人识别 MSR Identity Toolkit

说话人识别MSRIdentityToolkit使用微软的声纹识别工具箱，记录使用步骤该工具箱包含了常规的基于GMM-UBM方法以及state-of-the-art的基于i-vector方法，本文记录的是

373955482·2020-07-30 12:17

kaldi中的声纹识别

的安装运行aishell例程使用TIMIT数据库进行声纹识别kaldi中声纹识别的流程我的博客：https://yutouwd.github.io/前段时间一直到在使用kaldi来做声纹识别，算是可以把整个i-vector

yutouwd·2020-07-06 11:11

声纹识别知识整理

关于声纹识别的算法及知识层出不穷，一文带你了解声纹识别：一、算法总览1.最早的GMM-UBMi-vector利用GMM高斯混合模型提取特征i-vector；克服训练数据不多的情况，引入UBM；将语音分为说话人空间和环境空间

James_Bobo·2020-07-06 04:35

声纹识别SDK-FreeSR

https://github.com/NonDay/FreeSR1.实现算法：gmm-ubm/i-vector/x-vector2.功能说话人识别（验证），包括注册/识别两个阶段（gmm-ubm/i-vector

NonDay·2020-07-05 17:37

使用x-Vector的流程

1预处理Preprocessing与i-vector一样。2特征提取FeatureExtraction使用TDNN(TimeDelayNeuralNetwork)时延神经网络来提取特征。

RanleyYu·2020-06-23 19:39

基于SincNet的原始波形说话人识别

speakerrecognitionfromrawwaveformwithSincNetMircoRavanelli,YoshuaBengio作为一种可行的替代i-vector的说话人识别方法，深度学习正日益受到欢迎

凌逆战·2019-10-24 09:00

aishell的说话人识别资料

说话人识别采用i-vector技术，保证能识别出某一段话是哪个人说的。

boyStray·2019-05-28 23:35

声纹识别开源代码工具