说话人识别第2页

说话人识别的数据需求

不论神经网络多么先进，如果输入是垃圾，那么输出也一定是垃圾在说话人识别领域，所需的最小数据单元，包括：一段只包含单一说话人语音的音频，被称为Utterance（话语）该段音频的说话人标签，能够唯一地在整个数据集中标识该说话人怎么样的数据不是

DEDSEC_Roger·2022-12-25 03:00

【ECAPA-TDNN 上】论文阅读

ECAPA-TDNN论文列表摘要2DNN说话人识别系统2.1Extended-TDNNx-vector2.2ResNet-basedr-vector3提出ECAPA-TDNN架构3.1Channel-andcontext-dependentstatisticspooling3.21

崔西的梅尔之旅·2022-12-24 10:50

声纹识别（一）——简介

一、基本概念声纹识别也称为说话人识别，是指根据说话人语音中个性化的特征自动识别说话人身份的一种生物识别技术。

FlyingCodes·2022-12-24 09:11

说话人识别中的损失函数

损失函数损失函数L(yi,y^i)L(y_i,\hat{y}_i)L(yi,y^i)用来描述神经网络的输出y^i\hat{y}_iy^i和基本事实（GroundTruth，GT）yiy_iyi的差异对于回归问题，常用均方误差（MeanSquareError，MSE）损失函数L(yi,y^i)=∥yi−y^i∥22L(y_i,\hat{y}_i)=\left\|y_i-\hat{y}_i\right

DEDSEC_Roger·2022-12-23 04:31

因子分析、联合因子分析（JFA）、i-vector

GMM-UBM方法可以得到一个超向量，将该超向量作为声纹嵌入码，然后使用分类器（如：SVM）进行分类，逐渐称为GMM时代的经典说话人识别方法。

DEDSEC_Roger·2022-12-23 04:30

深入理解Self-attention（自注意力机制）

此时输出序列和输入序列长度相同只需要输出一个向量，比如说话人识别、音频事件分类输出序列的长度不能确定，比如语音识别、机器翻译接下来专注于介绍第一种输出类型，这种任务通常被称为序列

DEDSEC_Roger·2022-12-23 04:28

说话人识别神经网络推理方式

概述说话人识别是一个序列总结（SequenceSummarization）任务，输入是音频（或者说，声学特征的序列），输出是说话人的嵌入码，有的神经网络可以输入一对音频，直接输出这对音频的相似度分数。

DEDSEC_Roger·2022-12-22 06:56

ROC与AUC，DET与EER，minDCF，Identification Accuracy

为什么需要这些指标对于两个说话人识别系统，我们希望比较它们的性能比较它们的性能，我们需要这些性能指标必须使用同一个评价集（EvaluationSet），并且指标的具体实现一致，比较才是有意义的系统A可能在一个评价集上性能优于系统

DEDSEC_Roger·2022-12-16 21:58

VAD 语音激活检测、端点检测

VAD介绍https://blog.ailemon.net/2021/02/18/introduction-to-vad-theory/声纹识别、说话人识别https://www.cnblogs.com

ogaligong·2022-12-14 06:55

语音处理的算法和方法（Matlab代码实现）

用于自动语音和说话人识别的声学和语言建

wlz249·2022-12-13 18:11

文献阅读：X-VECTOR--用于说话人识别的鲁棒深度神经网络嵌入

论文论文：X-VECTORS:ROBUSTDNNEMBEDDINGSFORSPEAKERRECOGNITION摘要被训练用于区分说话人的深度神经网络把可变长的话语映射为固定维度的embedding，也我们叫它x-vector。先前的研究发现这种embedding在利用大规模的训练数据集后性能优于了i-vector，但是搜集大量高质量的标记的训练数据是一个挑战，所以我们使用包含增加噪声和混响的数

Tristespirit·2022-11-30 15:52

gmm ubm matlab,基于GMM-UBM的说话人识别算法

GMM-UBM作为概率统计模型，由于其能够很好地模拟说话人的声学特征分布，实现方法灵活有效，加上具有较高的鲁棒性，故提出后就迅速成为说话人识别中的重要建模方法。一、特征参数的提取对于

weixin_39613744·2022-11-29 06:10

声纹识别（说话人识别）技术

说话人识别（SpeakerRecognition，SR），又称声纹识别（VoiceprintRecognition,VPR），顾名思义，即通过声音来识别出来“谁在说话”，是根据语音信号中的说话人个性信息来识别说话人身份的一项生物特征识别技术

包子鸡蛋·2022-11-29 06:08

【语音识别】高斯混合模型（GMM）说话人识别【含Matlab源码 574期】

⛄一、高斯混合模型简介GMM基本框架类似的还有GMM-UBM(Universalbackgroundmodel)算法，其与GMM的区别在于：对L类整体样本训练一个大的GMM，而不像GMM对每一类训练一个GMM模型。SVM的话MFCC作为特征，每一帧作为一个样本，可以借助VAD删除无效音频段，直接训练分类。近年来也有利用稀疏表达的方法：⛄二、部分源代码functionmix=gmm_init(nce

Matlab领域·2022-11-29 06:28

【语音识别工具】asv-subtools 介绍与安装

1、下载ASV-Subtools是基于Pytorch和Kaldi开发的，主要用于说话人识别、语言识别等任务。

AI 菌·2022-11-23 01:21

CNSRC 2022 | 希尔贝壳邀你参与CNSRC 2022 声纹识别竞赛研讨会

CNSRC2022是由Odyssey2022组委会发起，由清华大学、厦门大学、希尔贝壳公司联合承办的说话人识别竞赛。该竞赛核心目的是验证当前说话人识别（或称声纹识别）技术在实际复杂场景下的真实可用性。

语音之家·2022-11-22 12:29

快手如何玩转复杂场景下的说话人识别？| ASRU 2021

如何在复杂场景下准确高效的进行说话人识别，通常需要引入音频降噪/分离技术，本文针对复杂场景下的说话人识别分别提出了一种多任务音频分离技术和基于AutoML神经网络搜索架构的说话人识别技术，两篇论文均被ASRU202

语音之家·2022-11-22 12:29

linux搭建声纹识别,声纹识别SDK-FreeSR

https://github.com/NonDay/FreeSR1.实现算法：gmm-ubm/i-vector/x-vector2.功能说话人识别(验证)，包括注册/识别两个阶段(gmm-ubm/i-vector

早起也得缝袜子·2022-11-22 12:59

声纹识别开源工具

声纹识别，也称为说话人识别，主要的开源工具有：1.MSRIdentityToolkit，微软开源的工具箱，MATLAB版本，包含GMM-UBM和I-vector的demo，简单易用。

THMAIL·2022-11-22 12:21

开集文本无关的说话人识别

开集文本无关的说话人识别文章目录开集文本无关的说话人识别摘要引言方法MCE2018数据结果与讨论相关文献摘要开集文本无关的说话人识别旨在利用语音技术来检测某一语音是否来自系统中的已注册人员，并确定是来自其中的哪一名说话人

海上机械师·2022-11-21 06:06

python声纹识别_声纹识别（说话人识别）

声纹识别声纹识别，生物识别技术的一种，也称为说话人识别，有两类，即说话人辨认和说话人确认。声纹识别的理论基础是每一个声音都具有独特的特征，通过该特征能将不同人的声音进行有效的区分。

weixin_39662611·2022-11-21 06:52

说话人识别matlab实现

转自：https://blog.csdn.net/qq_18124075/article/details/78867536说话人识别这里，博主对说话人两个baseline模型应该matlab的MSR工具箱进行处理

罗小黑嘛·2022-11-21 05:12

INTERSPEECH2022丨希尔贝壳邀您参加 FFSVC 2022 远场说话人识别比赛

WelcometoFFSVC2022!ThesuccessofFFSVC2020indicatesthatmoreandmoreresearchersarepayingattentiontothefar-fieldspeakerverificationtask.Inthisyear,thechallengestillfocusesonthefar-fieldspeakerverificationt

希尔贝壳AISHELL·2022-11-21 05:01

【论文学习】《Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems》

AdversarialAttacksonSpeakerRecognitionSystems》论文学习摘要I介绍II背景II-A说话人识别系统(SRS)II-B威胁模型III方法III-A动机III-B设计理念

FallenDarkStar·2022-11-20 01:31

语音识别技术是什么语音识别基本方法介绍【图文】

与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据

编程大乐趣·2022-11-19 17:10

基于MATLAB的说话人识别系统

说话人识别应用广泛，现已应用到通信、消费电子产品等各个领域。本文将把语音进行数字化传输、存储、然后进行识别等。说话人识别系统主要包括预处理、特征提取、训练和识别四个模块。其中预处理和特征提取尤为重要。

sunny_chenxi·2022-11-02 15:15

MagicData-RAMC数据集测评 | 西北工业大学冠军队分享

MagicData(北京爱数智慧科技有限公司)和江苏师范大学主办，MagicHub开源社区、上海白玉兰开源开放研究院、华为MindSpore社区和英特尔OpenVINO中文社区协办的“对话式AI语音识别及说话人识别

Magic Data·2022-09-29 07:06

Interspeech 2022丨FFSVC 2022 远场说话人识别比赛

近日，FFSVC2022远场说话人识别比赛已开放注册系统、提交系统和Leaderboard，新的训练集/开发集/测试集已经发布。

语音之家·2022-09-28 07:18

基于MATLAB的语音信号处理

语音信号处理包括语音通信、语音增强、语音合成、语音识别和说话人识别等方面。语音信号的好坏、语音识别率的高低，都取决于语音信号处理的好坏。因此，语音

m0_55395440·2022-07-26 08:36

说话人识别（声纹识别）发展史简单总结——（阶段学习总结，GMM,GMM-UBM,GMM-SVM理解）

本文的创新点与关键点之一：GMM,GMM-UBM,GMM-SVM的理解大概是从10月20号开始由于项目需要开始接触说话人识别这一研究方向，这一个多月的时间主要是看论文中文英文，尤其是综述文章，当然也试着了解传统方法背后的思路和原理

zengxinch·2022-06-13 07:35

语音特征参数MFCC提取过程详解

原博客地址：https://blog.csdn.net/jojozhangju/article/details/18678861自己刚刚学习说话人识别，在网上找了一些关于MFCC特征的博文，感觉这篇将得十分不错

干塘村speecher·2022-05-28 15:19

Oakland 2021论文：说话人识别系统黑盒对抗攻击

GolferChen·2022-04-27 21:32

【语音识别】基于矢量量化（VQ）的说话人识别【Matlab 538期】

一、简介矢量量化方法，即vectorquantization，其具体定义为：将一个向量空间中的点用其中的一个有限子集来进行编码的过程。在矢量量化编码中，关键是码本的建立和码字搜索算法。比如常见的聚类算法，就是一种矢量量化方法。而在ANN近似最近邻搜索中，向量量化方法又以乘积量化(PQ,ProductQuantization)最为典型。在之前的博文基于内容的图像检索技术的最后，对PQ乘积量化的方法做

星斗月辉·2021-03-24 09:23

【语音识别】基于GUI声纹识别【Matlab 500期】

声纹识别又叫说话人识别，它和语音识别存在一点差别。b.梅尔频率倒谱系数（MFCC）梅尔频率倒谱系数（MelFrequencyCepstrumCoefficient,MFCC）是语音信号

星斗月辉·2021-03-20 17:48

【语音识别】基于matlab矢量量化（VQ）说话人识别【含Matlab源码 575期】

一、简介矢量量化方法，即vectorquantization，其具体定义为：将一个向量空间中的点用其中的一个有限子集来进行编码的过程。在矢量量化编码中，关键是码本的建立和码字搜索算法。比如常见的聚类算法，就是一种矢量量化方法。而在ANN近似最近邻搜索中，向量量化方法又以乘积量化(PQ,ProductQuantization)最为典型。在之前的博文基于内容的图像检索技术的最后，对PQ乘积量化的方法做

紫极神光·2021-03-19 12:51

【语音识别】基于matlab VQ特定人孤立词语音识别【含Matlab源码 536期】

一、简介VQ（VectorQuantization）是一个常用的压缩技术，本文主要回顾：1）VQ原理2）基于VQ的说话人识别（SR,speakerrecognition）技术〇、分类问题说话人识别其实也是一个分类问题

紫极神光·2021-03-16 13:13

10小时训练数据打造多语种语音识别新高度

从2000年开始，NIST组织的RT（英文语音识别），LRE（语音语种识别），SRE（语音说话人识别），OPENKWS（语音关键词识别）等比赛一直是语音届的标杆竞赛，其组织比赛方向也可以看出目前学术和工业界的语音研究发展方向

腾讯技术工程·2021-01-11 18:00

使用云函数实现语音识别案例

与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

腾讯云中间件服务团队·2021-01-04 20:09

svm的多类分类问题

最近在看SVM用于说话人识别，需要对训练语音进行正负类区分，从而训练合适的分类面。现在把自己看的东西大致总结一下，如果有错的，或者不明白的，请指出，谢谢！

rainylove1·2020-09-16 22:24

使用Alize等工具构建说话人识别平台

链接：http://iibo.net/archives/1176使用Alize等工具构建说话人识别平台前段时间有好几位同学询问如何用Alize实现说话人识别的问题，由于寒假前赶Paper，来不及详细解答

zhangxueyang1·2020-09-14 21:17

【工程】深度说话人的应用及声纹识别系统的制作 (附完整代码与数据集)

说话人识别系统(又称声纹识别系统)论文:本博客是基于百度的论文DeepSpeaker:anEnd-to-EndNeuralSpeakerEmbeddingSystem的理论上进行实现的:https://

jcfszxc·2020-09-14 19:58

alize使用参考

/blog.csdn.net/zhangxueyang1/article/details/54232584http://alize.univ-avignon.fr/该框架轻便灵巧，使用了传统方法实现了说话人识别功能

AllyLi0224·2020-09-14 18:40

可解释的卷积滤波器 SincNet

可解释的卷积滤波器SincNetRavanelli,M.在NIPS2018进一步讨论了SincNet可解释意义，令人感觉该模型已经能够胜任在说话人识别的基础上胜任更多的语音处理任务。

海上机械师·2020-09-11 23:42

电话机器人核心技术之ASR（自动语音识别）

与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。

VX 15891723662·2020-09-11 10:13

VoxCeleb 说话人识别挑战

VoxCeleb说话人识别挑战VoxSRC消息：2020VoxCelebSpeakerRecognitionChallenge(VoxSRC)将联合Interspeech国际会议于2020年10月30日在上海举办

海上机械师·2020-08-25 06:34

跨信道文本无关说话人识别的信道对抗训练

跨信道文本无关说话人识别的信道对抗训练文献：X.Fang,L.Zou,J.Li,L.Sun,andZ.Ling,“ChannelAdversarialTrainingforCross-channelText-independentSpeakerRecognition

海上机械师·2020-08-25 06:02

kaldi中改写sre10/v1用timit dataset做说话人识别总结

首先非常感谢david-ryan-snyder提供的帮助，非常耐心的给出问题的解答。经过一个周的调试修改，终于在timit数据集上跑通了sre10中的v1demo,特来总结一下，重新理顺一下思路，把其中的各个步骤的算法大体的捋一遍。最重要的还是数据准备阶段，由于没有原始的数据，整个过程进行的比较困难，花了差不多一个周的时间来各种改，之前第一次跑wsj那个demo的时候才花了不到一个周，现在对kal

jinmingz·2020-08-25 06:52

在与文本无关的说话人识别中补偿域不匹配

Compensationfordomainmismatchintext-independentspeakerrecognition

落雪snowflake·2020-08-25 05:00

声纹识别的语言依赖前端分析

AnalysisofLanguageDependentFront-EndforSpeakerRecognition声纹识别的语言依赖前端分析摘要在基于深度神经网络（DNN）i-vector的说话人识别系统中

落雪snowflake·2020-08-25 05:29

X-VECTORS: ROBUST DNN EMBEDDINGS FOR SPEAKER RECOGNITION论文翻译

X-VECTORS：稳健的DNN嵌入式，用于声纹识别摘要在本文中，我们使用数据增强来提高深层神经网络（DNN）嵌入对于说话人识别的性能。

落雪snowflake·2020-08-25 05:28

推荐频道

说话人识别