说话人识别第3页

Kaldi学习笔记：01(kaldi/egs/sitw/v1)run.sh解析

kaldi学习笔记-01-sitw简介脚本修改run.sh简介研究生阶段入坑了说话人识别方向，最近在学习如何使用Kaldi提取i-vector进行说话人识别，在这里记录一下学习的笔记。

qijiajun97·2020-08-25 03:29

KALDI之aishell模型说话人识别之V1

1.首先，成功安装kaldi在服务器上，用gitclone那种方式安装（和在本地Unbuntu乌班图环境安装没区别）。2数据准备部分然后进入目录cdegs/aishell/V12.1首先改cmd的配置：vimcmd.sh1改为：exporttrain_cmd=run.pl#"queue.pl--mem2G":wq保存后。2.2输入：vimrun.sh看见data=/export/a05/xna/d

落雪snowflake·2020-08-25 02:23

VoxCeleb2：深度说话人识别

VoxCeleb2:DeepSpeakerRecognitionJoonSonChung†,ArshaNagrani†,AndrewZissermanVisualGeometryGroup,DepartmentofEngineeringScience,UniversityofOxford,UK{joon,arsha,az}@robots.ox.ac.ukVoxCeleb2数据集可以从http下载：

落雪snowflake·2020-08-25 02:23

kaldi中声纹识别例子大概步骤综述

如何利用kaldi搭建说话人识别的例子。仅仅是搭建，具体的很多参数的调整需要大家根据数据集的不同慢慢调整。

落雪snowflake·2020-08-25 02:52

声纹识别中PLDA的域自适应的通用框架

AGENERALIZEDFRAMEWORKFORDOMAINADAPTATIONOFPLDAINSPEAKERRECOGNITION2020顶会论文学习提出了一种用于说话人识别中的概率线性判别分析（PLDA

落雪snowflake·2020-08-25 02:52

使用未经监督的对抗性不变进行强力说话人识别

ROBUSTSPEAKERRECOGNITIONUSINGUNSUPERVISEDADVERSARIALINVARIANCERaghuveerPeri,MonisankhaPal,ArindamJati,KrishnaSomandepalli,ShrikanthNarayananSignalAnalysisandInterpretationLaboratory,UniversityofSouthe

落雪snowflake·2020-08-25 02:52

声扬科技CTO陈东鹏：声纹识别将是金融风控的下一个“爆点”

声纹识别也被称为「说话人识别」，它最主要的功能是确认说话人的身份。和其他生物

itwriter·2020-08-21 08:00

矢量量化（VQ）

http://www.cnblogs.com/xingshansi/p/6925955.html前言VQ（VectorQuantization）是一个常用的压缩技术，本文主要回顾：1）VQ原理2）基于VQ的说话人识别

大盗零妖qaq·2020-08-20 05:40

语音识别技术

与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。简介：语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。

云计算小百科·2020-08-19 23:38

说话人识别中训练通用背景模型(UBM)的研究

摘要：以高斯分布为基础的说话人识别系统使用通用背景的模型(UBM)需要广泛的数据资源尤其是多信道和多个麦克风种类下采集语音。

夕夕如盼·2020-08-19 06:52

说话人识别之GMM-UBM系统

SpeakerVerificationUsingAdaptedGaussianMixtureModels每个人的声音都有独特的特征,这个特征由两个音素决定:1.声腔的尺寸2.发声器官被操纵的方式这些因素使得声音变得独一无二一：说话人识别流程先进行特征提取

唐维康·2020-08-19 04:24

语音识别基本概念

说话人识别的基础知识1.语音的产生声门：两片声带之间的空间叫声门主声道：声带即声门以上，经过咽喉，口腔的通道鼻道：经过小舌和鼻的管道声道是分布参数系统，为谐振腔分布参数系统即系统状态变化不能只由有限个参数变化描述

贻我彤管·2020-08-19 03:13

声纹识别GMM-UBM

背景： 说话人识别过程主要有三个模块,分别为:特征提取,模型训练以及模式匹配与判决。

林林宋·2020-08-19 03:26

转发大神关于说话人识别的ivector系统的说明，看了瞬间懂了

作者：Leon晋链接：https://www.zhihu.com/question/63978977/answer/215215119来源：知乎1、先用一部分训练集（包含多个说话人），通过EM期望最大化算法，训练UBM通用背景模型；通常我们会先训练一个协方差对角矩阵，再训练全矩阵，理由如下：1、M阶高斯的稠密全矩阵UBM效果等同于一个更大高斯分量的对角矩阵；2、对角UBM较为稀疏，计算量低效率快；

qq_27292549·2020-08-19 03:09

声纹识别之PLDA算法描述

之前我写过《我对说话人识别/声纹识别的研究综述》，本篇基本上可以是这个综述的续写。其实，写的也没有什么深度，想获得深度信息的朋友们可以不用往下看了，还不如下载几篇领域内的国内博士论文看看。

Orange先生·2020-08-19 02:28

多麦克风降噪—DS（窄带）

噪声环境：不可控，由干扰源组成并且统计上不稳定（这样的噪声环境将导致单通道降噪使目标语音失真）说话人识别理想

徐有容迷妹·2020-08-15 15:03

MFCC一些知识与Kaldi中的MFCC特征解读

因为想用Kaldi去实现一个GMM-UBM的说话人识别和loglike打分，所以想把Kaldi计算的统计量对一对，看能不能把二进制文件里的数值单独拿出来，自己写个代码做结合Kaldi中的MAP做统计量计算

RoadmanG·2020-08-08 21:50

语音信号处理入门书籍

语音信号处理一般包括以下几个部分：（1）语音信号的声学基础及产生模型（2）语音信号的特征分析（时域，频域以及时频）（3）语音编码（4）语音识别和说话人识别（5）语音合成本文列出了以下三本书籍，个人感觉第一本最适合初学者入门使用

qq_33874667·2020-08-08 19:28

基音周期估计

基音周期是语音信号的重要的参数之一，它描述语音激励源的一个重要特征，基音周期信息在多个领域有着广泛的应用，如语音识别、说话人识别、语音分析与综合以及低码率语音编码，发音系统疾病诊断、听觉残障者的语音指导等

晏温·2020-08-08 19:29

基于Kersa实现的声纹识别

记录优秀的Doi技术团队学习经历本文链接：基于Kersa实现的声纹识别基于Kersa实现的声纹识别本项目是基于VGG-Speaker-Recognition开发的，本项目主要是用于声纹识别，也有人称为说话人识别

夜雨飘零1·2020-08-04 23:17

语音识别技术

与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。简介：语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。

云计算小百科·2020-07-31 16:00

语音识别技术

与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。简介：语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。

云计算小百科·2020-07-30 19:02

语音识别技术

与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。简介：语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。

云计算小百科·2020-07-30 17:26

基于GMM-UBM的说话人识别 MSR Identity Toolkit

说话人识别MSRIdentityToolkit使用微软的声纹识别工具箱，记录使用步骤该工具箱包含了常规的基于GMM-UBM方法以及state-of-the-art的基于i-vector方法，本文记录的是

373955482·2020-07-30 12:17

语音识别技术

与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。简介：语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。

云计算小百科·2020-07-30 01:04

一些常用的语音特征提取算法

说话人识别是指软件或硬件接收语音信号，识别语音信号中出现的说话人，然后识别说话人的能力。特征提取是通过将语音波形以相对最小的数据速率转换为参数表示形式进行后续处理和分析来实现的。

凌逆战·2020-07-29 22:14

从说话人识别demo开始学习kaldi--（5）compute_vad_decision.sh

Grace_yanyanyan·2020-07-29 13:36

文本无关的说话人识别综述（一）----简介

一引言说话人识别简介：也叫做声纹识别，通过声音识别说话的人是谁。（注意跟语音识别的区别）说话人识别的可行性：1、物理层面

whu_paprika·2020-07-29 12:16

文本无关的说话人识别综述（三）----说话人模型

本文是读书笔记。个人比较浅显的理解，其中有一些专业词汇也是个人自己的翻译，如果有不对的希望大家指正。来自论文《Anoverviewoftext-independentspeakerrecognition:Fromfeaturestosupervectors》的第四章节===========================分界线================================这篇博客

whu_paprika·2020-07-29 12:16

学习说话人识别和验证的判别特征

LearningDiscriminativeFeaturesforSpeakerIdentificationandVerification学习说话人识别和验证的判别特征摘要任何文本独立的说话者识别和/或验证系统的成功依赖于系统学习辨别特征的能力

落雪snowflake·2020-07-29 12:31

MFCC & PLP

##MFCC对于语音/说话人识别，最常用的声学特征是梅尔导谱系数（mel-scalefrequencycepstralcoefficient,MFCC）。

shichaog·2020-07-29 11:33

Linear Discriminant Analysis(LDA)

该算法在很多地方都有使用：语音识别，说话人识别等等，那么今天在这里就为大家详细介绍一下，最终把matlab代码放在我的git上，有兴趣的可以去看一下，好了不多说，直接进入主题。

爱国者002·2020-07-29 10:43

kaldi基础介绍（一）在说话人识别中的数据准备

在kaldi说话人识别示例（egs/sre10,egs/sre16）中，数据总共有两大类，一是训练集（training），二是评估数据集（evaluation）。

monsieurliaxiamen·2020-07-29 10:45

基于x-vector的文本无关说话人识别

这篇文章分两部分，第一部分介绍x-vector的说话人识别细节算法，第二部分是对最新技术的跟进，本质是对训练数据做了dataaugmentation，x-vector方法在kaldi上的实现细节将在下一篇文章中展示

monsieurliaxiamen·2020-07-29 10:45

文本无关的说话人识别综述（二）----特征提取

本文是读书笔记。个人比较浅显的理解，其中有一些专业词汇也是个人自己的翻译，如果有不对的希望大家指正。来自论文《Anoverviewoftext-independentspeakerrecognition:Fromfeaturestosupervectors》的第三章节的特征提取部分。===================================分割线====================

whu_paprika·2020-07-29 09:32

基于深度神经网络特征提取的文本无关的说话人识别

部分转自https://blog.csdn.net/monsieurliaxiamen/article/details/79638227对文章“Deepneuralnetworkembeddingsfortext-independentspeakerverification”的解读。1.概要在实际应用中，往往被测试者或被验证者的语音长度相对较短，若使用传统的PLDA/ivector模型效果会相对一

wxn704414736·2020-07-29 00:01

【声纹识别】 EER

EqualErrorRate,这个在说话人识别，说话人确认中最常用的评价标准，是一种使错误接受

SoWhat1412·2020-07-16 05:51

语音信号处理第十章

说话人识别系统设计系统框图说话人识别系统框图说话人识别是一个二值问题，只需判定是否为申请者所讲。

jieyannnhereCREAM·2020-07-14 12:15

kaldi中的egs文件夹中的demo都是干什么的

aishell：里面有两文件夹，S5是一种语音识别方法的demo，V1是一种说话人识别的demo。数据用的就是aishell1。aishell2：只有S5，也就是语音识别。

Grace_yanyanyan·2020-07-12 18:56

Milvus 实战｜生物多因子认证系列 (一）：声纹识别

|什么是声纹识别声纹识别（又称说话人识别）是从说话人发出的语音信号中提取声纹信息，并对说话人进行身份验证的一种生物识别技术。简单来说，声纹识别技术可以“确认说话人是谁”。

ZILLIZ RDS·2020-07-12 14:14

Kaldi TIMIT x-vector 说话人识别 (声纹识别)

1前言本文使用TIMIT语料库,参考aishell使用x-vector进行说话人识别,现有的资料都是i-vector.本文参考了很多资料,如果想要了解如何使用TIMIT和ivector进行说话人识别,那么建议从

RanleyYu·2020-07-11 16:19

01-说话人语音识别

语音转文本的github项目：https://github.com/buriburisuri/speech-to-text-wavenetGMM（GaussMixtureModel高斯混合模型）在说话人识别中的应用

cbd_2012·2020-07-11 03:09

如何三步搭建一套声纹系统

背景介绍声纹检索，顾名思义就是说话人识别，通过声音来验证或者识别说话人的声音。声纹识别的关键步骤就是声音向量化，将说话人的声音将其转化成结构化的向量。

阿里云云栖号·2020-07-10 14:32

声纹识别中深度学习实践应用之一-------------------------------------------------------------------------------特征提取方面

声纹识别，也就是说话人识别，利用计算机识别说话人的身份ID，相当于说话人的身份证一样的标识。通过建立声纹识别系统模型，通过数据训练，更新参数计算，最后确立一个比较不错的模型。

落雪snowflake·2020-07-10 09:45

语音信号处理（2）：文本相关的声纹识别系统（MFCC、VQ）

声纹识别又叫说话人识别，它和语音识别存在一点差别。 b.梅尔频率倒谱系数（MFCC）

雨寒sgg·2020-07-10 04:26

声纹识别

也称为说话人识别，有两类，即说话人辨认和说话

haima1998·2020-07-09 16:04

声纹采集是什么？标准声纹采集终端设备的作用是什么？

声纹识别，也叫做说话人识别是一项根据语音波形中反映说话人生理和行为特征的语音参数，来识别语音说话者身份的技术。

快商通AI·2020-07-09 11:32

声纹识别2

声纹识别，也称作说话人识别，是一种通过声音判别说话人身份的技术。

twinkle_star1314·2020-07-09 09:04

声纹识别：走出实验室，迈向产业化 | 会员专栏

对计算机来说，这种能力就是声纹识别，又称说话人识别，它基于语音中所包含的说话人特有的个性信息，自动鉴别当前语音对应的说话人身份，是一种简单、优雅、安全的生物特征识别技术。

DatapiTHU·2020-07-09 07:44

kaldi中声纹识别ivector模型

1.数据准备：无论使用kaldi来做语音识别还是说话人识别，第一步就是数据准备，对于说话人识别来说，需要准备的几个文件为wav.scp，utt2spk，spk2utt这三个文件。

aliceyixin·2020-07-05 19:46

推荐频道

说话人识别

Kaldi学习笔记：01(kaldi/egs/sitw/v1)run.sh解析

KALDI之aishell模型说话人识别之V1

VoxCeleb2：深度说话人识别

kaldi中声纹识别例子大概步骤综述

声纹识别中PLDA的域自适应的通用框架

使用未经监督的对抗性不变进行强力说话人识别

声扬科技CTO陈东鹏：声纹识别将是金融风控的下一个“爆点”

矢量量化（VQ）

语音识别技术

说话人识别中训练通用背景模型(UBM)的研究

说话人识别之GMM-UBM系统

语音识别基本概念

声纹识别GMM-UBM

转发大神关于说话人识别的ivector系统的说明，看了瞬间懂了

声纹识别之PLDA算法描述

多麦克风降噪—DS（窄带）

MFCC一些知识与Kaldi中的MFCC特征解读

语音信号处理入门书籍

基音周期估计

基于Kersa实现的声纹识别

语音识别技术

语音识别技术

语音识别技术

基于GMM-UBM的说话人识别 MSR Identity Toolkit

语音识别技术

一些常用的语音特征提取算法

从说话人识别demo开始学习kaldi--（5）compute_vad_decision.sh

文本无关的说话人识别综述（一）----简介

文本无关的说话人识别综述（三）----说话人模型

学习说话人识别和验证的判别特征

MFCC & PLP

Linear Discriminant Analysis(LDA)

kaldi基础介绍（一）在说话人识别中的数据准备

基于x-vector的文本无关说话人识别

文本无关的说话人识别综述（二）----特征提取

基于深度神经网络特征提取的文本无关的说话人识别

【声纹识别】 EER

语音信号处理第十章

kaldi中的egs文件夹中的demo都是干什么的

Milvus 实战｜生物多因子认证系列 (一）：声纹识别

Kaldi TIMIT x-vector 说话人识别 (声纹识别)

01-说话人语音识别

如何三步搭建一套声纹系统

声纹识别中深度学习实践应用之一-------------------------------------------------------------------------------特征提取方面

语音信号处理（2）：文本相关的声纹识别系统（MFCC、VQ）

声纹识别

声纹采集是什么？标准声纹采集终端设备的作用是什么？

声纹识别2

声纹识别：走出实验室，迈向产业化 | 会员专栏

kaldi中声纹识别ivector模型