E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
说话人识别
说话人识别
的数据需求
不论神经网络多么先进,如果输入是垃圾,那么输出也一定是垃圾在
说话人识别
领域,所需的最小数据单元,包括:一段只包含单一说话人语音的音频,被称为Utterance(话语)该段音频的说话人标签,能够唯一地在整个数据集中标识该说话人怎么样的数据不是
DEDSEC_Roger
·
2022-12-25 03:00
说话人识别
人工智能
python
语音识别
音频
【ECAPA-TDNN 上】论文阅读
ECAPA-TDNN论文列表摘要2DNN
说话人识别
系统2.1Extended-TDNNx-vector2.2ResNet-basedr-vector3提出ECAPA-TDNN架构3.1Channel-andcontext-dependentstatisticspooling3.21
崔西的梅尔之旅
·
2022-12-24 10:50
声纹识别
论文阅读笔记
论文阅读笔记
论文翻译
算法
声纹识别(一)——简介
一、基本概念声纹识别也称为
说话人识别
,是指根据说话人语音中个性化的特征自动识别说话人身份的一种生物识别技术。
FlyingCodes
·
2022-12-24 09:11
声纹识别
语音识别
人工智能
说话人识别
中的损失函数
损失函数损失函数L(yi,y^i)L(y_i,\hat{y}_i)L(yi,y^i)用来描述神经网络的输出y^i\hat{y}_iy^i和基本事实(GroundTruth,GT)yiy_iyi的差异对于回归问题,常用均方误差(MeanSquareError,MSE)损失函数L(yi,y^i)=∥yi−y^i∥22L(y_i,\hat{y}_i)=\left\|y_i-\hat{y}_i\right
DEDSEC_Roger
·
2022-12-23 04:31
说话人识别
深度学习
python
音频
语音识别
因子分析、联合因子分析(JFA)、i-vector
GMM-UBM方法可以得到一个超向量,将该超向量作为声纹嵌入码,然后使用分类器(如:SVM)进行分类,逐渐称为GMM时代的经典
说话人识别
方法。
DEDSEC_Roger
·
2022-12-23 04:30
说话人识别
人工智能
语音识别
音频
深入理解Self-attention(自注意力机制)
此时输出序列和输入序列长度相同只需要输出一个向量,比如
说话人识别
、音频事件分类输出序列的长度不能确定,比如语音识别、机器翻译接下来专注于介绍第一种输出类型,这种任务通常被称为序列
DEDSEC_Roger
·
2022-12-23 04:28
深度学习
语音识别
深度学习
人工智能
说话人识别
神经网络推理方式
概述
说话人识别
是一个序列总结(SequenceSummarization)任务,输入是音频(或者说,声学特征的序列),输出是说话人的嵌入码,有的神经网络可以输入一对音频,直接输出这对音频的相似度分数。
DEDSEC_Roger
·
2022-12-22 06:56
说话人识别
神经网络
人工智能
音频
ROC与AUC,DET与EER,minDCF,Identification Accuracy
为什么需要这些指标对于两个
说话人识别
系统,我们希望比较它们的性能比较它们的性能,我们需要这些性能指标必须使用同一个评价集(EvaluationSet),并且指标的具体实现一致,比较才是有意义的系统A可能在一个评价集上性能优于系统
DEDSEC_Roger
·
2022-12-16 21:58
说话人识别
深度学习
人工智能
音频
VAD 语音激活检测、端点检测
VAD介绍https://blog.ailemon.net/2021/02/18/introduction-to-vad-theory/声纹识别、
说话人识别
https://www.cnblogs.com
ogaligong
·
2022-12-14 06:55
语音分析
语音识别
语音处理的算法和方法(Matlab代码实现)
用于自动语音和
说话人识别
的声学和语言建
wlz249
·
2022-12-13 18:11
语音处理
matlab
开发语言
文献阅读:X-VECTOR--用于
说话人识别
的鲁棒深度神经网络嵌入
论文论文:X-VECTORS:ROBUSTDNNEMBEDDINGSFORSPEAKERRECOGNITION摘要 被训练用于区分说话人的深度神经网络把可变长的话语映射为固定维度的embedding,也我们叫它x-vector。先前的研究发现这种embedding在利用大规模的训练数据集后性能优于了i-vector,但是搜集大量高质量的标记的训练数据是一个挑战,所以我们使用包含增加噪声和混响的数
Tristespirit
·
2022-11-30 15:52
文献阅读
神经网络
深度学习
语音识别
gmm ubm matlab,基于GMM-UBM的
说话人识别
算法
GMM-UBM作为概率统计模型,由于其能够很好地模拟说话人的声学特征分布,实现方法灵活有效,加上具有较高的鲁棒性,故提出后就迅速成为
说话人识别
中的重要建模方法。一、特征参数的提取对于
weixin_39613744
·
2022-11-29 06:10
gmm
ubm
matlab
声纹识别(
说话人识别
)技术
说话人识别
(SpeakerRecognition,SR),又称声纹识别(VoiceprintRecognition,VPR),顾名思义,即通过声音来识别出来“谁在说话”,是根据语音信号中的说话人个性信息来识别说话人身份的一项生物特征识别技术
包子鸡蛋
·
2022-11-29 06:08
【语音识别】高斯混合模型(GMM)
说话人识别
【含Matlab源码 574期】
⛄一、高斯混合模型简介GMM基本框架类似的还有GMM-UBM(Universalbackgroundmodel)算法,其与GMM的区别在于:对L类整体样本训练一个大的GMM,而不像GMM对每一类训练一个GMM模型。SVM的话MFCC作为特征,每一帧作为一个样本,可以借助VAD删除无效音频段,直接训练分类。近年来也有利用稀疏表达的方法:⛄二、部分源代码functionmix=gmm_init(nce
Matlab领域
·
2022-11-29 06:28
Matlab语音处理(进阶版)
matlab
语音识别
【语音识别工具】asv-subtools 介绍与安装
1、下载ASV-Subtools是基于Pytorch和Kaldi开发的,主要用于
说话人识别
、语言识别等任务。
AI 菌
·
2022-11-23 01:21
语音处理
环境配置与搭建
语音识别
人工智能
asv-subtools
CNSRC 2022 | 希尔贝壳邀你参与CNSRC 2022 声纹识别竞赛研讨会
CNSRC2022是由Odyssey2022组委会发起,由清华大学、厦门大学、希尔贝壳公司联合承办的
说话人识别
竞赛。该竞赛核心目的是验证当前
说话人识别
(或称声纹识别)技术在实际复杂场景下的真实可用性。
语音之家
·
2022-11-22 12:29
智能语音
人工智能
快手如何玩转复杂场景下的
说话人识别
?| ASRU 2021
如何在复杂场景下准确高效的进行
说话人识别
,通常需要引入音频降噪/分离技术,本文针对复杂场景下的
说话人识别
分别提出了一种多任务音频分离技术和基于AutoML神经网络搜索架构的
说话人识别
技术,两篇论文均被ASRU202
语音之家
·
2022-11-22 12:29
智能语音
深度学习
人工智能
linux搭建声纹识别,声纹识别SDK-FreeSR
https://github.com/NonDay/FreeSR1.实现算法:gmm-ubm/i-vector/x-vector2.功能
说话人识别
(验证),包括注册/识别两个阶段(gmm-ubm/i-vector
早起也得缝袜子
·
2022-11-22 12:59
linux搭建声纹识别
声纹识别开源工具
声纹识别,也称为
说话人识别
,主要的开源工具有:1.MSRIdentityToolkit,微软开源的工具箱,MATLAB版本,包含GMM-UBM和I-vector的demo,简单易用。
THMAIL
·
2022-11-22 12:21
Python
开集文本无关的
说话人识别
开集文本无关的
说话人识别
文章目录开集文本无关的
说话人识别
摘要引言方法MCE2018数据结果与讨论相关文献摘要开集文本无关的
说话人识别
旨在利用语音技术来检测某一语音是否来自系统中的已注册人员,并确定是来自其中的哪一名说话人
海上机械师
·
2022-11-21 06:06
说话人识别
神经网络
语音
说话人识别
开集
安全
python声纹识别_声纹识别(
说话人识别
)
声纹识别声纹识别,生物识别技术的一种,也称为
说话人识别
,有两类,即说话人辨认和说话人确认。声纹识别的理论基础是每一个声音都具有独特的特征,通过该特征能将不同人的声音进行有效的区分。
weixin_39662611
·
2022-11-21 06:52
python声纹识别
说话人识别
matlab实现
转自:https://blog.csdn.net/qq_18124075/article/details/78867536
说话人识别
这里,博主对说话人两个baseline模型应该matlab的MSR工具箱进行处理
罗小黑嘛
·
2022-11-21 05:12
语音
说话人识别
INTERSPEECH2022丨希尔贝壳邀您参加 FFSVC 2022 远场
说话人识别
比赛
WelcometoFFSVC2022!ThesuccessofFFSVC2020indicatesthatmoreandmoreresearchersarepayingattentiontothefar-fieldspeakerverificationtask.Inthisyear,thechallengestillfocusesonthefar-fieldspeakerverificationt
希尔贝壳AISHELL
·
2022-11-21 05:01
国际数据竞赛
智能语音
人工智能
深度学习
【论文学习】《Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems》
AdversarialAttacksonSpeakerRecognitionSystems》论文学习摘要I介绍II背景II-A
说话人识别
系统(SRS)II-B威胁模型III方法III-A动机III-B设计理念
FallenDarkStar
·
2022-11-20 01:31
语音对抗
对抗样本
黑盒攻击
说话人识别
FAKEBOB
语音识别技术是什么 语音识别基本方法介绍【图文】
与
说话人识别
及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据
编程大乐趣
·
2022-11-19 17:10
基于MATLAB的
说话人识别
系统
说话人识别
应用广泛,现已应用到通信、消费电子产品等各个领域。本文将把语音进行数字化传输、存储、然后进行识别等。
说话人识别
系统主要包括预处理、特征提取、训练和识别四个模块。其中预处理和特征提取尤为重要。
sunny_chenxi
·
2022-11-02 15:15
神经网络
算法
机器学习
人工智能
深度学习
MagicData-RAMC数据集测评 | 西北工业大学冠军队分享
MagicData(北京爱数智慧科技有限公司)和江苏师范大学主办,MagicHub开源社区、上海白玉兰开源开放研究院、华为MindSpore社区和英特尔OpenVINO中文社区协办的“对话式AI语音识别及
说话人识别
Magic Data
·
2022-09-29 07:06
语音识别
人工智能
Interspeech 2022丨FFSVC 2022 远场
说话人识别
比赛
近日,FFSVC2022远场
说话人识别
比赛已开放注册系统、提交系统和Leaderboard,新的训练集/开发集/测试集已经发布。
语音之家
·
2022-09-28 07:18
智能语音
人工智能
语音识别
基于MATLAB的语音信号处理
语音信号处理包括语音通信、语音增强、语音合成、语音识别和
说话人识别
等方面。语音信号的好坏、语音识别率的高低,都取决于语音信号处理的好坏。因此,语音
m0_55395440
·
2022-07-26 08:36
信号处理
算法
机器学习
人工智能
webgl
说话人识别
(声纹识别)发展史简单总结——(阶段学习总结,GMM,GMM-UBM,GMM-SVM理解)
本文的创新点与关键点之一:GMM,GMM-UBM,GMM-SVM的理解大概是从10月20号开始由于项目需要开始接触
说话人识别
这一研究方向,这一个多月的时间主要是看论文中文英文,尤其是综述文章,当然也试着了解传统方法背后的思路和原理
zengxinch
·
2022-06-13 07:35
Machine
Learning
Speaker
Recognition
语音特征参数MFCC提取过程详解
原博客地址:https://blog.csdn.net/jojozhangju/article/details/18678861自己刚刚学习
说话人识别
,在网上找了一些关于MFCC特征的博文,感觉这篇将得十分不错
干塘村speecher
·
2022-05-28 15:19
说话人识别
MFCC特征详解
MFCC提取Matlab实现
Oakland 2021论文:
说话人识别
系统黑盒对抗攻击
前言今天给大家推荐一篇前不久被第42届IEEESymposiumonSecurityandPrivacy(IEEES&P,Oakland)2021会议接收的学术论文,关于
说话人识别
系统的黑盒对抗攻击。
GolferChen
·
2022-04-27 21:32
【语音识别】基于矢量量化(VQ)的
说话人识别
【Matlab 538期】
一、简介矢量量化方法,即vectorquantization,其具体定义为:将一个向量空间中的点用其中的一个有限子集来进行编码的过程。在矢量量化编码中,关键是码本的建立和码字搜索算法。比如常见的聚类算法,就是一种矢量量化方法。而在ANN近似最近邻搜索中,向量量化方法又以乘积量化(PQ,ProductQuantization)最为典型。在之前的博文基于内容的图像检索技术的最后,对PQ乘积量化的方法做
星斗月辉
·
2021-03-24 09:23
matlab
信号处理
【语音识别】基于GUI声纹识别【Matlab 500期】
声纹识别又叫
说话人识别
,它和语音识别存在一点差别。b.梅尔频率倒谱系数(MFCC)梅尔频率倒谱系数(MelFrequencyCepstrumCoefficient,MFCC)是语音信号
星斗月辉
·
2021-03-20 17:48
matlab
信号处理
【语音识别】基于matlab矢量量化(VQ)
说话人识别
【含Matlab源码 575期】
一、简介矢量量化方法,即vectorquantization,其具体定义为:将一个向量空间中的点用其中的一个有限子集来进行编码的过程。在矢量量化编码中,关键是码本的建立和码字搜索算法。比如常见的聚类算法,就是一种矢量量化方法。而在ANN近似最近邻搜索中,向量量化方法又以乘积量化(PQ,ProductQuantization)最为典型。在之前的博文基于内容的图像检索技术的最后,对PQ乘积量化的方法做
紫极神光
·
2021-03-19 12:51
matlab
语音处理
【语音识别】基于matlab VQ特定人孤立词语音识别【含Matlab源码 536期】
一、简介VQ(VectorQuantization)是一个常用的压缩技术,本文主要回顾:1)VQ原理2)基于VQ的
说话人识别
(SR,speakerrecognition)技术〇、分类问题
说话人识别
其实也是一个分类问题
紫极神光
·
2021-03-16 13:13
matlab
语音处理
10小时训练数据打造多语种语音识别新高度
从2000年开始,NIST组织的RT(英文语音识别),LRE(语音语种识别),SRE(语音
说话人识别
),OPENKWS(语音关键词识别)等比赛一直是语音届的标杆竞赛,其组织比赛方向也可以看出目前学术和工业界的语音研究发展方向
腾讯技术工程
·
2021-01-11 18:00
计算机视觉
机器学习
人工智能
深度学习
xhtml
使用云函数实现语音识别案例
与
说话人识别
及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
腾讯云中间件服务团队
·
2021-01-04 20:09
serverless案例
svm的多类分类问题
最近在看SVM用于
说话人识别
,需要对训练语音进行正负类区分,从而训练合适的分类面。现在把自己看的东西大致总结一下,如果有错的,或者不明白的,请指出,谢谢!
rainylove1
·
2020-09-16 22:24
SVM的多类分类问题
使用Alize等工具构建
说话人识别
平台
链接:http://iibo.net/archives/1176使用Alize等工具构建
说话人识别
平台前段时间有好几位同学询问如何用Alize实现
说话人识别
的问题,由于寒假前赶Paper,来不及详细解答
zhangxueyang1
·
2020-09-14 21:17
声纹识别
【工程】深度说话人的应用及声纹识别系统的制作 (附完整代码与数据集)
说话人识别
系统(又称声纹识别系统)论文:本博客是基于百度的论文DeepSpeaker:anEnd-to-EndNeuralSpeakerEmbeddingSystem的理论上进行实现的:https://
jcfszxc
·
2020-09-14 19:58
alize使用参考
/blog.csdn.net/zhangxueyang1/article/details/54232584http://alize.univ-avignon.fr/该框架轻便灵巧,使用了传统方法实现了
说话人识别
功能
AllyLi0224
·
2020-09-14 18:40
语音
alize
可解释的卷积滤波器 SincNet
可解释的卷积滤波器SincNetRavanelli,M.在NIPS2018进一步讨论了SincNet可解释意义,令人感觉该模型已经能够胜任在
说话人识别
的基础上胜任更多的语音处理任务。
海上机械师
·
2020-09-11 23:42
说话人识别
语音识别
深度学习
深度学习
说话人识别
语音识别
声纹识别
可解释性
电话机器人核心技术之ASR(自动语音识别)
与
说话人识别
及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。
VX 15891723662
·
2020-09-11 10:13
VoxCeleb
说话人识别
挑战
VoxCeleb
说话人识别
挑战VoxSRC消息:2020VoxCelebSpeakerRecognitionChallenge(VoxSRC)将联合Interspeech国际会议于2020年10月30日在上海举办
海上机械师
·
2020-08-25 06:34
说话人识别
Python
跨信道文本无关
说话人识别
的信道对抗训练
跨信道文本无关
说话人识别
的信道对抗训练文献:X.Fang,L.Zou,J.Li,L.Sun,andZ.Ling,“ChannelAdversarialTrainingforCross-channelText-independentSpeakerRecognition
海上机械师
·
2020-08-25 06:02
说话人识别
kaldi中改写sre10/v1用timit dataset做
说话人识别
总结
首先非常感谢david-ryan-snyder提供的帮助,非常耐心的给出问题的解答。经过一个周的调试修改,终于在timit数据集上跑通了sre10中的v1demo,特来总结一下,重新理顺一下思路,把其中的各个步骤的算法大体的捋一遍。最重要的还是数据准备阶段,由于没有原始的数据,整个过程进行的比较困难,花了差不多一个周的时间来各种改,之前第一次跑wsj那个demo的时候才花了不到一个周,现在对kal
jinmingz
·
2020-08-25 06:52
sre
在与文本无关的
说话人识别
中补偿域不匹配
Compensationfordomainmismatchintext-independentspeakerrecognition
落雪snowflake
·
2020-08-25 05:00
论文翻译
深度学习声纹识别
声纹识别的语言依赖前端分析
AnalysisofLanguageDependentFront-EndforSpeakerRecognition声纹识别的语言依赖前端分析摘要在基于深度神经网络(DNN)i-vector的
说话人识别
系统中
落雪snowflake
·
2020-08-25 05:29
论文翻译
深度学习声纹识别
X-VECTORS: ROBUST DNN EMBEDDINGS FOR SPEAKER RECOGNITION论文翻译
X-VECTORS:稳健的DNN嵌入式,用于声纹识别摘要在本文中,我们使用数据增强来提高深层神经网络(DNN)嵌入对于
说话人识别
的性能。
落雪snowflake
·
2020-08-25 05:28
深度学习声纹识别
说话人识别
上一页
1
2
3
4
5
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他