如何理解等错误率(EER, Equal Error Rate)?

在语音vad和KWS任务中,经常用到EER,怎么正确理解EER

FR定义:在一批本该全部正确(TRUE)的列表中出现几个没识别出正确的语音,这个就是错误拒识FR(False Rejection),是Miss的;

FA定义:在一批本该全部错误(Flase)的列表中出现了几个没识别出错误的语音,就是错误的语音被认为对了,FA(False Acceptance),是Flase Alarm的。

各自占的比例:FR = Miss / Total_TRUE;FA= False Alarm/ Total_False,这个分别对应DET曲线图的纵轴和横轴的截距。可以看下图:


如何理解等错误率(EER, Equal Error Rate)?_第1张图片
至于等错误率,是可以从DET中快速读出:

这个图里的RBF核的EER等于7.3%,linear和sigmoid是9.1%左右,poly是13.3%,当我们在图上找出(7.3,7.3); (9.1,9.1), (13.3,13.3)时,而这些数值其实正好是在各自的曲线上,同时都位于“y=x”的直线上。所以往DET上画y=x直线,与DET曲线相交的点,就是从DET快速读出EER的方法。

而当FA=0,本错的都识别出,部分本对的也拒绝掉,就是FR的截距;当FR=0,本对的都识别出,部分本错的也接收了,就是FA的截距。

而曲线的点是根据阈值画出:

如何理解等错误率(EER, Equal Error Rate)?_第2张图片

当阈值变小时,FR会随之变小,而FA随之增大,可以参考DET曲线图下降趋势;当到某一点,会存在FR=FA,这时的阈值就是等错误率阈值,有EER=FR=FA。同时,拒绝掉的正确样本占总正确列表个数=接受了的错误样本占总错误列表个数(把阈值看作为一条界线划开)

更多链接:https://www.zhihu.com/question/37436914/answer/150485174

你可能感兴趣的:(kaldi)