语音识别评估标准

在语音识别中,常用的评估标准为词错误率WER,

WER计算方式为:为了使识别出来的词序列和标准的词序列之间保持一致,需要进行替换,删除,或者插入某些词,

这些插入,替换,删除的词的总个数,除以标准的词序列中词的个数的百分比,即为WER,其计算公式如下所示:


需要注意的是,因为有插入词,所以WER有可能大于100%,

例子:如下图所示:

第一行为标准的词序列,第二行为识别出来的词序列


那么上述的WER计算如下所示:

增加词3个,替换的词6个,删除的词1个,那么WER为:


在语音识别中,除了WER,还有句子识别错误率这个标准,即SER,SER表述为句子中如果有一个词识别错误,那么这个句子被认为识别错误,句子识别错误的的个数,除以总的句子个数即为SER

其计算公式如下所示:


除了WER,SER,还有字错误率,即CER,不是很常用就不介绍了。

你可能感兴趣的:(语音识别评估标准)