读《Finger Vein Recognition Using a Shallow Convolutional Neural Network》

2021

摘要

基于深度学习的手指静脉识别(FVR)可以分为闭集架构(CS架构)或基于系统输出的开集架构(OS架构)。
cs体系结构由于其封闭性,其实用性有限,而os体系结构由于其收敛性具有挑战性,其泛化能力有限(那不就是都不实用了?)
为了提高基于深度学习的FVR的实用性和性能,我们基于观察人脸识别与FVR之间的差异,假设浅层卷积神经网络适用于FVR。因此,我们设计了一个具有三个卷积块和两个完全连接层的浅层网络,可以有效地应用于cs体系结构和os体系结构。此外,利用改进的基于区间的损失函数提取可区分的大边际特征。

引言

1.cs架构:cs架构使用一个Softmax层,在一个正向传播中输出输入样本的指定类别[1,10-12]。它只识别经过训练的类别,而扩展的系统需要复杂的再培训。cs架构的实用性是有限的。(分类)
2.os体系结构:与cs体系结构相比,os体系结构输出一个输入样本的特征图[3,9,14,16,19]或降维向量[2,5,7,8,18],或两个输入样本的差异/复合图像[4,6,13,15]的比较结果。(匹配)
读《Finger Vein Recognition Using a Shallow Convolutional Neural Network》_第1张图片

FC2的输出不能直接用于os体系结构中,因为FC2中的神经元数量是固定的,等于要识别的类别的数量,这限制了应用程序场景。解决方案是使用FC1而不是FC2的输出。将FC1视为嵌入层,通过修改损失函数,可以调整嵌入层与FC2之间的映射关系。(其实就是前面学到的AMSoftmax[20],内积交叉熵)
在这里插入图片描述
原损失函数在角度和距离上限制了f和W之间的关系。由于优化同时涉及到角度和距离,因此对优化结果的量化具有挑战性。此外,如果这个损失函数只限制了角度或距离的关系,我们可以量化两个样本的特征之间的相似性,这导致识别方法不再依赖于标签。
m增强了均匀样品的内聚性,s避免梯度消失(说是把范数即距离置1,偏重b置0,结果还不是加上m和s?神秘)
读《Finger Vein Recognition Using a Shallow Convolutional Neural Network》_第2张图片

(说是这种交叉熵本质上是在算匹配相似度,可以应用到开集?)

你可能感兴趣的:(机器学习,深度学习,计算机视觉)