2019-09-28 MTCNN解读1

image.png
image.png
image.png
image1.png
image2.png
image3.png
image4.png

image5.png

其中face classification为人脸图像的概率:长度为2的一维向量,bbox是回归框的信息:长度为4的一维向量,facial landmark是关键点的位置:长度为10的一维向量。
pnet网络没有对卷积层的输出作平滑处理,1132不是通常的平滑层,主要是因为实际应用时输入图像尺寸不一,若使用flat层,即平滑层每次输出的特征的尺寸也是大小不一的,利用卷积层时,可以让输入大小不一的图像输出维度不一的特征向量。

image.png
image.png
image3.png
image.png
image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

你可能感兴趣的:(2019-09-28 MTCNN解读1)