深度学习开源网络mtcnn算法解析源码解读

开源代码地址:https://github.com/kpzhang93/MTCNN_face_detection_alignment

感觉自己陷入了代码细节误区,本着时间紧任务重的理念,加上本人能力有限,暂时无法完成细节代码图解,但是可以简单写一下自己两周以来的学习感悟,和整体架构!
首先总体架构参考如下博客:https://zhuanlan.zhihu.com/p/38520597
代码部分总的执行流程如下:
代码结构截图:

代码实现模型的初始化,首先是构建mtcnn的tensorflow计算图,然后载入训练好的模型参数,细节是分别调用pnet,rnet,onet组装成mtcnn。里面涉及python装饰器的内容,首先写了一个基本的层,然后用装饰器分别实现神经网络各种层,感觉有点类似caffe的工厂模式。
在这里插入图片描述
代码实现最终的检测道德人脸框的四个点坐标和5个点的包括双眼,鼻尖,两个嘴角的坐标。
深度学习开源网络mtcnn算法解析源码解读_第1张图片
这是官方训练好的模型文件。
在这里插入图片描述
这里会对检测到的人脸框和五点位置进一步处理,最终得到我们想要的结果。
在这里插入图片描述
这里是代码的核心了,首先得到图像金字塔,参考博文。https://blog.csdn.net/poem_qianmo/article/details/26157633
然后输入pnet,返回

你可能感兴趣的:(深度学习)