dlib ResNet相关知识

#dlib_face_recognition_resnet_model_v1.dat.bz2

  该模型是一个ResNet网络,有29个conv层。它本质上是来自于He, Zhang, Ren和Sun的论文《Deep残差学习for Image Recognition》的ResNet-34网络的一个版本,去掉了几层,每层过滤器的数量减少了一半。

该网络是在大约300万张面孔的数据集上从零开始训练的。此数据集来自多个数据集。刷脸数据集(http://vintage.winklerbros.net/facescrub.html), VGG数据集(http://www.robots.ox.ac.uk/~vgg/data/vgg_face/),然后是我从网上刮来的大量图片。我尽我所能通过删除标签错误来清理数据集,这意味着从VGG中过滤掉了很多东西。我通过反复训练一个人脸识别CNN,然后使用图聚类方法和大量的手工检查来清理数据集。最后,大约一半的图像来自VGG和面部磨砂。此外,数据集中的个体身份的总数是7485。我确保避免与LFW的身份重叠。
网络训练从随机初始化权值开始,并使用结构化的度量损失,试图将所有身份投影到半径为0.6的不重叠球中。损失基本上是一种成对铰链损失,它在小批处理中运行所有对,并包括小批处理级别的硬负挖掘。
所得模型在LFW基准上的平均误差为0.993833,标准差为0.00272732。

深度剩余网络
作者:何开明(http://kaiminghe.com),
张翔宇,任少卿,
孙健。
微软亚洲研究院(MSRA)
###目录
0. (介绍)(#介绍)
0. 引用
0. 免责声明和已知问题
0. (模型)(#模型)
0. 结果
0. (第三方重新实现)(# third-party-re-implementations)

介绍

该存储库包含了原始模型(ResNet-50, ResNet-101和ResNet-152),在论文“深度残差学习用于图像识别”(http://arxiv.org/abs/1512.03385)中描述。这些模型是在[ILSVRC] (http://image-net.org/challenges/LSVRC/2015/)和COCO 2015年比赛中使用的,这些比赛在:ImageNet分类、ImageNet检测、ImageNet定位、COCO检测、COCO细分中获得第一名。

网络结构的可视化(来自ethereon):
——[ResNet-50] (http://ethereon.github.io/netscope/ /要点/ db945b393d40bfa26006)
——[resnet - 101] (http://ethereon.github.io/netscope/ /要点/ b21e2aae116dc1ac7b50)
——[resnet - 152] (http://ethereon.github.io/netscope/ /要点/ d38f3e6091952b45198b)

你可能感兴趣的:(深度学习,计算机视觉,目标检测)