检测这一块还是要继续读的文章

我目前只对视觉方向较为熟悉,就介绍下视觉这边深度学习值得一读的论文。

有些论文15年年末就挂在arxiv上,但是16年才中期刊以及会议,我也放进来了。

视觉这块我熟悉的主要的有图片分类(包括细粒度图片分类),物体检测,像素级分割,图像检索,人脸检测与识别。

===============================================================

图片分类:

严格意义上说下面的工作不只是图片分类,更为重要的是提出的网络结构能够更好地学出Feature.

Deep Residual Learning for Image Recognition,Resnet,2016年CVPR best paper,FAIR的何恺明在MSRA的工作。这项工作的意义在于解决了DNN网络层数过深,梯度消失的问题。Paper:[1512.03385] Deep Residual Learning for Image Recognition,Code:KaimingHe/deep-residual-networks

Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning,inception和Resnet结合,Google的工作。Paper:[1602.07261] Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning

===============================================================

物体检测:

YOLO,You Only Look Once:Unified, Real-Time Object Detection,与Faster-RCNN系列等region proposal方法不同,他实现了End-to-End的检测,在牺牲一定精度的前提下做到实时检测。Paper&&Code&&Demo:YOLO: Real-Time Object Detection

LocNet: Improving Localization Accuracy for Object Detection,产生更为准确的bbox,针对每一个给定的初始框进行适当的放大,然后用一个CNN的网络回归出这个放大后的框包含的那个正确框的位置。Paper:Improving Localization Accuracy for Object Detection,Code:gidariss/LocNet

SSD,SSD: Single Shot MultiBox Detector,在YOLO上进行改进,使用multi-scale的convolutional feature map,准确率和Faster-RCNN几乎差不多,速度比YOLO更快。Paper:Single Shot MultiBox Detector,Code:weiliu89/caffe

R-FCN,R-FCN: Object Detection via

Region-based Fully Convolutional Networks,使用全卷机网络进行检测,脑洞大开啊,速度和mAP都很好。Paper:Object Detection via Region-based Fully Convolutional Networks,Code:daijifeng001/R-FCN

Yolo-v2,YOLO9000:

Better, Faster, Stronger,YOLO的升级版,速度更快。作者使用了一系列的方法对原来的YOLO多目标检测框架进行了改进,在保持原有速度的优势之下,精度上得以提升。VOC 2007数据集测试,67FPS下mAP达到76.8%,40FPS下mAP达到78.6%,基本上与Faster R-CNN和SSD差不多。Paper&&Code&&Demo:YOLO: Real-Time Object Detection

Feature Pyramid Networks for Object Detection,rbg大神的新成果,用图像金字塔特征做检测。Paper:[1612.03144] Feature Pyramid Networks for Object Detection

你可能感兴趣的:(检测这一块还是要继续读的文章)