EXPERIMENTALLY DEFINED CONVOLUTIONAL NEURAL NETWORK ARCHITECTURE VARIANTS FOR NON-TEMPORAL REAL-TIME

这是一篇October 7-10, 2018.发表于IEEE International Conference on Image Processing (ICIP)的一篇文章,作者提供了一种基于CNN的实时视频火焰检测。文章获取地址为:https://github.com/lixiaokai666/CVpaper

摘要:

EXPERIMENTALLY DEFINED CONVOLUTIONAL NEURAL NETWORK ARCHITECTURE VARIANTS FOR NON-TEMPORAL REAL-TIME_第1张图片

论文成果:实时了视频实时火灾监测,且速度大大提升,准确率高达93%,在superpixel上定位准确度可达到89%(超像素就是把一幅原本是像素级(pixel-level)的图,划分成区域级(district-level)的图,具体可自行查阅)

论文使用的方法:分别对AlenNet和Inception进行了去层操作,减少了CNN的复杂度

正文:

首先介绍了目前火灾检测的用途十分广泛,可以被用在公共安全未来还可能用于交通工具中。

其次介绍了传统的火灾检测方法:

  1. purely colour based approach
  2. a combination of colour and high-order temporal information

之前的工作主要关注点在颜色域上,后来关注火焰的变化,上升到傅里叶域,未来将上升到Hidden Markov Model problem(馬可夫模型)。
传统的方法,In general these works report ~98-99% (truepositive) detection at 10-40 frames per second (fps) on relatively  small image sizes。(不知道有这么高的精度为何还需要深度学习方法,可能是和image size有关?)

最近考虑将机器学习的分类方法用于火焰检测问题。大多都基于火焰动态和运动特性来检测的,本文提出一种不需要考虑上下文信息的方案。

方法:

2.1 使用了低复杂度的CNN网络结构
2.2 operating on single image inputs (non-temporal) experimentally optimized for the fire detection task  不依赖于上下文信息的检测
2.3 This is then expanded into a superpixel based localization approach to offer a complete detection solution将其推广至superpixel中,提供一个完整的检测方法。

2.1网络结构

作者对AlexNet,VGG16和Inception网络进行了对比选择,最终作者通过不知道什么实验,确认了AlexNet和Inception网络更好。

 

 

对于AlexNet,考虑了六种不同的情况:

C1-C6 as follows: C1 removed layer 3  only, C2 removed layers 3,4。C3 removed layers 3; 4; 5 , C4removed layers 6  only, C5 removed layers 3; 4; 6  and C6 removed layer 2  only. C7表示没改动的AlexNet。结果如下左图所示:

EXPERIMENTALLY DEFINED CONVOLUTIONAL NEURAL NETWORK ARCHITECTURE VARIANTS FOR NON-TEMPORAL REAL-TIME_第2张图片

对于InceptionV1,有八种情况,we consider eight variationsto the architectural configuration by removing up to 8 inception modules from the original configuration of 9 present。结果如右图所示,9表示未删减版。

从图中能看出,C2准确率高且相对参数较少,右图3便显得较好,only three inception modules is the variation with the fewest parameters which retains performance in the highest band。

作者使用了25%的训练集,发现CNN的C2和AlexNet的C7会产生过拟合,且随着复杂度增加也会产生过拟合所以作者提出来了下面的网络

FireNet:

EXPERIMENTALLY DEFINED CONVOLUTIONAL NEURAL NETWORK ARCHITECTURE VARIANTS FOR NON-TEMPORAL REAL-TIME_第3张图片

InceptionV1-OnFire结构:

EXPERIMENTALLY DEFINED CONVOLUTIONAL NEURAL NETWORK ARCHITECTURE VARIANTS FOR NON-TEMPORAL REAL-TIME_第4张图片

2.3 超级像素superpixel定位

结合了传统的方法,这里不过多介绍

EXPERIMENTALLY DEFINED CONVOLUTIONAL NEURAL NETWORK ARCHITECTURE VARIANTS FOR NON-TEMPORAL REAL-TIME_第5张图片

实验结果:

True Positive Rate (TPR),False Positive Rate (FPR),F-score (F), Precision (P) and accuracy (A)

EXPERIMENTALLY DEFINED CONVOLUTIONAL NEURAL NETWORK ARCHITECTURE VARIANTS FOR NON-TEMPORAL REAL-TIME_第6张图片

EXPERIMENTALLY DEFINED CONVOLUTIONAL NEURAL NETWORK ARCHITECTURE VARIANTS FOR NON-TEMPORAL REAL-TIME_第7张图片

 

EXPERIMENTALLY DEFINED CONVOLUTIONAL NEURAL NETWORK ARCHITECTURE VARIANTS FOR NON-TEMPORAL REAL-TIME_第8张图片

结论:速度快,精度高。

 

 

你可能感兴趣的:(EXPERIMENTALLY DEFINED CONVOLUTIONAL NEURAL NETWORK ARCHITECTURE VARIANTS FOR NON-TEMPORAL REAL-TIME)