在智能视频分析系统的研究过程中,尤其是对于一些工程应用来说,光照的突然变化是一个很棘手的问题。尽管,不少学者对光照的突然变化进行了大量的研究,而且也提出了相关的光照不变的算法(illumination invariant),对解决这类问题提供了一定的思路。一般都是通过计算光照不变特征来实现,文章包括:
1)An Illumination Invariant Change Detection Algorithm.
2)Bayesian Illumination-Invariant Motion Detection.
3)robust and illumination invariant change detection based on linear dependence for surveillance application.
4)reflectance ratio-a photometric invariant for object recognition_ICCV93.
5)computing reflectance ratios from an image_PR93.
6)Color Invariant Edge Detection
7)Learning Photometric Invariance for Object Detection-IJCV2010
8)making background subtraction robust to sudden illumination changes
9)Object Detection Using Local Difference Patterns.
尽管,以上论文中的方法都声称对光照变化具有不变性,但是在实际中,有很多是靠不住的,可能说对缓慢光照的变化具有一定的鲁棒性更准确。有些算法的复杂度也是可待商榷的(如making background subtraction robust to sudden illumination changes)。
根据实际情况,本文提出两种解决光照突然变化的方法,一是多模式的背景模型,二是背景重建,我想这也应该是工程中应用较多的途径和思路吧。
多模式背景模型就是对一个场景建立多种环境下的背景模型,算法检测环境的变化,自动选择背景模型。如对于光照条件正常的情况建立一个背景模型,进行保存;而对于背景较暗的情况建立一个背景模型,也进行保存;如果有多种情况,就建立多个背景模型。(而对于缓慢的光照变化现在应该有很多算法能够处理)。
而对另外的背景重建的思路,现在已经有相当普遍的算法能够就一帧建立起背景模型(如SOBS、VIBE等)。在检测到有突然光照变化的情况下,就进行背景模型的重建,接着对运动进行检测。然而,在这种情况下,比较棘手的问题是如何判断光照的变化,很多论文上说的采用前景像素占整个图像大小的比例作为依据,然而该方法在实际中也常常误判率较高。本文介绍一种思路,而且经过试验也很不错,相比比率方法有了不少提高。
思路如下:将整个图片进行分块,统计每一块的前景像素个数,当某块的前景像素大于某一个阈值时,则计数器+1,依次遍历整个图像,统计得到计数器的值,计算机计算器与整个图像块数的比值,比值大于某一阈值,则判断为光照突变。
核心代码如下:
1)图像分块
// winSize default 32 void buildGrid( const Mat& input, vector<Rect>& grid, int winSize=32 ) { grid.clear(); int height = input.rows; int width = input.cols; Rect rc; for ( int i=0; i<height; i=i+winSize) { for ( int j=0; j<width; j=j+winSize ) { rc.y = i; rc.x = j; if (rc.x + winSize>width-1) rc.width = width-rc.x-1; else rc.width = winSize; if (rc.y+winSize>height) rc.height = height-rc.y-1; else rc.height = winSize; grid.push_back(rc); } } }
// winSize default 32, ratio default 1.0/winSize bool isSuddenChange( const vector<Rect>& grid, Mat& foreground, int winSize=32, double ratio=1.0/32.0) { int count = 0; int gridSize = grid.size(); for ( int i=0; i<gridSize; ++i ) { int nonZero = countNonZero( foreground(grid[i])); double _r = double(nonZero)/(double)(winSize*winSize); //if ( nonZero>32) if ( _r> ratio) count++; } double ratio = (double)count/(float)gridSize; cout<<" NonZero ratio: "<<ratio<<endl; if ( ratio > 0.60 ) { imwrite("fore.jpg",foreground); return true; } return false; }