业务背景
从去年年底开始,我们团队一直在做一款能够给电商商品自动拍照的智能硬件。拍完照后,会将商品的套图在电商平台上进行展示。
对于要展示的商品图片而言,我们对图片本身的质量要求会比较高,例如不能将模糊不清的图片进行展示。因此,需要一种图像模糊检测的方法,便于我们筛选出可用的图片。
我们使用基于 Laplacian 的算法来检测图片是否模糊。调用它比较简单,因为 OpenCV 内置了 Laplacian 函数。
Laplacian 算子
求多元函数的二阶导数的映射被称为 Laplacian 算子,它相当于二阶 Sobel 算子的导数。
Laplacian 算子的定义:
我们分别对 Laplace 算子 x,y 两个方向的二阶导数进行差分就得到了离散函数的 Laplace 算子。
以 x 方向为例:
一阶差分:f'(x) = f(x) - f(x - 1)
二阶差分:f''(x) = f'(x+1) - f'(x) = (f(x + 1) - f(x)) - (f(x) - f(x - 1))
化简后:f''(x) = f(x - 1) - 2 f(x)) + f(x + 1)
提取前面的系数:[1, -2, 1]
同理,可得 y 方向的系数[1,-2,1]
叠加起来就得到了拉普拉斯矩阵
也就是拉普拉斯 3x3 卷积核。
图像模糊检测算法
算法的主要思想:先将图像转换成灰度图像,然后单一通道的灰度图像经过刚才计算出来的拉普拉斯 3x3 卷积核计算后会得到一个响应图,最后再计算这个响应图的方差。
基于该方差和按照经验设定的阈值进行比较,就可以判断图像是否模糊。对于同一种类型的商品图片,可以采用同一个阈值。不同的商品、不同环境拍摄的图片可能需要调整阈值。
bool isImageBlurry(cv::Mat& img, double threshold)
{
cv::Mat matImageGray;
cv::cvtColor(img, matImageGray, COLOR_BGR2GRAY);
cv::Mat dst, abs_dst;
cv::Laplacian(matImageGray, dst, CV_16S, 3);
cv::convertScaleAbs( dst, abs_dst );
cv::Mat tmp_m, tmp_sd;
double sd = 0;
cv::meanStdDev(dst, tmp_m, tmp_sd);
sd = tmp_sd.at(0,0); // 方差
return ((sd * sd) <= threshold);
}
找一张模糊的图片,写一个简单的例子进行测试
using namespace std;
using namespace cv;
bool isImageBlurry(cv::Mat& img, double threshold=49.0);
int main(int argc,char *argv[])
{
String imageName;
cout << "Enter the image file name: " << endl;
cin >> imageName;
// read the image
Mat image = imread(imageName);
double time = (double)getTickCount();
bool result = isImageBlurry(image);
time = ((double)getTickCount() - time) / getTickFrequency();
cout << "所用时间为:" << time << "s" << endl;
cout << "result:" << result << endl;
return 0;
}
bool isImageBlurry(cv::Mat& img, double threshold)
{
cv::Mat matImageGray;
cv::cvtColor(img, matImageGray, COLOR_BGR2GRAY);
cv::Mat dst, abs_dst;
cv::Laplacian(matImageGray, dst, CV_16S, 3);
cv::convertScaleAbs( dst, abs_dst );
cv::Mat tmp_m, tmp_sd;
double m = 0, sd = 0;
cv::meanStdDev(dst, tmp_m, tmp_sd);
m = tmp_m.at(0,0);
sd = tmp_sd.at(0,0);
std::cout << "sd * sd: " << sd * sd << std::endl;
return ((sd * sd) <= threshold);
}
执行结果:
Enter the image file name:
test.jpeg
sd * sd: 31.0646
所用时间为:0.0219034s
result:1
可以通过上述程序判断出该图片是模糊的。
最后,我们团队主要使用的语言是 Java/Kotlin,还需要编写一个 jni 来调用该函数。
总结
在无参考图像的情况下,Laplacian 是一种常见的图像模糊检测的方式。除此之外,还可以采用 Brenner、Tenengrad、SMD、SMD2 等等。