python定位二维码_图像中二维码的检测和定位

二维码

二维条码/二维码(2-dimensional bar code)是用某种特定的几何图形按一定规律在平面(二维方向上)分布的黑白相间的图形记录数据符号信息的;在代码编制上巧妙地利用构成计算机内部逻辑基础的“0”、“1”比特流的概念,使用若干个与二进制相对应的几何形体来表示文字数值信息,通过图象输入设备或光电扫描设备自动识读以实现信息自动处理:它具有条码技术的一些共性:每种码制有其特定的字符集;每个字符占有一定的宽度;具有一定的校验功能等。同时还具有对不同行的信息自动识别功能、及处理图形旋转变化点。

QR-Code-Overview.jpeg

定位图案

Position Detection Pattern是定位图案,用于标记二维码的矩形大小。这三个定位图案有白边叫Separators for Postion Detection Patterns。之所以三个而不是四个意思就是三个就可以标识一个矩形了。

Timing Patterns也是用于定位的。原因是二维码有40种尺寸,尺寸过大了后需要有根标准线,不然扫描的时候可能会扫歪了。

Alignment Patterns 只有Version 2以上(包括Version2)的二维码需要这个东东,同样是为了定位用的。

通过查找定位图案,可以实现二维码扫描的检测和定位。

检测和定位的步骤

先对图片进行灰度处理:

image = image.getImage().convert2Gray().getProcessor();

ByteProcessor src = ((ByteProcessor)image);

再对图像做二值化处理:

Threshold t = new Threshold();

t.process(src, Threshold.THRESH_OTSU, Threshold.METHOD_THRESH_BINARY_INV, 20);

然后是对y、x方向进行形态学上的开操作

MorphOpen mOpen = new MorphOpen();

byte[] data = new byte[width*height];

System.arraycopy(src.getGray(), 0, data, 0, data.length);

ByteProcessor copy = new ByteProcessor(data, width, height);

mOpen.process(src, new Size(n1, n2)); // Y方向开操作

src.getImage().resetBitmap();

mOpen.process(copy, new Size(n2, n1)); // X方向开操作

CV4JImage cv4JImage = new CV4JImage(width,height);

((ByteProcessor)cv4JImage.getProcessor()).putGray(copy.getGray());

所谓开操作是指先腐蚀后膨胀的操作。在之前的文章二值图像分析:案例实战(文本分离+硬币计数)曾经介绍过开操作的用途。

import com.cv4j.core.datamodel.ByteProcessor;

import com.cv4j.core.datamodel.Size;

public class MorphOpen {

/**

* in order to remove litter noise block, erode + dilate operator

*

* @param binary

* @param structureElement

*/

public void process(ByteProcessor binary, Size structureElement) {

FastErode erode = new FastErode();

FastDilate dilate = new FastDilate();

erode.process(binary, structureElement, 1);

dilate.process(binary, structureElement, 1);

}

}

接下来是标记联通区域,找到二维码的三个特征区域,也就是定位图案。

// 联通组件查找连接区域

ConnectedAreaLabel ccal = new ConnectedAreaLabel();

ccal.setFilterNoise(true);

List rectList = new ArrayList<>();

int[] labelMask = new int[width*height];

ccal.process(src, labelMask, rectList, true);

float w = 0;

float h = 0;

float rate = 0;

List qrRects = new ArrayList<>();

for(Rect roi : rectList) {

if (roi == null) continue;

if((roi.width > width/4 || roi .width < 10) || (roi.height < 10 || roi.height > height/4))

continue;

if((roi.x < 10 || roi.x > width -10)|| (roi.y < 10 || roi.y > height-10))

continue;

w = roi.width;

h = roi.height;

rate = (float)Math.abs(w / h - 1.0);

if(rate < 0.05 && isRect(roi, labelMask, width, height,true)) {

qrRects.add(roi);

}

}

最后,通过定位图案能够找到二维码所在的区域,如果找不到会返回空的矩形。否则返回一个Rect,它表示找到的二维码所在图像中的区域。

我们可以对该区域进行标识,下面是算法的具体使用,找到图像中的二维码之后,用红色的边框框起来。

CV4JImage cv4JImage = new CV4JImage(bitmap);

QRCodeScanner qrCodeScanner = new QRCodeScanner();

Rect rect = qrCodeScanner.findQRCodeBounding(cv4JImage.getProcessor(),1,6);

Bitmap bm = bitmap.copy(Bitmap.Config.ARGB_8888, true);

Canvas canvas = new Canvas(bm);

Paint paint = new Paint();

paint.setColor(Color.RED);

paint.setStrokeWidth((float) 10.0);

paint.setStyle(Paint.Style.STROKE);

android.graphics.Rect androidRect = new android.graphics.Rect(rect.x-20,rect.y-20,rect.br().x+20,rect.br().y+20);

canvas.drawRect(androidRect,paint);

image.setImageBitmap(bm);

定位图片中的二维码区域.png

定位有创意的二维码.png

截图微信的二维码.png

对于iPhone截屏之后的图片,该图片尺寸是1242 × 2208。在没有对图片做任何缩放处理的情况下,使用该算法进行定位二维码的区域也是ok的。

大图中的二维码.png

当然,对于大图如果适当地降采样处理或者缩放的话,算法速度会更快。

写在最后

彩色二维码和小程序的圆形二维码目前能够检测吗?

暂时不能。因为图像在二值化之后,彩色的部分像素点会变成白色的像素点,导致二维码轮廓不完整,最终导致无法实现二值分析。我们会在完成模版匹配的功能之后,继续优化算法完善该功能,加上检测彩色和圆形二维码的能力。

算法的源码位于cv4j的QRCodeScanner中,该算法不能识别二维码的字符串,只能找到二维码的区域,如果需要识别二维码还是需要使用Google Zxing。

总结

cv4j 是gloomyfish和我一起开发的图像处理库,纯java实现,目前还处于早期的版本。

文章中的算法是对二值图像分析的综合运用,使用它再结合Google的ZXing能够提高二维码的识别率。当然,由于它是pure java实现的,稍作改动能够用它来判断出某张图片中是否包含有二维码。

你可能感兴趣的:(python定位二维码)