opencv初体验,不需要卷积的图片分类

爱情,能够让普通的日子变得熠熠生辉。感谢喜欢着别人的每一个人,是因为我们的目光,对方熠熠生辉。

项目背景

公司进行海报运营活动,需要判断用户是否确实在微信朋友圈向所有人分享了指定的海报, 我们用tensorFlow训练了一个模型来智能判定。现又提出需求,要求模型能够根据左上角的字来对海报进行分类。为了更快的响应运营需求,我花了半天用opencv-python做了一个临时分类服务,还有点意思,分享一下。

火花思维 火花AI课
火花思维
opencv初体验,不需要卷积的图片分类_第1张图片
火花AI课

分类思路

  1. 把图片字样截取出来
  2. 用图片字样训练分类模型(logit)
  3. 进行预测

截取图片字样

import cv2

def cut_words(image):
    image = image[0 : int(image.shape[0] / 6), 0 : int(image.shape[1] / 2)]
    image_8bit = cv2.convertScaleAbs(image)
    gray = cv2.cvtColor(image_8bit, cv2.COLOR_BGR2GRAY)
    erode = cv2.erode(gray, np.ones((3, 2), np.uint8), iterations=3)
    _, thresh = cv2.threshold(erode, 60, 255, cv2.THRESH_BINARY)
    contours, _ = cv2.findContours(thresh, cv2.RETR_LIST, cv2.CHAIN_APPROX_NONE)
    # filter the target contour
    cv2.imwrite(output_path, image[min_y:max_y, min_x:max_x])
  1. 明确目标。
  • image[0 : int(image.shape[0] / 6), 0 : int(image.shape[1] / 2)], 字样一定在海报的左上角,所以第一步就截取出更小的图片操作,减少无关特征。
  • cv2.convertScaleAbs(image), 降低图片位数, opencv的基本操作,位数太高,操作不了...
  • cv2.cvtColor(image_8bit, cv2.COLOR_BGR2GRAY), 更换颜色空间,基本操作。不同的颜色空间,方便做不一样的事情。灰度空间非常适合跟踪特点颜色的物体。
灰色图片
  1. 腐蚀图像
  • 形态学操作,简单点说,腐蚀【erode】让黑的变黑,膨胀【dilate】让白的变白。
  • cv2.erode(gray, np.ones((3, 2), np.uint8), iterations=3), 海报中的字样是黑色,我们这里用腐蚀,让黑的变黑。
    • 第一个参数:灰度图片
    • 第二个参数:像素框大小。从左上开始检查图片,如果每 3 * 2 个像素框内有黑色像素,则让整个像素框变黑。
    • 第三个参数:迭代次数。用同样大小的像素框检查三次。
腐蚀图片
  1. 二极化
  • 现在图片中还有很多颜色,为了更好的做edge detection(边界侦查),提高物体的对比度,我们把图片变成黑白两色。
  • cv2.threshold(erode, 60, 255, cv2.THRESH_BINARY), 这里有多种模式,挺长的,我百度了一个中文网站,感兴趣看看。
极化图片
  1. 找轮廓
  • 边界侦查,找轮廓。
  • cv2.findContours(thresh, cv2.RETR_LIST, cv2.CHAIN_APPROX_NONE), 这里也有很多模式,但是没那么有意思,主要原理是矩阵element wise相乘,感兴趣可以深入了解。
opencv初体验,不需要卷积的图片分类_第2张图片
轮廓图片
  1. 截取目标
  • 选取轮廓的上下左右的最值,截成矩形图片。
opencv初体验,不需要卷积的图片分类_第3张图片
最终图片

训练和预测

  1. cv2.resize(img, (max_x, max_y), interpolation=cv2.INTER_AREA), 把所有图片都变成一个大小;
  2. x = img.flat, y = 0, 把图片摊平当作模型特征, 0, 1代表分类
  3. clf = LogisticRegression(max_iter=10000).fit(x_train, y_train), 用logit训练模型
  4. clf.predict(x_test), 预测结果

整个分类过程很简单,也很直接。20%的努力,换得80%的价值,体现了敏捷精神。

愿,每一位读者,都能收获幸福的爱情。

你可能感兴趣的:(opencv初体验,不需要卷积的图片分类)