前言
在计算机视觉任务中,如图像分类,图像数据集必不可少。自己采集的图片往往存在很多噪声或无用信息会影响模型训练。因此,需要对图片进行裁剪处理,以防止图片边缘无用信息对模型造成影响。本文介绍几种图片裁剪的方式,供大家参考。
一、手动单张裁剪/截取
selectROI:选择感兴趣区域,边界框框选x,y,w,h
selectROI(windowName, img, showCrosshair=None, fromCenter=None):
. 参数windowName:选择的区域被显示在的窗口的名字
. 参数img:要在什么图片上选择ROI
. 参数showCrosshair:是否在矩形框里画十字线.
. 参数fromCenter:是否是从矩形框的中心开始画
要截取的原图如下:
截取效果如下:
截取之后按回车Enter保存:
完整代码如下:
import cv2 img = 'D:/anaconda3/JupyterNotebookFile/images/dogs_and_cats.jpg' img = cv2.imread(img) cv2.imshow('original', img) # 选择ROI roi = cv2.selectROI(windowName="original", img=img, showCrosshair=True, fromCenter=False) x, y, w, h = roi print(roi) # 显示ROI并保存图片 if roi != (0, 0, 0, 0): crop = img[y:y+h, x:x+w] cv2.imshow('crop', crop) cv2.imwrite('D:/anaconda3/JupyterNotebookFile/images/dogs_and_cats_crop.jpg', crop) print('Saved!') # 退出 cv2.waitKey(0) cv2.destroyAllWindows()
读者根据自己的图片目录修改目标图片目录和要写入的目录。
二、根据图片的位置坐标进行裁剪/截取
这是一张432×432大小的图片,左上角坐标为(0,0).
import cv2 im = cv2.imread('图片路径')
在用cv2.imread()默认读取三通道RGB图像后,会返回一个三维数组。同时,可用im[h,w]的形式来截取图片中的某个部分。比如中间柴犬的位置相对左上角坐标原点为,从上到下为190-380,从左往右为180-260。这样就可以通过坐标的相对位置来裁剪/截取目标图像了。
完整代码如下:
import cv2 import os file_path = 'D:/anaconda3/JupyterNotebookFile/images/dogs_and_cats.jpg' out_file_name = 'dogs_and_cats_cropp' im = cv2.imread(file_path) im = im[190:380,180:260] save_path = r'D:/anaconda3/JupyterNotebookFile/images' save_path_file = os.path.join(save_path,out_file_name+'.jpg') cv2.imwrite(save_path_file,im)
截取后的图片效果:
若很多个图片数据具有相似的位置,则可以通过遍历文件的方式批量裁剪/截取,代码如下:
import cv2 import os def clip_image(filelist,i,im_path): ''' filelist:文件夹路径 i:批量保存的图片文件名,用数字表示 im_path:图片路径 ''' for file in filelist: file_path=os.path.join(im_path,file) im=cv2.imread(file_path) #[h,w]根据自己图片中目标的位置修改 im=im[190:380,180:260] save_path = r'D:/anaconda3/JupyterNotebookFile/images' save_path_file = os.path.join(save_path,out_file_name+'.jpg') cv2.imwrite(save_path_file,im) i=i+1
传参并测试:笔者用的jupyter notebook,其他编译器写在main()中
i=0 im_path = r'D:/anaconda3/JupyterNotebookFile/images/dogs_and_cats.jpg' filelist = os.listdir(im_path) clip_image(filelist,i,im_path)
三、、用YOLO目标检测框裁剪并批量保存
同一类图片数据具有相似的特征,标注少量的图片训练YOLO提升其定位目标的能力,可以将所有的测试数据根据YOLO检测结果裁剪,并将结果保存用于其他分类任务中。
代码如下:
from PIL import Image from yolo import YOLO import os import cv2 import numpy as np yolo = YOLO() ''' yolo抠图,截取目标 ''' j=0 #预测图片所在路径 path = 'E:/crop_all' imgdir = os.listdir(path) for dir in imgdir: img_path = os.path.join(path,dir) image = Image.open(img_path) #print(image) crop_image = cv2.imread(img_path) #print(crop_image[0]) boxes = yolo.detect_image(image) #print(boxes) top = boxes[0][0] left = boxes[0][1] bottom = boxes[0][2] right = boxes[0][3] top = top - 5 left = left - 5 bottom = bottom + 5 right = right + 5 # 左上角点的坐标 top = int(max(0, np.floor(top + 0.5).astype('int32'))) left = int(max(0, np.floor(left + 0.5).astype('int32'))) # 右下角点的坐标 bottom = int(min(np.shape(image)[0], np.floor(bottom + 0.5).astype('int32'))) right = int(min(np.shape(image)[1], np.floor(right + 0.5).astype('int32'))) croped_region = crop_image[top:bottom, left:right] #裁剪图片存放目录 baocun = r'E:/crop_all_finish' save_path = os.path.join(baocun, str(j) + '.bmp') cv2.imwrite(save_path, croped_region) j = j + 1
截取效果如下:
总结
- 方法一适合少量图片裁剪或做测试时使用,无法批量裁剪。
- 方法二适合多个样本中的目标具有相似的位置,可以批量裁剪但是若位置不相似则不适用。
- 方法三用形态学手法获取轮廓再根据bounding box裁剪,可以批量处理,但是裁剪效果一般,能不能得到物体全看之前的轮廓获取的是否清晰,但并不是每个图片中的目标都能清晰地获取到轮廓。
- 方法四用YOLO也是根据boundingbox裁剪,可以批量处理但是需要人工标注成本,而且该成本根据模型的准确性略有起伏,但由于yolo训练很快,所以该方法是个不错的裁剪图片的手段。
到此这篇关于详解Python+opencv裁剪/截取图片的几种方式的文章就介绍到这了,更多相关opencv裁剪图片内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!