在数据集有限的情况下,如何批量扩充训练集或数据集?(基于python利用旋转、镜像、添加高斯噪声的方法)

前提条件:

1.安装好pycharm

2.安装好PIL、os等库

3.注:这里我是主要做语义分割,所以有两个数据集包

(1)原图img文件夹

(2)标注图segment文件夹(有需要labelme的使用可以后续发出滴)

4.注:如果你是需要只对一个文件或一张图做旋转,segment的可以自己删掉。


一、旋转

这里旋转角度全是随机的。

如果有需求都是一个角度,自行更改Angle部分的代码。

from PIL import Image
import os
import random

# 设置训练集测试集输入和输出目录
input_dir_image = 'C:\\py\\fix_image\\25m\\images'       
# 仅需改变“文件地址”就可以实现对图片的旋转操作
output_dir_image = input_dir_image

input_dir_segement = 'C:\\py\\fix_image\\25m\\segments'
output_dir_segment = input_dir_segement

# 图片数量
input_size_image = len(os.listdir(input_dir_image))
input_size_segment = len(os.listdir(input_dir_segement))

# 随机角度列表生成
Angle = []
for i in range(input_size_image):
    Angle.append(random.randint(1, 359))

i = 0
j = 0
# 对img文件夹的图像进行不同角度的旋转
for filename in os.listdir(input_dir_image):
    if filename.endswith('.png'):
        # 打开图像
        img = Image.open(os.path.join(input_dir_image, filename))
        # 旋转图像并保存
        rotated_img = img.rotate(Angle[i], expand=True)
        rotated_img.save(os.path.join(output_dir_image, f'{Angle[i]}_{filename}'))
        i = i + 1
# 对segment文件夹的图像进行不同角度的旋转
for filename_ in os.listdir(input_dir_segement):
    if filename_.endswith('.png'):
        # 打开图像
        img = Image.open(os.path.join(input_dir_segement, filename_))
        # 旋转图像并保存
        rotated_img = img.rotate(Angle[j], expand=True)
        rotated_img.save(os.path.join(output_dir_segment, f'{Angle[j]}_{filename_}'))
        j = j + 1

二、镜像

from PIL import Image
import os
import warnings


warnings.filterwarnings("ignore")  # 避免出现warnings 保持美观
# 设置输入和输出目录
input_dir_image = 'C:\\py\\fix_image\\5m\\images'       # 仅需改变”25m“就可以实现对图片的镜像操作
output_dir_image = input_dir_image

input_dir_segement = 'C:\\py\\fix_image\\5m\\segments'  # 仅需改变”25m“就可以实现对图片的镜像操作
output_dir_segment = input_dir_segement

for filename in os.listdir(input_dir_image):
    if filename.endswith('.png'):
        # 打开图像
        img = Image.open(os.path.join(input_dir_image, filename))

        # 水平镜像并保存
        mirrored_img = img.transpose(Image.FLIP_LEFT_RIGHT)
        mirrored_img.save(os.path.join(output_dir_image, f'horizmir_{filename}'))

        # 垂直镜像并保存
        mirrored_img = img.transpose(Image.FLIP_TOP_BOTTOM)
        mirrored_img.save(os.path.join(output_dir_image, f'vertmir_{filename}'))

for filename_ in os.listdir(input_dir_segement):
    if filename_.endswith('.png'):
        # 打开图像
        img = Image.open(os.path.join(input_dir_image, filename_))

        # 水平镜像并保存
        mirrored_img = img.transpose(Image.FLIP_LEFT_RIGHT)
        mirrored_img.save(os.path.join(output_dir_segment, f'horizmir_{filename_}'))

        # 垂直镜像并保存
        mirrored_img = img.transpose(Image.FLIP_TOP_BOTTOM)
        mirrored_img.save(os.path.join(output_dir_segment, f'vertmir_{filename_}'))

三、高斯噪声

import os
from PIL import Image, ImageFilter


class MyGaussianBlur(ImageFilter.Filter):
    name = "GaussianBlur"

    def __init__(self, radius=2, bounds=None):
        self.radius = radius
        self.bounds = bounds

    def filter(self, image):
        if self.bounds:
            clips = image.crop(self.bounds).gaussian_blur(self.radius)
            image.paste(clips, self.bounds)
            return image
        else:
            return image.gaussian_blur(self.radius)


# 设置输入和输出目录
input_dir_image = 'C:\\py\\fix_image\\25m\\images'  # 仅需改变”25m“就可以实现对图片的镜像操作
output_dir_image = input_dir_image

input_dir_segement = 'C:\\py\\fix_image\\25m\\segments'  # 仅需改变”25m“就可以实现对图片的镜像操作
output_dir_segment = input_dir_segement

for filename in os.listdir(input_dir_image):
    if filename.endswith('.png'):
        # 打开图像
        img = Image.open(os.path.join(input_dir_image, filename))

        # 调用高斯噪声函数
        gaussian_img = img.filter(MyGaussianBlur(radius=2))
        gaussian_img.save(os.path.join(output_dir_image, f'gaussian_{filename}'))

for filename_ in os.listdir(input_dir_segement):
    if filename_.endswith('.png'):
        # 打开图像
        img = Image.open(os.path.join(input_dir_image, filename_))

        # 调用高斯噪声函数
        gaussian_img = img.filter(MyGaussianBlur(radius=2))
        gaussian_img.save(os.path.join(output_dir_segment, f'gaussian_{filename_}'))

你可能感兴趣的:(python,计算机视觉,python,pillow,numpy)