在做深度学习的时候,往往要需要大量的照片,但是有时候想把几个文件夹里面的照片按一定比例抽取出来放到一个新的文件夹里面。然后对这个文件夹里面的照片做一定的处理。或者有时候需要将一个文件夹里面的照片按一定比例分为训练集和测试集。所以按下面的方法就可以了。
首先准备两个文件夹,一个里面有照片(一共20张),一个是空文件夹。如下图所示。
现在要做的是将train文件夹里面的照片抽取20%出来到test文件中。运行下面的代码。
# 深度学习过程中,需要制作训练集和验证集、测试集。
import os, random, shutil
"""
fileDir原始图片路径
tarDir存放图片路径
rate获取图片中的比例,比方说100张抽10张,那就是0.1
"""
def moveFile(fileDir, tarDir, rate):
# 取图片的原始路径
pathDir = os.listdir(fileDir)
# 获取图片的个数,按照rate比例从文件夹中随机取一定数量图片
filenumber = len(pathDir)
picknumber = int(filenumber * rate)
sample = random.sample(pathDir, picknumber)
for name in sample:
# shutil.copyfile(fileDir + name, tarDir + name) # 将图片复制到新文件夹中
shutil.move(fileDir + name, tarDir + name) # 将图片移动到新文件夹中
return
if __name__ == '__main__':
fileDir = "C:/Users/86159/Desktop/train/" # 源图片文件夹路径
tarDir = 'C:/Users/86159/Desktop/test/' # 移动到新的文件夹路径
moveFile(fileDir, tarDir, 0.2)
得到结果:抽取了train中的20%张的照片到test文件夹中,现在tran里面只有48张照片,test里面有12张。
文件夹的路径最后一定要加 / ,这样才能读取该文件下的图片,否则会找不到该文件下的照片,就会报错。
函数中还多了一个功能,就是将图片复制到文件夹中,而不是移动到文件夹中,将下面的代码注释,上面的代码取消注释,就可以实现这个功能了。