CSV多标签数据预处理+加上csv多标签转文件夹+ ISIC2018数据集分类预处理

在下小白,深感自己的代码能力太差劲的,真要是大佬,那不是分分钟写出代码;

我这个是准备跑分类网络,有些模型要求分类的数据集必须是文件夹那种类型已经分好了,我找到的是官网的数据集,没有进行数据预处理;

在我处理数据的时候,在网上搜索关于csv针对多标签处理的时候,发现我没找到好用的代码;

在综合好几个博主的代码放在这里,参考的太多了,没时间就不放了;

实测也可以运行

import pandas as pd
import os
import shutil  

# 读取表格文件+填写你的csv文件的位置
f = open(r"D:\PythonProject\dataset\ISIC2018_Task3_Training_GroundTruth.csv", "rb") 
list = pd.read_csv(f)

# 进行分类----填写你要分类文件夹的标签,有多少就写多少
for i in ['NV','DF','AKIEC','VASC','BKL','MEL','BCC']:
    if not os.path.exists(i):
        os.mkdir(i)
    listnew = list[list["type"] == i]#type是你csv文件里面的你要处理的那一列的列名称
    l = listnew["image"].tolist()#image这里是你的处理文件的名字的列名称
    j = str(i)
    for each in l:
        #这里是你数据文件放置的位置
        shutil.copy('D:\\PythonProject\\dataset\\ISIC2018_Task3_Training_Input\\images\\' + each, j)

在这里放上我的数据csv文件的处理的结果

CSV多标签数据预处理+加上csv多标签转文件夹+ ISIC2018数据集分类预处理_第1张图片

未处理之前的结果: CSV多标签数据预处理+加上csv多标签转文件夹+ ISIC2018数据集分类预处理_第2张图片

代码处理之后的结果

CSV多标签数据预处理+加上csv多标签转文件夹+ ISIC2018数据集分类预处理_第3张图片 

顺便把我使用的数据集链接放在这个地方,

 ISIC2018 是一个皮肤损伤数据集,包含 10,015 张图像和七个标签。每个图像都与其中一个标签相关联,形成一个多类分类问题

ISIC Challenge

我是挂tizi进去的,其他网络不清楚

CSV多标签数据预处理+加上csv多标签转文件夹+ ISIC2018数据集分类预处理_第4张图片

 

 

你可能感兴趣的:(python,深度学习)