图像分类任务:根据文件夹数据集生成csv文件

import os

import csv

import re

# 要读取的文件的根目录

root_path ='D:\\car\\train\\train'


    # 将所有目录下的文件信息放到列表中
def get_Write_file_infos(path):
    # 文件信息列表
    file_infos_list = []
    # 遍历并写入文件信息
    for root, dirnames, filenames in os.walk(path):
        for filename in filenames:
            file_infos = {}
            dirname = root
            dirname = re.findall(r'.\\(.+)', dirname)

            filename1 = filename.split('.jpg')[0]
            file_infos["id"] = filename1#文件名
            file_infos["type"] = dirname[0].split('\\')[3]#文件夹名称,即标签

            # 将数据追加字典到列表中
            file_infos_list.append(file_infos)

    return file_infos_list

# 写入csv文件
def write_csv(file_infos_list):
    with open('1.csv', 'a+', newline='') as csv_file:
        csv_writer = csv.DictWriter(csv_file, fieldnames=['id', 'type'])
        csv_writer.writeheader()
        for each in file_infos_list:
            csv_writer.writerow(each)

# 主函数
def main():
    # 调用获取文件信息的函数
    file_infos_list = get_Write_file_infos(root_path)
    # 执行写入程序
    write_csv(file_infos_list)

# 主程序入口

if __name__ == '__main__':
    main()


你可能感兴趣的:(分类,数据挖掘,人工智能)