python分割字符串后判断不重复的csv 文件 有多少个

#递归获取.csv文件存入到list1
import os,re
 
#将所有文件的路径放入到listcsv列表中
def list_dir(file_dir):
    # list_csv = []
    dir_list = os.listdir(file_dir)
    for cur_file in dir_list:
        path = os.path.join(file_dir,cur_file)
        #判断是文件夹还是文件
        if os.path.isfile(path):
            # print("{0} : is file!".format(cur_file))
            dir_files = os.path.join(file_dir, cur_file)
        #判断是否存在.csv文件,如果存在则获取路径信息写入到list_csv列表中
        if os.path.splitext(path)[1] == '.csv':
            csv_file = os.path.join(file_dir, cur_file)
            # print(os.path.join(file_dir, cur_file))
            # print(csv_file)
            list_csv.append(csv_file)
        if os.path.isdir(path):
            # print("{0} : is dir".format(cur_file))
            # print(os.path.join(file_dir, cur_file))
            list_dir(path)
    return list_csv
 
 
if __name__ == '__main__':
    paths = r'E:\\new_data\\A\\co_data'
    list_csv = []
    list_new=[]
    list_dir(file_dir=paths)
    for  i in  list_csv :
#         i=re.findall(r"\d+\.?\d*",string)
#         i=re.split(r'[^s]', i)
          i=i.split("\\")[-1][:6]
          list_new.append(i)
    print(len(list_new))
    new_l1 = []
    for i in list_new:
        if i not in new_l1:
            new_l1.append(i)
    print(len(new_l1))

在这里插入图片描述

你可能感兴趣的:(csv,python)