Python获取文件夹下所有文件类型-用集合删除重复项

1. 遍历文件目录

import os
for dirpath, dirnames, filenames in os.walk('D:\迅雷下载'):
    print(dirpath)
    print(dirnames)
    print(filenames)
  • dirpath:string,代表目录的路径,会遍历所有子文件夹;
  • dirnames:list,包含了当前dirpath路径下所有的子目录名字(不包含目录路径),会遍历所有子文件夹;
  • filenames:list,包含了当前dirpath路径下所有的非目录子文件的名字(不包含目录路径),会遍历所有子文件夹。

2. 创建集合

set1 = set()    # 新建
set2 = {1,2,3}    # 新建包含值 

set1.add(5)    # 增加一个元素5
set.update([5,6,7,8])    # 增加多个元素

set1.remove(1)    # 删除元素“1”

3. 拆分文件名和后缀

os.path.splitext(file)[0]
os.path.splitext(file)[1]

4.完整代码

import os
set1 = set()

def getFile(sourcePath):
  for root, dirs, files in os.walk(sourcePath):
      for file in files:
          set1.add(os.path.splitext(file)[1])


getFile('D:\迅雷下载')
print(set1)

你可能感兴趣的:(Python获取文件夹下所有文件类型-用集合删除重复项)