Python实战-重名文件筛选

Python实战1

前言:Python是脚本语言,同时也是一个高度粘合剂的语言,可配合java、c shell等等别的语言做很多很有意思的事情。本人在学习与实战的过程中,主要是两个方向,一是爬虫、数据分析挖掘清洗方向;二是工具性方向,本人通过python实现了很多小工具,来满足日常的办公、工作需要。

一个相同文件筛选小工具

思路很简单,便利出两个目录的文件,存储到对应的list中,对两个list进行数据集比较。思路简单,但对于新同学熟悉python的语法,以及os、path、for等等都基本有涉及,还是获益匪浅的。

递归获取文件path

def dirlist(path, allfile):  
    filelist =  os.listdir(path)  

    for filename in filelist:  
        filepath = os.path.join(path, filename)  
        if os.path.isdir(filepath):  
            dirlist(filepath, allfile)  
        else:  
            allfile.append(filepath)  
    return allfile  

文件名匹配,忽略部分后缀名

#遍历所有文件,获取文件名称(包括后缀)
for item in filePath1:
    fileName1.append(os.path.basename(item))

for item in filePath2:
    fileName2.append(os.path.basename(item))

#通过遍历,获取第一个文件夹下,文件名称(不包括后缀)与第二个文件夹相同的文件,并另存在outDir文件夹下。文件名称与第一个文件夹里的文件相同,后缀格式亦保持不变。
for item1 in fileName1:
    for item2 in fileName2:
        if item1 == item2:
            dir = filePath1[fileName1.index(item1)]
            if dir.endswith("xml"):
                continue
            print(dir);

资源下载:https://download.csdn.net/download/liao__yong/10286423

你可能感兴趣的:(python)