8.5 filecmp--文件和目录比较处理

本模块主要提供了对文件和目录进行简单的比较处理,如果需要复杂的文件比较需要使用difflib库来处理。

filecmp.cmp(f1, f2, shallow=True)

比较文件f1和文件f2,当两个文件相同时返回True,否则返回False。如果参数shallowTrue,只判断os.stat()函数返回内容是否相同,如果相同就返回True,否则再比较文件内容是否相同,如果相同也返回True。使用shallow参数可以快速地比较文件是否有修改过。

例子:

#python 3.4

import filecmp

 

r = filecmp.cmp('F:\\temp\\py\\bisect2.py', 'F:\\temp\\py\\bisect2.py')

print(r)

r = filecmp.cmp('F:\\temp\\py\\bisect2.py', 'F:\\temp\\py\\cal_1.py')

print(r)

结果输出如下:

True

False

 

filecmp.cmpfiles(dir1, dir2, common, shallow=True)

比较两个目录里相同文件列表的文件。参数dir1是目录1,参数dir2是目录2,参数common是比较的文件列表,参数shallow是跟上面的函数是一样意义。本函数运行之后返回三个文件名列表:相同列表、不相同列表、错误列表。如果文件相同放在相同列表,不相同放不相同列表,如果文件不存在某一个目录,就放错误列表。

例子:

#python 3.4

import filecmp

 

dir1 = 'F:\\temp\\py\\dir1'

dir2 = 'F:\\temp\\py\\dir2'

r = filecmp.cmpfiles(dir1, dir2,

                     ['difflib1.py', 'difflib5.py', 'test1.txt'])

print(r)

结果输出如下:

(['difflib1.py'], ['difflib5.py'], ['test1.txt'])

 

filecmp.clear_cache()

清除文件比较缓冲区。当比较的文件不断地快速修改时,就可以使用这个函数来更新文件的信息。

 

class filecmp.dircmp(a, b, ignore=None, hide=None)

构造一个新的目录比较对象,比较目录ab。参数ignore是忽略列表,是指那些文件不需要进行比较的;参数hide是隐藏的文件列表,默认是[os.curdir, os.pardir]

这个类主要提供下面的方法:

report()

打印ab之间的比较结果到系统sys.stdout输出。

 

report_partial_closure()

打印目录ab,以及公共的子目录的比较结果到系统sys.stdout输出。

 

report_full_closure()

递归所有目标,包括子目录,把结果比较输出。

 

left

内部表示目录a

 

right

内部表示目录b

 

left_list

内部表示目录a经过隐藏和忽略过滤的文件和子目录列表。

 

right_list

内部表示目录b经过隐藏和忽略过滤的文件和子目录列表。

 

common

目录ab都有的公共文件和子目录。

 

left_only

仅在目录a出现的文件和子目录。

 

right_only

仅在目录b出现的文件和子目录。

 

common_dirs

在目录a和目录b都出现的子目录。

 

common_files

在目录a和目录b都出现的文件。

 

common_funny

比较目录ab不同的目录或文件,通过os.stat()比较。

 

same_files

比较目录ab相同的目录或文件。

 

diff_files

比较目录ab不同的目录或文件,通过文件内容比较。

 

funny_files

不进行比较的文件。

 

subdirs

子目录字典。

 

filecmp.DEFAULT_IGNORES

需要忽略的文件列表。

 

例子:

from filecmp import dircmp

def print_diff_files(dcmp):

     for name in dcmp.diff_files:

         print("diff_file %s found in %s and %s" % (name, dcmp.left,

               dcmp.right))

     for sub_dcmp in dcmp.subdirs.values():

         print_diff_files(sub_dcmp)

 

dcmp = dircmp('dir1', 'dir2')

print_diff_files(dcmp)

在这个例子里,主要比较目录dir1dir2,为此创建了dircmp对象dcmp,然后调用函数print_diff_files(),在这个函数里主要打印输出不同的文件,并递归到子目录里打印子目录里不同的文件输出。



蔡军生 QQ:9073204  深圳

你可能感兴趣的:(python,milang)