使用Python来比较文件夹并提取差异部分

使用Python来比较文件夹并提取差异部分[@more@]

下面的脚本可以在Python24里很好地运行,在其他版本里没有测试,但用的都是基本功能,应该没有什么问题。

代码里的PathA是全的数据的文件夹,PathB是不全的数据的文件夹,PathC是个新的空目录,脚本执行完后就把PathA中有且pathB中没有的文件和目录都写到PathC里了,还可以保持原来的目录结构,速度和正确性都很令人满意。

因为是急用的代码,所以写得不很简洁,也不是很规范,在此留志,一方面供自己以后参考,另一方面也提供给需要使用Python进行文件和目录操作的兄弟们共同参考。

# coding: GB2312

#系统模块
import sys
import os
import shutil
#用于文件查找的模块
from os.path import walk, join, normpath

#这个是完整的文件夹
PathA = "F:FullData"
#这个是缺文件的文件夹
PathB = "F:IncomplData"

#这个是目标文件夹
PathC = "F:DiffData"

#============================================================
#这个函数是用来递归处理PathA,对PathA里的每个文件和文件夹在PathB中找是否有对应的文件或文件夹
#若找不到,则在PathC中创建目录并拷贝文件
#拷贝文件时使用了shutil模块的copy2函数,以保留文件原来的创建时间和最后更新时间
def visit(arg, dirname, names):
#把目录打印出来,以监视进度
print dirname

#得到路径名后,把前面的主路径名去掉
dir=dirname.replace(PathA,"")

dirnameB = os.path.join(PathB,dir)
dirnameC = os.path.join(PathC,dir)

if os.path.isdir(dirnameB):
#若PathB里存在对应的文件夹,再逐个文件判断是否存在
for file in names:
if os.path.isfile(os.path.join(dirname,file)) and not os.path.isfile(os.path.join(dirnameB,file)):
if not os.path.isdir(dirnameC):
os.system("mkdir %s"%(dirnameC))
shutil.copy2(os.path.join(dirname,file), os.path.join(dirnameC,file))
elif os.path.isdir(os.path.join(dirname,file)) and not os.path.isdir(os.path.join(dirnameB,file)):
if not os.path.isdir(os.path.join(dirnameC,file)):
os.system("mkdir %s"%(os.path.join(dirnameC,file)))
else:
#若pathB里不存在对应的文件夹,则在pathC里创建对应的文件夹并拷贝文件
if not os.path.isdir(dirnameC):
os.system("mkdir %s"%(dirnameC))

for file in names:
shutil.copy2(os.path.join(dirname,file), os.path.join(dirnameC,file))

#============================================================


if __name__=="__main__":
#这一行代码调用前面的visit函数,进行文件查找并递归处理
walk(PathA, visit, 0)

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/9697/viewspace-1011813/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/9697/viewspace-1011813/

你可能感兴趣的:(使用Python来比较文件夹并提取差异部分)