解压文件到指定目录并和已知内容进行比较

题目:解压指定目录下的zip文件,解压后对其中的某个Excel文件中的某个sheet页的某一行与另一个预期的同一文件进行比较,验证是否解压后存在问题。

源码:

# encoding=utf-8

import os, zipfile, openpyxl

# 获取指定目录下的zip文件

def getZipFile(sourceFilePath):

fileNameList = os.listdir(sourceFilePath)

# 获取以'.zip'后缀结尾的文件列表

    zipFileList = []

for filenamein fileNameList:

if filename.endswith(".zip"):

zipFileList.append(filename)

return zipFileList

# 解压文件到指定目录下

def unzip(sourceFilePath, fileName, destinationPath):

fileNamePath = os.path.join(sourceFilePath, fileName)

fobj = zipfile.ZipFile(fileNamePath)

fobj.extractall(destinationPath)

fobj.close()

# 获取解压后指定文件名称(绝对路径)

def getFilePath(filepath, filename):

for root, dirs, filenamesin os.walk(filepath):

for filename1in filenames:

if filename == filename1:

return os.path.join(root, filename)

# 获取Excel文件列头

def getExcelFirstRow(filename, sheetname, num):

wb = openpyxl.load_workbook(filename)

sheet = wb.get_sheet_by_name(sheetname)

rowlist = []

# 可以将worksheet对象切片,取得电子表格中的一行,一列或一个矩形区域所有cell对象

# 老版本中的rows和columns属性在新版本中已失效,新版本解决方案有2种:

#  1)借助列表的方法,如:list(sheet.columns)[1],A列为0,B列为1

#  2)借助字符, sheet["B"]

# 以上2种方法,得到的数据类型都是元组

# 获取列表的第一行

    for cellObjin list(sheet.rows)[num-1]:

if cellObj !="NoneType" and str(cellObj.value) !="None":

rowlist.append(cellObj.value)

return rowlist

# 使用断言验证实际结果与预期结果一致

def resultAssert(actualResult,expectedResult):

assert actualResult == expectedResult, "实际与预期不符合"

# 需要解压的文件路径

filepath =r'E:\lern\python_learn\ToClass\fileList'

# 预期结果的文件路径

expectedResult =r"E:\lern\python_learn\ToClass\fileList\预期结果"

# 解压后的文件路径

actualResult =r'E:\lern\python_learn\ToClass\fileList\实际结果'

# 需要验证解压后的文件名称和sheet页

filename ="10-08-14.xlsx"

sheetname ="汇总"

# 获取需要解压的zip文件

zipFileList = getZipFile(filepath)

# 获取最新的zip文件

zipFileList.sort()

newFileName = zipFileList[-1]

# 解压zip文件

unzip(filepath, newFileName, actualResult)

# 获取10-08-14.xlsx文件"汇总"sheet页的列头

actualFile = getFilePath(actualResult, filename)# 获取10-08-14.xlsx文件的路径

expectedFile = getFilePath(expectedResult, filename)# 获取10-08-14.xlsx文件的路径

# 读取"汇总"sheet页第1行

actualFileFirstRow = getExcelFirstRow(actualFile, sheetname, 1)

expectedFileFirstRow = getExcelFirstRow(expectedFile, sheetname, 1)

# 实际结果与预期结果进行比较

resultAssert(actualFileFirstRow, expectedFileFirstRow)

代码截图:

你可能感兴趣的:(解压文件到指定目录并和已知内容进行比较)