题目:解压指定目录下的zip文件,解压后对其中的某个Excel文件中的某个sheet页的某一行与另一个预期的同一文件进行比较,验证是否解压后存在问题。
源码:
# encoding=utf-8
import os, zipfile, openpyxl
# 获取指定目录下的zip文件
def getZipFile(sourceFilePath):
fileNameList = os.listdir(sourceFilePath)
# 获取以'.zip'后缀结尾的文件列表
zipFileList = []
for filenamein fileNameList:
if filename.endswith(".zip"):
zipFileList.append(filename)
return zipFileList
# 解压文件到指定目录下
def unzip(sourceFilePath, fileName, destinationPath):
fileNamePath = os.path.join(sourceFilePath, fileName)
fobj = zipfile.ZipFile(fileNamePath)
fobj.extractall(destinationPath)
fobj.close()
# 获取解压后指定文件名称(绝对路径)
def getFilePath(filepath, filename):
for root, dirs, filenamesin os.walk(filepath):
for filename1in filenames:
if filename == filename1:
return os.path.join(root, filename)
# 获取Excel文件列头
def getExcelFirstRow(filename, sheetname, num):
wb = openpyxl.load_workbook(filename)
sheet = wb.get_sheet_by_name(sheetname)
rowlist = []
# 可以将worksheet对象切片,取得电子表格中的一行,一列或一个矩形区域所有cell对象
# 老版本中的rows和columns属性在新版本中已失效,新版本解决方案有2种:
# 1)借助列表的方法,如:list(sheet.columns)[1],A列为0,B列为1
# 2)借助字符, sheet["B"]
# 以上2种方法,得到的数据类型都是元组
# 获取列表的第一行
for cellObjin list(sheet.rows)[num-1]:
if cellObj !="NoneType" and str(cellObj.value) !="None":
rowlist.append(cellObj.value)
return rowlist
# 使用断言验证实际结果与预期结果一致
def resultAssert(actualResult,expectedResult):
assert actualResult == expectedResult, "实际与预期不符合"
# 需要解压的文件路径
filepath =r'E:\lern\python_learn\ToClass\fileList'
# 预期结果的文件路径
expectedResult =r"E:\lern\python_learn\ToClass\fileList\预期结果"
# 解压后的文件路径
actualResult =r'E:\lern\python_learn\ToClass\fileList\实际结果'
# 需要验证解压后的文件名称和sheet页
filename ="10-08-14.xlsx"
sheetname ="汇总"
# 获取需要解压的zip文件
zipFileList = getZipFile(filepath)
# 获取最新的zip文件
zipFileList.sort()
newFileName = zipFileList[-1]
# 解压zip文件
unzip(filepath, newFileName, actualResult)
# 获取10-08-14.xlsx文件"汇总"sheet页的列头
actualFile = getFilePath(actualResult, filename)# 获取10-08-14.xlsx文件的路径
expectedFile = getFilePath(expectedResult, filename)# 获取10-08-14.xlsx文件的路径
# 读取"汇总"sheet页第1行
actualFileFirstRow = getExcelFirstRow(actualFile, sheetname, 1)
expectedFileFirstRow = getExcelFirstRow(expectedFile, sheetname, 1)
# 实际结果与预期结果进行比较
resultAssert(actualFileFirstRow, expectedFileFirstRow)
代码截图: