用Python读取文件夹下文件名并检查缺失文件

从NASA中下载数据集后,发现有很多没有下载的文件。通过链接表和数据文件用肉眼比对很容易出错,就用python写了一个程序。
首先要把数据集存储在同一个路径下。
用Python读取文件夹下文件名并检查缺失文件_第1张图片
读入数据下载链接表文本文件
用Python读取文件夹下文件名并检查缺失文件_第2张图片tuplelink=os.walk(r'F:\data\modisnc下载')#获取文件夹下的路径和文件,并生成元组 for tuple in tuplelink:#生成文件名元组 pass listlink=tuple[2]#生成文件名列表 misslist=[]

import os#导入os库

file = open(r"C:\Users\dell\Desktop\Except.txt")#读取连接表文件

filelist=[]#创建空列表

while 1:#读取文本文件中的链接
    lines = file.readlines(100000)
    if not lines:
        break
    for line in lines:
        linne=line[-32:-1]#截取链接中的文件名
        print(linne)
        filelist.append(linne)

        pass # do something

# print(os.getcwd(r'F:\data\modisnc下载'))


tuplelink=os.walk(r'F:\data\modisnc下载')#获取文件夹下的路径和文件,并生成元组
for tuple in tuplelink:#生成文件名元组
    pass
listlink=tuple[2]#生成文件名列表
misslist=[]


# print('listlink',listlink[0])
# print('filelist',filelist[0])
l=len(listlink)
for i in range(l):#查找链接列表中每一个元素是否存在于文件名列表,并进行异常处理
    try:
        print(listlink.index(filelist[i]),filelist[i],'exists')
    except:
        print(listlink[i],'has missed')
        misslist.append(listlink[i])

print(misslist,'are missed')

你可能感兴趣的:(笔记,python)