关于glob.glob遍历文件

我们经常会看到别人用glob,但是用glob时格式写的不规范往往会给人造成困扰,我们经常会有这个疑问——这到底是在遍历哪一层路径呢??

下面我们就几种常见的glob用法给出总结:

    import glob
    1、fdirs = glob.glob('C:/Users/admin/Desktop/glob/*') # 列出glob文件夹下所有的文件和文件夹
    2、fdirs = glob.glob('C:/Users/admin/Desktop/glob/*.jpg') # 列出glob文件夹下所有的jpg文件
    3、fdirs = glob.glob('C:/Users/admin/Desktop/glob/**/*jpg') # 列出glob的子文件夹里面的所有jpg图片(不包含glob下的jpg文件)
    4、fdirs = glob.glob('C:/Users/admin/Desktop/glob/**/*jpg',recursive=True) # 列出glob文件夹下及各层子文件夹的所有jpg文件

其中最后一种glob的用法是跟下面的oswalk_files()同理的,即遍历路径下所有的文件,包括该路径下的文件、子目录下的文件、孙目录下的文件......

def oswalk_files(srcwd):
    # 遍历srcwd下的所有文件
    filedirs=[]
    for root, dirs, imgs in os.walk(srcwd):
        for file in imgs:
            imgdir=osp.join(root,file)
            filedirs.append(imgdir)
    return filedirs

 其实我还是习惯于用oswalk_files(),因为简介明了,我想要什么文件再加一个类似这个语句就行:

imgs = [img for img in imgs if img.endswith('.jpg')]

PS:上面的glob常常也会结合os.path.join来使用,这个就是路径拼接,没啥好说的

2022-6-15 15:43:07

你可能感兴趣的:(学习,python)