os.walk的用法详解

python中os.walk是一个简单易用的文件、目录遍历器,可以帮助我们高效的处理文件、目录方面的事情

1.载入

可以使用以下两种方法

  • import os

  • from os import walk

 

2.使用

os.walk的函数声明为:

walk(top, topdown=True, οnerrοr=None, followlinks=False)

参数

  • top 是你所要便利的目录的地址

  • topdown 为真,则优先遍历top目录,否则优先遍历top的子目录(默认为开启)

  • onerror 需要一个 callable 对象,当walk需要异常时,会调用

  • followlinks 如果为真,则会遍历目录下的快捷方式(linux 下是 symbolic link)实际所指的目录(默认关闭)

os.walk 的返回值是一个生成器(generator),也就是说我们需要不断的遍历它,来获得所有的内容。

 

每次遍历的对象都是返回的是一个三元组(root,dirs,files)

  • root 所指的是当前正在遍历的这个文件夹的本身的地址

  • dirs 是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录)

  • files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)

如果topdown 参数为真,walk 会遍历top文件夹,与top文件夹中每一个子目录。

 3、举个例子

如果我们有如下的文件结构

os.walk的用法详解_第1张图片

for (root, dirs, files) in os.walk('a'):
    #第一次运行时,当前遍历目录为 a
    所以 root == 'a'
         dirs == [ 'b', 'c', 'd']
         files == [ '4.txt', '5.txt']
     
    。。。
  
    # 接着遍历 dirs 中的每一个目录
    b:  root  = 'a\\b'
        dirs  = []
        files = [ '1.txt', '2.txt']
     
    # dirs为空,返回
    # 遍历c
    c:  root  = 'a\\c'
        dirs  = []
        files = [ '3.txt' ]
     
    PS : 如果想获取文件的全路径,只需要
    for f in files:
        path = os.path.join(root,f)
     
    # 遍历d
    d:  root  = 'a\\b'
        dirs  = []
        files = []
  
    遍历完毕,退出循环

 

 做一个简单的例子: 获取文件夹下所有的文件csv结尾路径

def getFiles(path, suffix):
    return [os.path.join(root, file) for root, dirs, files in os.walk(path) for file in files if file.endswith(suffix)]

 

你可能感兴趣的:(python,内置模块,python常用模块)