python 文件遍历

1.使用os.listdir(dir)得到一定list包含了目录下所有的文件和文件夹

os.path.join(dir,filename)获得文件的全路径

os.path.isdir(filepath)判断是不是一个dir

import os,sys
import re
def deal_log(log_name,dict):
    f=open(log_name)
    lines=f.readline()
    while lines:
        a=lines.split(" ")
        if a[0] in dict:
            dict[a[0]]+=1
        else:
            dict[a[0]]=1
        lines=f.readline()
    f.close()
    return dict
def listdir(dir):
    dict={}
    regex = re.compile(r'\w*access_log\w*')
    #print dir
    list = os.listdir(dir)
    for line in list:
        filepath = os.path.join(dir,line)
        if os.path.isdir(filepath):
            print line
            for li in os.listdir(filepath):
                print "\t"+os.path.join(filepath,li)
                m=re.search(regex,os.path.join(filepath,li))
                if m:
                    print os.path.join(filepath,li)
                    deal_log(os.path.join(filepath,li),dict)
        elif os.path:
            print "\t"+filepath
            m=re.search(regex,filepath)
            if m:
                print filepath
                deal_log(filepath,dict)
    print dict
#dir = raw_input('please input the path:')
listdir("/var/log")

2.使用os.walk

import os
def walk_dir(dir,topdown=True):
    print os.walk(dir, topdown)
    for root, dirs, files in os.walk(dir, topdown):
        #print "#"*100
        #print files
        #print "#"*100
        #print dirs
        #print "*"*100
        for name in files:
            print(os.path.join(root,name))
        for name in dirs:
            print(os.path.join(root,name))
dir = raw_input('please input the path:')
walk_dir(dir)
fileinfo = open('list.txt','w')

os.walk 方便很多了.这个方法返回的是一个三元tupple(dirpath, dirnames, filenames),

第一个为起始路径,

第二个为起始路径下的文件夹,

第三个是起始路径下的文件.
dirpath是一个string,代表目录的路径,

dirnames是一个list,包含了dirpath下所有子目录的名字,

filenames是一个list,包含了非目录文件的名字.这些名字不包含路径信息,如果需要得到全路径,需要使用 os.path.join(dirpath, name).



你可能感兴趣的:(python,遍历)