之前尝试用os.walk进行遍历目录,前几天看有人说os.scandir比walk更高效,尝试了一下,写了两端代码,做了一个测试
第一段用walk也是之前刚接触python 的时候在网上扒的
class scanwalk():
def __init__(self):
self.d=[]
def walkdir(self,dir):
for root,dirnames,filenames in os.walk(dir):
for filename in filenames:
file=os.path.join(root,filename)
self.d.append(file)
第二段是用dirscan写的
class scan():
def __init__(self):
self.d=[]
def scan(self,dir):
for i in os.scandir(dir):
if i.is_dir():
self.scan(i)
else:
self.d.append(i.path)
文件夹内容比较少的时候两个运行基本没感觉到区别
我用了一个20g装满word的层层文件夹测试,第一次运行时时间都差不多,但是第二次开始walk稳定在50秒左右,而dirscan稳定在30秒左右,效率确实有提升