情景再现:在做一个批量读取文件夹txt文件内容后,将文件内容写入excel表格的简单脚本时使用到了os.listdir()函数。当脚本完成后检查excel表格内容时发现表格内容顺序和txt文件顺序不一样,这就导致我剩下的工作全部GG(超级难受)。然后就去着手解决python os.listdir()读出顺序乱序问题。
我也不知道,那位大佬知道了麻烦评论教教我!!!!!
首先看一般情况下读出顺序:
files= os.listdir(path) #得到文件夹下的所有文件名称
读出的文件顺序是:
而在文件夹中所显示的文件排列顺序确实这样的:
这个顺序是不是很让人摸不到头脑,。
我后来想一想,这读出来的文件名字不就一列表嘛,我们把这个列表按我们想要的顺序排列好不就可以啦。
我们可以看到文件夹中的排序方式是先按照cache后的数字排序然后再按照第五个字母 a,b,s排序。所以我们就按照这个方式来排序。
def takeNumber(elem): #获取cache后面的数字
pattern = re.compile('cache(.+).txt')
num = int(pattern.findall(elem)[0])
return num
files= os.listdir(path) #得到文件夹下的所有文件名称
txts = []
all_data = []
files.sort(key=takeNumber)
files.sort(key= lambda x: x[4]) #lambda函数也叫匿名函数,即,函数没有具体的名称
总而言之,读出文件的顺序可以转化为对列表的排序。这类排序没有固定的方法,见招拆招,兵来将挡,水来土掩才是好办法。另外,对于正则表达式和lambda匿名函数也要有一定的了解才能做好(别问我是怎么知道的,菜鸡落泪)。