在做验证码识别时,识别时需要和库里的图片对比,找到最接近的那个图片,然后就行到了用与图片一致的字符命名,获取文件的名称,去将图片的名称读出来作为验证码。以下是我通过网上的资料总结的三种文件遍历的方式,第一种和第二种相似,只是和第三种有一些区别。
首先要获得文件夹的路径,我是对某个文件夹下的文件进行遍历,需要去除文件的后缀,注:num为我创建的一个文件夹
import os #需要用到os包
s=os.sep #s区分在linux或windows系统下的分割符"/"或"\"
root="C:\Users\XXX\Desktop"+s+"num"+s #文件路径
mode=[] #用mode进行去掉后缀的文件名存储。
#遍历文件的第一种方式:
sname=os.listdir("root") #获取文件夹下文件或文件夹的名称,获取到的sname的格式为('1.jpg')。
for f in sname:
fname=os.path.splitext(f) #对f中的文件名进行分割,分割后显示为['1','jpg']
mode.append(fname[0]) #fname[0],取序列中的第一值,即['1']
print mode
#遍历文件第二种方法
def func(args,dire,fis):
for f in fis:
fname=os.path.splitext(f) #splitext分割文件名和文件后缀
mode.append(fname[0])
os.path.walk(root,func,()) #通过调用函数进行文件的遍历,这种方法只能获取到文件夹下的文件名,不能获取到子文件夹下的其他内容
#使用os.walk-遍历文件的第三张方法:
for rt, dirs, files in os.walk(root): #通过os.walk进行文件遍历,可以获得文件夹下子文件内的内容
for f in files:
fname = os.path.splitext(f)
mode.append(fname[0])