python 遍历文件夹

1.遍历文件夹
  1. import os
  2. import os.path
  3. rootdir = “d:\data” # 指明被遍历的文件夹

  4. for parent,dirnames,filenames in os.walk(rootdir): #三个参数:分别返回1.父目录 2.所有文件夹名字(不含路径) 3.所有文件名字
  5.     for dirname in dirnames: #输出文件夹信息
  6.      print "parent is:" + parent
  7.      print "dirname is" + dirname

  8.     for filename in filenames: #输出文件信息
  9.      print "parent is": + parent
  10.      print "filename is:" + filename
  11.    print "the full name of the file is:" + os.path.join(parent,filename) #输出文件路径信息

  12.                                                                          #windows下为:d:\data\query_text\EL_00154
2.查找中文字符

  1. import re 
  2. pchinese=re.compile(ur'([\u4e00-\u9fa5]+)+?') #判断是否为中文的正则表达式
  3. f=open("D:\\workspace\\saas\\core\\admin\\controller\\sale\\ctl.tools.php") #打开要提取的文件
  4. fw=open("getdata.txt","w")#打开要写入的文件
  5. for line in f.readlines(): #循环读取要读取文件的每一行
  6.     m=pchinese.findall(line.decode('utf8')) #使用正则表达获取中文
  7.     if m:
  8.         str1='|'.join(m)#同行的中文用竖杠区分
  9.         str2=str1
  10.         fw.write(str2)#写入文件
  11.         fw.write("\n")#不同行的要换行
  12. f.close()
  13. fw.close()#

3.遍历文件夹,并将文件中中文写入文件

  1. #coding=utf-

  2. import re, os
  3. def find_chn(infile, outfile):
  4.     pchinese=re.compile(ur'([\u4e00-\u9fa5]+)+?') #判断是否为中文的正则表达式
  5.     f=open(infile) #打开要提取的文件
  6.     flag = 0
  7.     for line in f.readlines(): #循环读取要读取文件的每一行
  8.         if line.find('//')!= -1:#如果有注释,直接跳过
  9.             continue
  10.         if line.find('/*')!= -or line.find('<!--')!= -1:
  11.             flag=1
  12.         if line.find('*/')!= -or line.find('-->')!= -1:
  13.             flag = 0
  14.             continue
  15.         if flag==1:
  16.             continue
  17.         m=pchinese.findall(line.decode('utf8')) #使用正则表达获取中文
  18.         if m:
  19.             str1='|'.join(m)#同行的中文用竖杠区分
  20.             str2=str1
  21.             outfile.write(str2)#写入文件
  22.             outfile.write("\n")#不同行的要换行
  23.             print str2
  24.     f.close()


  25. fw=open("getdata.txt","a+")#打开要写入的文件
  26. for parent,dirnames,filenames in os.walk("D:\\workspace\\saas\\core\\shop\\view\\gallery\\"): #三个参数:分别返回1.父目录 2.所有文件夹名字(不含路径) 3.所有文件名字

  27.     for filename in filenames: #输出文件信息
  28.         print os.path.join(parent,filename) 
  29.         find_chn(os.path.join(parent,filename), fw)

  30. fw.close()#

你可能感兴趣的:(python 遍历文件夹)