python实现读取大量文件并通过正则识别文件内容并生成新的文件

###    最近在开发中有一个实际问题是,经常会有上千个.ksc文件(类似.txt)需要提取文件内容将并将文件内容写入其他目标文件中,最终读取目标文件字段提高开发效率。

###    这里体会到了python的便捷和正则的强大之处

import os
import re
erroFile = []
kscTxt = open("C:/Users/new/Desktop/ksc/ksc.txt", mode='w', encoding='utf-8')
for root, dirs, files in os.walk("C:/Users/new/Desktop/ksc/ksc", topdown=True):
    if os.listdir(root):    #top文件夹不为空文件夹
        for f in files:      #遍历所有文件
            kscFile = open("C:/Users/new/Desktop/ksc/ksc/"+f, mode='r', encoding='utf-8')
            try:
                content = kscFile.readlines()
                print(''.join(content))
                print(type(content))    #读出的文件是个list因此下面正则时需要通过''.join()转换成String
                tag = re.search("karaoke.tag\('colors', '[0-9]+'\)", ''.join(content)).group()
                kscTxt.write("{\""+f+"\" : "+"\""+re.search("[0-9]+", tag).group()+"\"}"+'\n')
            except Exception as e:
                print("erro ..."+str(e))
                fileName = {"name": f}
                erroFile.append(fileName)
            finally:
                print("finally ...")
            kscFile.close()
kscTxt.close()
print(erroFile)     #读取有问题的文件

python实现读取大量文件并通过正则识别文件内容并生成新的文件_第1张图片

python实现读取大量文件并通过正则识别文件内容并生成新的文件_第2张图片

你可能感兴趣的:(python实现读取大量文件并通过正则识别文件内容并生成新的文件)