python实现过滤文件中不需要的数据

import re

#打开文档
file_open = open(r"d:\测试文件\对比文件1.txt","r",encoding='utf-8')
file_open2 = open(r"d:\测试文件\被过滤数据的文件.txt","r",encoding='utf-8')

s = file_open.read().splitlines()
ss = file_open2.read()
ss_list = ss.splitlines()
print(ss_list)
result = []
for i in s:
#用正则表达式去匹配
    regular = "([0-9A-Za-z,]*{0}[0-9A-Za-z,]*)".format(i)
    result1 = re.findall(regular,ss)
    result = result + result1
#方法1:用需过滤的文件数据list减去过滤数据的list
# result_2 = list(set(ss_list) - set(result))
#测试结果写入文件中
file = open(r"d:\测试文件\结果.txt",'w')
# for j in result_2:
#     file.write(j + '\n')
#方法2:if条件判断
for j in ss_list:
    if j not in result:
        file.write(j+'\n')


file_open.close()
file_open2.close()
file.close()



应用场景:
比如测试过程中需要过滤文件中对应某表的数据,将表中的字段数据提取出来放入文件中,再执行脚本,可直接过滤掉数据,只需修改正则表达式可过滤对应不同的数据

你可能感兴趣的:(python实现过滤文件中不需要的数据)