Python 和 Pandas 读写那点事

今天用knockpy去挖owasp.org的子域名,结果挖取的结果是这个样子: 

Python 和 Pandas 读写那点事_第1张图片

信息是很全面,问题是,我是想要中间那个Domain Name的信息。后来用Pandas整理了一个output。(为了记录一下)

 

首先对于python 的读取,大概代码:

text1 = open(file_path,"r")
lines1 = text1.readlines()

for i in lines1:
	i = i.strip('\n')
	content_first.append(i)
text1.close()

其中 file_path 是要读取文件的路径, 因为有的txt格式文件读取以后,每行后面都有 \n, 所以写了下面的for循环把 这个回车去掉。

python的输出,大概代码:

final_result = 'final_result.txt'
final_text = open(final_result, "w")
for i in result:
	final_text.write(i + "\n")

final_text.close()

但是对于上述的子域名,显然用这些方法有些不合适,因为很难分割出来我想要的东西。所以我考虑用Pandas。

首先安装Pandas:

pip3 install pandas

然后Pandas读取:

import pandas as pd

text = pd.read_csv(path, header=None,sep='\s+')
result = text.iloc[:,3]

读取,在text那块就可以了。下面的result是为了我要取Domain Name那列。 最终的result也是个list。

最后是我把结果输出到一个新的文件里:

result.to_csv('predict_result1.txt',header=False,index=False)

Done !!!

你可能感兴趣的:(Python 和 Pandas 读写那点事)