在爬虫的时候有过把数据直接存到txt文本里面,所以也就有了这样的需求,所以自己写了这样的一个简单的小工具
本人比较喜欢用openpyxl这个第三方库去对Excel进行读写,这边还用的了tqdm这个库来看程序读到了txt文本的哪一行,给程序加一点点可视化。
pip install openpyxl
pip install tqdm
import openpyxl
from tqdm import tqdm
# 读取TXT,切分数据,保存到Excel
def txt_split_bexcel(tpath=r'D:\工作文件\111.txt', epath=r'D:\工作文件\补爬.xlsx'): # tpath=txt文件路径,epath=excel文件路径
data = open(tpath, encoding='utf8') # 读取txt文件,设置编码
workbook = openpyxl.Workbook() # 创建一个新的xlsx文件
sheet0 = workbook.active # 调用得到正在运行的工作表。注意:调用工作表的索引默认是0,即默认对第一张工作表进行操作。
for i in tqdm(data):
data1 = i.split(',') # 按照什么样的分隔符切分,split()默认按照\n,空格,\t切割
sheet0.append(data1)
workbook.save(epath) # 保存到指定目录
print('完成!')
txt_split_bexcel()
1.演示数据
2.结果
用的是英文的逗号作为切分的依据,所以最后一行的(7,sef,三个人)这个几个数据没有切分开来,用此代码会把之前Excel里面保存的数据全部清空,请确保要保存到的Excel表格里面没有数据或在文件目录下不存在。