python pandas 如何读取Excel数据并重新按照指定格式写入Excel文件呢?
说一下个人常见的用法心得:
常用且实用的方法:
(注意:使用下列方法,记得导入如下库)
import pandas as pd
import ast
1.读取Excel文件
df = pd.read_excel('xxx.xlsx') # xxx 为excel文件转义之后的路径
2.将数据转化为list(这个用起来还是比较方便的)
train_data = pd.np.array(df) # 先将数据框转换为数组
data = train_data.tolist() # 其次转换为列表
3.读取每一行数据,并存入列表中(此时即可对数据源做自定义处理,没办法,Excel玩的不6~)
arr = []
for i in data:
item = {}
item['昵称'] = i[0]
item['星图id'] = i[1]
item['粉丝数'] = i[2]
c = []
if type(i[3]) is str:
a = ast.literal_eval(i[3]) # 将 字符串列表 转化成 列表
c.extend(a)
if type(i[4]) is str:
b = ast.literal_eval(i[4])
c.extend(b) # 这里对标签做了拼接
item['一级标签'] = c
item['所属MCN'] = i[5]
item['抖音id'] = i[7]
arr.append(item)
4.重新写入Excel文件
调用pandas_to_xlsx(arr)方法:
def pandas_to_xlsx(info):
pd_look = pd.DataFrame(info, columns=['抖音id', '星图id', '昵称', '粉丝数', '一级标签', '所属MCN']) # 加columns是为了每一列是有序且是按照一定规则排序,否则会每次输出顺序不同
pd_look.to_excel('清单.xlsx', sheet_name='WorkSheet')
一次简单的Excel读取、写入就完成了,如有帮助,记得点赞哦~