pandas.DataFrame.to_excel:在同一个sheet内追加数据

参考了这篇文章的方法 pandas to_excel:写入数据,在同一个sheet中追加数据,写入到多个sheet里,基本逻辑是:

通过数据框获取到该Excel表的行数 df_rows,然后将需要存储的数据,限制开始写入的行数,即:startrow=df_rows+1 (原表中第一个空行),然后写入到同一个sheet中。这个方法不会覆盖原来的数据,实现在同一个sheet中追加数据。

以及这两个帖子:Export dataframe to xlsx - Error “zipfile.BadZipFile: File is not a zip file”

BUG: ExcelWriter.book - attribute not accessible for setting #48780

代码

with pd.ExcelWriter(path, engine='openpyxl', mode='a',if_sheet_exists='overlay') as writer:
	df1 = pd.DataFrame(pd.read_excel(path, sheet_name='sheet1')) 
	df_rows = df1.shape[0] #获取原数据的行数
	#将数据df写入excel中的sheet1表,从第一个空行开始写:
	df.to_excel(writer, sheet_name='sheet1',startrow=df_rows+1, index=False, header=False)

几个重点:

  • ExcelWriter的mode{‘w’, ‘a’}设为a Append 模式
  • ExcelWriter的if_sheet_exists{‘error’, ‘new’, ‘replace’, ‘overlay’}设定为overlay模式覆盖: 将内容写入现有sheet,无需先删除,但可能会覆盖现有内容。
  • 为了避免覆盖现有内容,要告诉to_excel方法从新的一行开始写,也就是说把to_excel的参数startrow设为“原行数+1”

你可能感兴趣的:(pandas,excel)