pandas 用df.to_excel()将dataframe保存至Excel时报出“MemoryError”错误的解决办法

一、原因

使用pandas中to_excel()函数将dataframe数据写入的时候,有时候会报出“MemoryError”错误。
如下代码:

import pandas as pd
import numpy as np


# 生成dataframe数据并写入Excel表中
df = pd.DataFrame(np.arange(12000000).reshape(300000,40))
# print(df)
df.to_excel('test.xlsx',index=False)

运行结果如下:
pandas 用df.to_excel()将dataframe保存至Excel时报出“MemoryError”错误的解决办法_第1张图片
因写入的数据量太大,导致报出“内存溢出”的错误。

二、解决方法

使用xlsxwriter模块将数据写入,代码更改为:

import pandas as pd
import numpy as np
import xlsxwriter


# 生成dataframe数据
df = pd.DataFrame(np.arange(12000000).reshape(300000,40))
# print(df)
writer = pd.ExcelWriter('test.xlsx', engine='xlsxwriter', options={'strings_to_urls':False})  # options参数可带可不带,根据实际情况
df.to_excel(writer, index=False)
writer.save()

更改后就不会报错了,xlsxwriter模块是一个python处理Excel写入的专有模块,不支持对Excel的读取,只支持写入,功能非常强大。

你可能感兴趣的:(pandas相关用法,python自动化办公,python,pandas,excel)