由于工作原因,经常上传一些不超过5000的数据,EXCEL当中数据量太大,如果不会写宏或者office不精通的话可能处理起来有些费尽,所以写了这段代码,用来分割EXCEL,好用实惠。
# -*- coding: utf-8 -*-
"""
Created on Mon Dec 11 17:06:22 2023
@author: 86188
"""
import pandas as pd
# 读取需要拆分的表格
df = pd.read_excel('C:/Users/86188/Desktop/数据中台对接管理系统数据梳理/非学期/2023年上半年借阅记录.xlsx')
# 将每1000行为一组进行分组
groups = df.groupby(df.index // 4995)
# 遍历每个小表格,将其另存为一个Excel文件或CSV文件
for group_name, group_df in groups:
filename = 'Data_' + str(group_name) + '.xlsx'
group_df.to_excel(filename, index=False)
# 清空内存中的pandas.DataFrame对象和pandas.DataFrameGroupBy对象
del df, groups
如果最后形成的文件找不到的话,可以借用everything工具搜索“data”相关文件,一般很快就能找到。