毫米波雷达人体姿态估计数据集整理 1 -- Python读取含合并单元格的excel

问题描述

整理一个毫米波雷达人体姿态估计的数据集时,需要使用Python处理一个Excel中每个sheet的数据,但是遇到了下面的问题:

  1. Excel中的合并单元格无法正常读取

  2. 如何遍历读取每一个sheet

解决方案

问题1:读取合并的单元格

若直接读取,试过网上的很多方法,都存在问题。
最终选择先使用openpyxl拆分所有合并的单元格,之后再进行读取。代码如下:

import openpyxl
import pandas as pd

def split_excel(file_path,excel_split_path):
    workbook = openpyxl.load_workbook(file_path)  # 加载已经存在的excel

    name_list = workbook.sheetnames

    for index in range(len(name_list)):
        worksheet = workbook[name_list[index]]

        m_list = worksheet.merged_cells  # 合并单元格的位置信息,可迭代对象(单个是一个'openpyxl.worksheet.cell_range.CellRange'对象),print后就是excel坐标信息
        cr = []
        for m_area in m_list:
            # 合并单元格的起始行坐标、终止行坐标。。。。,
            r1, r2, c1, c2 = m_area.min_row, m_area.max_row, m_area.min_col, m_area.max_col
            # 纵向合并单元格的位置信息提取出
            if r2 - r1 > 0:
                cr.append((r1, r2, c1, c2))
                print('符合条件%s' % str(m_area))
        #print(cr)
        # 这里注意需要把合并单元格的信息提取出再拆分
        for r in cr:
            worksheet.unmerge_cells(start_row=r[0], end_row=r[1],
                                    start_column=r[2], end_column=r[3])
            for row in range(r[0], r[1]):
                worksheet.cell(row=row+1, column=r[3], value=worksheet.cell(r[0], r[3]).value)

    workbook.save(excel_split_path)

问题2:遍历读取每一个sheet

此问题较为简单,一个解决方案是:

list_dic = []
ex_data = pd.read_excel(file_path,sheet_name=None)
for sheet_name, sheet_data in ex_data.items():

你可能感兴趣的:(#,#,Python,#,Code,python,开发语言,毫米波雷达,人体姿态估计)