Python读写Excel表格,就是这么简单粗暴又好用

Python操作Excel,主要用到xlrd和xlwt这两个库,即xlrd是读Excel,xlwt是写Excel的库。

可从这里下载 https://pypi.python.org/pypi 。下面分别记录Python读和写Excel。

pip install xlrd --user
pip install xlwt --user

 

1. Python写Excel——xlwt

Python写Excel的难点,不在构造一个Workbook的本身,而是填充的数据,不过这不在范围内。

在写Excel的操作中,也有棘手的问题,比如写入合并的单元格,就是比较麻烦的,另外写入还有不同的样式。

详细代码如下:

import xlwt

# 设置表格样式


def set_style(name, height, bold=False):
    style = xlwt.XFStyle()
    font = xlwt.Font()
    font.name = name
    font.bold = bold
    font.color_index = 4
    font.height = height
    style.font = font
    return style

# 写Excel


def write_excel():
    f = xlwt.Workbook()
    sheet1 = f.add_sheet('学生', cell_overwrite_ok=True)
    row0 = ["姓名", "年龄", "出生日期", "爱好"]
    colum0 = ["张三", "李四", "恋习Python", "小明", "小红", "无名"]
    # 写第一行
    for i in range(0, len(row0)):
        sheet1.write(0, i, row0[i], set_style('Times New Roman', 220, True))
    # 写第一列
    for i in range(0, len(colum0)):
        sheet1.write(
            i + 1,
            0,
            colum0[i],
            set_style(
                'Times New Roman',
                220,
                True))

    sheet1.write(1, 3, '2006/12/12')
    sheet1.write_merge(6, 6, 1, 3, '未知')  # 合并行单元格
    sheet1.write_merge(1, 2, 3, 3, '打游戏')  # 合并列单元格
    sheet1.write_merge(4, 5, 3, 3, '打篮球')

    f.save('./xls/xlwt.xls')
    print('写入成功!')


if __name__ == '__main__':
    write_excel()

运行结果:

Python读写Excel表格,就是这么简单粗暴又好用_第1张图片

在此,对write_merge()的用法稍作解释,如上述:sheet1.write_merge(1,2,3,3,'打游戏'),即在4列合并第2,3行,合并后的单元格内容为"合计",并设置了style。其中,里面所有的参数都是以0开始计算的。如果需要创建多个sheet,则只要f.add_sheet即可。

注:

基本的write函数接口很简单:

1. 新建一个excel文件

file = xlwt.Workbook() (注意这里的Workbook首字母是大写)

2. 新建一个sheet

table = file.add_sheet('sheet_name')

3. 写入数据table.write(行,列,value)

table.write(0,0,'test')

如果是写入中文,则要用u'汉字'的形式。比如

table.write(0,0, u'汉字')

4. 合并单元格:

table.write_merge(x, x + m, y, y + n, string, style)

x表示行,y表示列,m表示跨行个数,n表示跨列个数,string表示要写入的单元格内容,

style表示单元格样式。其中,x,y,m,n,都是以0开始计算的。

 

2. Python读Excel——xlrd

Python读取Excel表格,相比xlwt来说,xlrd提供的接口比较多,但过程也有几个比较麻烦的问题,比如读取日期、读合并单元格内容。

下面先看看基本的操作:

Python读写Excel表格,就是这么简单粗暴又好用_第2张图片

整体思路为,打开文件,选定表格,读取行列内容,读取表格内数据。 

详细代码如下: 

import xlrd
from datetime import date, datetime


file = './xls/date.xls'


def read_excel():

    wb = xlrd.open_workbook(filename=file)  # 打开文件
    print(wb.sheet_names())  # 获取所有表格名字

    sheet1 = wb.sheet_by_index(0)  # 通过索引获取表格
    sheet2 = wb.sheet_by_name('date')  # 通过名字获取表格
    print(sheet1, sheet2)
    print(sheet1.name, sheet1.nrows, sheet1.ncols)

    rows = sheet1.row_values(2)  # 获取行内容
    cols = sheet1.col_values(3)  # 获取列内容
    print(rows)
    print(cols)

    print(sheet1.cell(1, 0).value)  # 获取表格里的内容,三种方式
    print(sheet1.cell_value(1, 0))
    print(sheet1.row(1)[0].value)

    if(sheet1.cell(1, 2).ctype == 3):
        date_value = xlrd.xldate_as_tuple(sheet1.cell_value(1, 2), wb.datemode)
        print((date_value))
        date_tmp = date(*date_value[:3]).strftime('%Y/%m/%d')
        print(date_tmp)


if __name__ == '__main__':
    read_excel()

运行结果:

Python读写Excel表格,就是这么简单粗暴又好用_第3张图片

那么问题来了,上面的运行结果中红框框中的字段明明是出生日期,可显示的确实浮点数;同时合并单元格里面应该是有内容的,结果不能为空。

别急,我们来一一解决这两个问题:

 

3. Python读取Excel中单元格内容为日期的方式

Python读取Excel中单元格的内容返回的有5种类型,即上面例子中的ctype:

ctype :  0 empty,1 string,2 number, 3 date,4 boolean,5 error

即date的ctype=3,这时需要使用xlrd的xldate_as_tuple来处理为date格式,先判断表格的ctype=3时xldate才能开始操作。

详细代码如下:

import xlrd
from datetime import date,datetime

print(sheet1.cell(1,2).ctype)
date_value = xlrd.xldate_as_tuple(sheet1.cell_value(1,2),wb.datemode)
print(date_value)
print(date(*date_value[:3]))
print(date(*date_value[:3]).strftime('%Y/%m/%d'))

运行结果如下:

640?wx_fmt=png

 

4. 获取合并单元格的内容

在操作之前,先介绍一下merged_cells()用法,merged_cells返回的这四个参数的含义是:(row,row_range,col,col_range),其中[row,row_range)包括row,不包括row_range,col也是一样,下标从0开始。即(1, 3, 4, 5)的含义是:第1到2行(不包括3)合并,(7, 8, 2, 5)的含义是:第2到4列合并。

详细代码如下:

print(sheet1.merged_cells)
print(sheet1.cell_value(1,3))
print(sheet1.cell_value(4,3))
print(sheet1.cell_value(6,1))

运行结果如下:

Python读写Excel表格,就是这么简单粗暴又好用_第4张图片

发现规律了没?是的,获取merge_cells返回的row和col低位的索引即可! 于是可以这样批量获取:

详细代码如下:

注:

可以利用merged_cells方法进行处理,处理的方法是只能获取合并单元格的第一个cell的行列索引,才能读到值,读错了就是空值。即合并行单元格读取行的第一个索引,合并列单元格读取列的第一个索引。这里,需要在读取文件的时候添加个参数,将formatting_info参数设置为True,默认是False,否则可能调用merged_cells方法获取到的是空值。

import xlrd

file = './xls/xlwt.xls'


def merged():

    wb = xlrd.open_workbook(filename=file, formatting_info=True)  # 打开文件
    sheet1 = wb.sheet_by_name('学生') # 通过名字获取表格

    merge = []
    print(sheet1.merged_cells)
    for (rlow, rhigh, clow, chigh) in sheet1.merged_cells:
        merge.append([rlow, clow])
    for index in merge:
        print(sheet1.cell_value(index[0], index[1]))


if __name__ == '__main__':
    merged()

运行结果跟上图一样,如下:

Python读写Excel表格,就是这么简单粗暴又好用_第5张图片

Python读写Excel表格,就是这么简单粗暴又好用,如果觉得不错,对你工作中有帮助,动动手指分享给更多人哦。

 

本文参考:

1. Python读写Excel表格,就是这么简单粗暴又好用

2. python操作excel表格(xlrd/xlwt)

3. python使用xlwt模块操作Excel

4. Python中xlrd和xlwt模块使用方法

你可能感兴趣的:(Python)