xlwings使用教程,让excel飞起来!----Python读写Excel工具

一、xlwings简介

image

xlwings优点

excel已经成为必不可少的数据处理软件,几乎天天在用。python有很多支持操作excel的第三方库,xlwings是其中一个。

关于xlwings
xlwings开源免费,能够非常方便的读写Excel文件中的数据,并且能够进行单元格格式的修改。

xlwings还可以和matplotlib、numpy以及pandas无缝连接,支持读写numpy、pandas数据类型,将matplotlib可视化图表导入到excel中。

最重要的是xlwings可以调用Excel文件中VBA写好的程序,也可以让VBA调用用Python写的程序。

开源免费,一直在更新

xlwings同类工具

python操作Excel的模块,网上提到的模块大致有:xlwings、xlrd、xlwt、openpyxl,pandas等。

xlwings功能总结

一、用python读写Excel文件,实际上就是读写有格式的文本文件,操作excel文件和操作text、csv文件没有区别,Excel文件只是用来储存数据。

二、除了操作数据,还可以调整Excel文件的表格宽度、字体颜色等。

另外需要提到的是用COM调用Excel的API操作Excel文档也是可行的,相当麻烦基本和VBA没有区别

xlwings中文文档

https://www.kancloud.cn/gnefnuy/xlwings-docs/1127474

xlwings结构图

image

二、xlwings基本操作

(一)引入库

import xlwings as xw

(二)打开 excel

# 打开Excel程序,默认设置:程序可见,只打开不新建工作薄,屏幕更新关闭
app=xw.App(visible=True,add_book=False)
app.display_alerts=False
app.screen_updating=False

# 其他操作:
# 屏幕更新。就是说代码对于excel的操作你可以看见。关闭实时更新,可以加快脚本运行。默认是True。
# app.screen_updating = False  

# App进程pid
# app.pid       

# 返回一个打开的全部workbook的列表。Python打开的和手动打开的是不互通的
# app.books     
                
# 终止进程,强制退出。
# app.quit() #不保存的情况下,退出excel程序

(三)工作簿

注意工作簿应该首先被打开

1、新建Excel文档

# 创建新的book
# 方式一
wb = app.books.add()
# 方式二
wk = xw.Book()

很多教程在提到新建App时都说这两种方式是一样的,实际上是有区别的,
方式1是在当前App下新建一个Book,
方式2是创建一个新的App,并在新App中新建一个Book

# 方式三,与方式一方法相似
wk = xw.books.add()

2、 打开Excel文档

# 支持绝对路径和相对路径
wb = app.books.open('filepath')
wk = xw.Book('filepath')
wk = xw.books.open('filepath')

# 练习的时候建议直接用下面这条
# wb = xw.Book('example.xlsx')
# 这样的话就不会频繁打开新的Excel

3、打开未储存或未关闭的excel实例

wk = xw.Book('Book1')    
wk = xw.books['Book1']  #也可以使用索引

如果在两个Excel实例中打开了相同的文件,则需要完全限定它并包含应用程序实例。

您将通过xw.apps.keys()找到您的应用实例密钥(PID):

xw.apps[10559].books['FileName.xlsx']
查看所有的实例进程:
xw.apps.keys() #输出list

kill所有的实例进程:
for i in xw.apps.keys():
  i = 'taskkill/pid ' + str(i) + ' -t -f'     
  os.system(i)

4、打开活动的工作簿

wb = xw.books.active

5、保存

# 保存工作簿,若未指定路径,保存在当前工作目录。
wb.save(path=None)

6、关闭

#在没有保存的情况下关闭。
wk.close()  

7、退出Excel

app.quit()

(四)工作表

1、打开工作表

# 可以用名字也可以用索引
sheet = xw.books['工作簿的名字'].sheets['sheet的名字']
sheet = xw.books['工作簿的名字'].sheets[0]

2、打开活动工作表

sheet = xw.sheets.active

3、返回sheet指定的book

book_name = sheet.book

4、返回一个range对象,表示sheet上所有的单元格

sheet_cells = sheet.cells

5、获取或设置Sheet的名称

sheet.name
# 返回所有的工作表特定名称。
sheet_names_list = sheet.names

6、获取sheet中的所有图表集合

sheet.charts

7、清空表中所有数据和格式。

sheet.clear()

8、清除工作表的内容,但保留格式

sheet.clear_contents()

9、删除工作表

sheet.delete()

10、返回表索引(与excel相同)

sheet.index

11、创建一个新的Sheet并使其成为活动工作表

wb.sheets.add(name=None, before=None, after=None) 
#参数:
name(str,default None) - 新工作表的名称。 如果为None,则默认为Excel的name.

before (Sheet, default None) - 一个对象,指定在新工作表添加之前的added.

after (Sheet, default None) - 指定工作表之后的新工作表的对象。

12、在整个工作表上自动调整列,行或两者的宽度

sheet.autofit(axis=None) 

# 参数:
axis (string, default None)
要自动调整行, 使用以下之一: rows 或 r,
要自动调整列, 使用以下之一: columns h c,
要自动调整行和列, 不提供参数

13、获取excel sheet多少行多少列

app = xw.App(visible=False, add_book=False)
xls = app.books.open(excel_file)
sheet = xls.sheets[0]
last_cell = sheet.used_range.last_cell
nrows = sheet.used_range.last_cell.row
ncols = sheet.used_range.last_cell.colum

(五)单元格

1、引用A1单元格

rng = xw.books['工作簿的名字'].sheets['sheet的名字'].range('A1')
# 或者
sheet=xw.books['工作簿的名字'].sheets['sheet的名字']
rng=sheet.range('A1')

2、引用活动工作表上的单元格

# 注意Range首字母大写
rng=xw.Range('A1')

其中需要注意的是单元格的完全引用路径是:
# 第一个Excel程序的第一个工作薄的第一张sheet的第一个单元格
xw.apps[0].books[0].sheets[0].range('A1')

迅速引用单元格的方式是
sht=xw.books['名字'].sheets['名字']

# A1单元格
rng=sht[’A1']
rng=sht['a1']

# A1:B5单元格
rng=sht['A1:B5']

# 第一行的第一列即a1
rng=sht[0,0] 

# B1单元格
rng=sht[0,1]

3、引用区域单元格

# A1:J10
rng=sht[:10,:10]

# A1:E10
rng=sht[:10,:5]

rng=sht.range('a1:a5')
#rng = sht['a1:a5']
#rng = sht[:5,0]

4、对于单元格也可以用表示行列的tuple进行引用

# A1单元格的引用
xw.Range(1,1)

#A1:C3单元格的引用
xw.Range((1,1),(3,3))

(六)写入数据

1、写入单个值

# 注意".value“
sht.range('A1').value=1

2、写入列表

默认按行插入

# 将列表[1,2,3]储存在A1:C1中
sht.range('A1').value=[1,2,3]

# 等同于
sht.range('A1:C1').value = [1,2,3]

按列插入

# 将列表[1,2,3]储存在A1:A3中
sht.range('A1').options(transpose=True).value=[1,2,3]

其他方法

列表
一维列表:
表示Excel中行或列的范围作为简单列表返回,
这意味着一旦它们在Python中,您就丢失了有关方向的信息。
如果这是一个问题,下一点将向您展示如何保留此信息:


######################## 列方向(嵌套列表)################
列表中,每个元素都已列表方式保存,存储时,是按照列方向保存的
sht = xw.Book().sheets[0]
sht.range('A1').value = [[1],[2],[3],[4],[5]]  # 列方向(嵌套列表)

返回值为
sht.range('A1:A5').value
[1.0, 2.0, 3.0, 4.0, 5.0]


################## 行方向,普通列表 #######################
sht.range('A1').value = [1, 2, 3, 4, 5]
sht.range('A1:E1').value

返回值为
[1.0, 2.0, 3.0, 4.0, 5.0]    


要强制单个单元格作为列表到达,请使用:

sht.range('A1').options(ndim=1).value

返回值为
[1.0]

多行输入就要用二维列表

重点:

# 将2x2表格,即二维数组,储存在A1:B2中,如第一行1,2,第二行3,4

sht.range('A1').options(expand='table').value=[[1,2],[3,4]]

(七)读取数据

1、读取单个值

# 将A1的值,读取到a变量中
a=sht.range('A1').value

2、读取范围的值

  • 返回的值是列表形式,多行多列为二维列表。
  • 但有一点要注意,返回的数值默认是浮点数
#将第一行的值,即将A1到A2的值,读取到a列表中
a=sht.range('A1:A2').value

# 将第一行和第二行的数据按二维数组的方式读取
a=sht.range('A1:B2').value

3、读取Excel表格的行、列

  • 读取excel的第一列,先计算单元格的行数
  • 通过这种方法统计的工作区域的行或者列,不能被空值分隔
  • 空值分隔后面的区域,不在统计范围内。
  • 更好的方式是通过last_cell方式获取最下边且最右边的一个单元格。
  • last_cell = sheet.used_range.last_cell
  • last_row = last_cell.row
  • last_col = last_cell.column
读取excel的第一列,先计算单元格的行数
- 读取excel的第一列,先计算单元格的行数
- 通过这种方法统计的工作区域的行或者列,不能被空值分隔
- 空值分隔后面的区域,不在统计范围内。
- 更好的方式是通过last_cell方式获取最下边且最右边的一个单元格。

# 获取工作表的活动区域
rng = sht.range('a1').expand('table')

# 获取活动区域的行数
nrows = rng.rows.count

# 接着就可以按准确范围读取了
a = sht.range(f'a1:a{nrows}').value

同理选取一行的数据也一样
ncols = rng.columns.count

#用切片
fst_col = sht[0,:ncols].value
获取行数、列数,更好且更准确的方法
# 更好的方式是通过last_cell方式获取最下边且最右边的一个单元格。

last_cell = sheet.used_range.last_cell
last_row = last_cell.row
last_col = last_cell.column

(八)常用函数和方法

1、Book 工作簿常用的api

# 新建工作簿
xw.books.add()

# 引用当前活动工作簿
xw.books.active
wb=xw.books[‘工作簿名称']
wb.activate()激活为当前工作簿
wb.fullname 返回工作簿的绝对路径
wb.name 返回工作簿的名称
wb.save(path=None) 保存工作簿,默认路径为工作簿原路径,若未保存则为脚本所在的路径
wb.close() 关闭工作簿


代码例子:
# 引用Excel程序中,当前的工作簿
wb=xw.books.acitve

# 返回工作簿的绝对路径
x=wb.fullname

# 返回工作簿的名称
x=wb.name

# 保存工作簿,默认路径为工作簿原路径,若未保存则为脚本所在的路径
x=wb.save(path=None)

# 关闭工作簿
x=wb.close()

2、sheet 常用的api

# 新建工作表
xw.sheets.add(name=None,before=None,after=None)

# 引用当前活动sheet
xw.sheets.active

# 引用某指定sheet
sht=xw.books['工作簿名称'].sheets['sheet的名称']

# 激活sheet为活动工作表
sht.activate()

# 清除sheet的内容和格式
sht.clear()

# 清除sheet的内容
sht.contents()

# 获取sheet的名称
sht.name

# 删除sheet
sht.delete

3、range常用的api

# 引用当前活动工作表的单元格
rng=xw.Range('A1')

# 加入超链接
# rng.add_hyperlink(r'www.baidu.com','百度',‘提示:点击即链接到百度')

# 获得range的超链接
rng.hyperlink

# 取得当前range的地址
rng.address
rng.get_address()

# 获得单元格的绝对地址
rng.get_address(row_absolute=True, column_absolute=True,include_sheetname=False, external=False)





# 清除range的内容
rng.clear_contents()

# 清除格式和内容
rng.clear()




# 取得range的背景色,以元组形式返回RGB值
rng.color

# 设置range的颜色
rng.color=(255,255,255)

# 清除range的背景色
rng.color=None




# 返回range中单元格的数量
rng.count

# 返回current_region当前区域
rng.current_region

# 返回ctrl + 方向
rng.end('down')





# 获取公式或者输入公式
rng.formula='=SUM(B1:B5)'

# 数组公式
rng.formula_array



# range平移
rng.offset(row_offset=0,column_offset=0)

#range进行resize改变range的大小
rng.resize(row_size=None,column_size=None)



# 获得range的第一列列标
rng.column

# 获得列宽
rng.column_width

# 返回range的总宽度
rng.width



# range的第一行行标
rng.row

# 行的高度,所有行一样高返回行高,不一样返回None
rng.row_height

# 返回range的总高度
rng.height



###################################################

# 获得range中右下角最后一个单元格
rng.last_cell






# 返回range的行数和列数
rng.shape

# 返回range所在的sheet
rng.sheet



#返回range的所有行
rng.rows

# range的第一行
rng.rows[0]

# range的总行数
rng.rows.count



# 返回range的所有列
rng.columns

# 返回range的第一列
rng.columns[0]

# 返回range的列数
rng.columns.count






# 所有range的大小自适应
rng.autofit()

# 所有列宽度自适应
rng.columns.autofit()

# 所有行宽度自适应
rng.rows.autofit()

三、Python工具类,通过代码操作Excel表格

以下是我的工具类代码,转载请注明出处。

#!/usr/bin/python
# -*- coding: UTF-8 -*-

import os
import xlwings


class ToolExcel(object):
    __file_name = "workbook.xlsx"
    __sheet_name = "Sheet1"

    # 新建工作簿
    @staticmethod
    def workbook_new(file_name: str = __file_name):

        # 工作簿文件路径
        workbook_file_path = os.path.join(os.getcwd(), "workbook", file_name)
        # 工作簿当前目录
        workbook_dir_path = os.path.dirname(workbook_file_path)

        # 如果不存在目录路径,就创建
        if not os.path.exists(workbook_dir_path):
            # 创建工作簿路径,makedirs可以创建级联路径
            os.makedirs(workbook_dir_path)

        # 如果不存在,Excel工作簿文件,就创建工作簿
        if not os.path.exists(workbook_file_path):
            # 打开Excel程序,APP程序(即Excel程序)不可见,只打开不新建工作薄,屏幕更新关闭
            app = xlwings.App(visible=False, add_book=False)
            # Excel工作簿显示警告,不显示
            app.display_alerts = False
            # 工作簿屏幕更新,不更新
            app.screen_updating = False
            # 创建工作簿
            wb = app.books.add()
            # 保存工作簿,若未指定路径,保存在当前工作目录。
            wb.save(workbook_file_path)
            # 关闭工作簿
            wb.close()
            # 退出Excel
            app.quit()

    # 读取工作簿全部内容,返回二维列表
    @staticmethod
    def workbook_read(file_name=__file_name, sheet_name=__sheet_name):
        # 工作簿文件路径
        workbook_file_path = os.path.join(os.getcwd(), "workbook", file_name)
        # 如果文件存在,就执行
        if os.path.exists(workbook_file_path):
            # 打开Excel程序,APP程序(即Excel程序)不可见,只打开不新建工作薄,屏幕更新关闭
            app = xlwings.App(visible=False, add_book=False)
            # Excel工作簿显示警告,不显示
            app.display_alerts = False
            # 工作簿屏幕更新,不更新
            app.screen_updating = False
            # 打开工作簿
            wb = app.books.open(workbook_file_path)
            # 获取活动的工作表
            sheet = wb.sheets[sheet_name]

            # 获取已编辑的矩形区域,最底部且最右侧的单元格
            last_cell = sheet.used_range.last_cell
            # 最大行数
            last_row = last_cell.row
            # 最大列数
            last_col = last_cell.column

            """
            # 读取二维列表
            # 注释:如果含有 .options(expand='table').value 参数,空值隔断的部分,不会被读取
            # data = sheet.range((1, 1), (last_row, last_col)).options(expand='table').value
            """

            # 读取二维列表
            data = sheet.range((1, 1), (last_row, last_col)).value

            # 关闭工作簿
            wb.close()
            # 退出Excel
            app.quit()
            return data

    # 写入二维列表,追加模式
    @staticmethod
    def workbook_append(data: list = None, file_name=__file_name, sheet_name=__sheet_name):
        # 工作簿文件路径
        workbook_file_path = os.path.join(os.getcwd(), "workbook", file_name)

        # 如果工作簿不存在,就创建工作簿
        if not os.path.exists(workbook_file_path):
            ToolExcel.workbook_new()

        # 如果文件存在,就执行
        if os.path.exists(workbook_file_path):
            # 打开Excel程序,APP程序(即Excel程序)不可见,只打开不新建工作薄,屏幕更新关闭
            app = xlwings.App(visible=False, add_book=False)
            # Excel工作簿显示警告,不显示
            app.display_alerts = False
            # 工作簿屏幕更新,不更新
            app.screen_updating = False
            # 打开工作簿
            wb = app.books.open(workbook_file_path)
            # 获取活动的工作表
            sheet = wb.sheets[sheet_name]

            # 获取已编辑的矩形区域,最底部且最右侧的单元格
            last_cell = sheet.used_range.last_cell
            # 最大行数
            last_row = last_cell.row

            # 写入二维列表,追加模式
            sheet.range((last_row + 1, 1)).options(expand='table').value = data

            # # 保存文件,保存以后重新读取单元格,重新获取所有活动区域的cell.
            # # 是否保存, 有待考证?
            # wb.save()

            # 获取已编辑的矩形区域,最底部且最右侧的单元格
            last_cell = sheet.used_range.last_cell
            # 最大行数
            last_row = last_cell.row
            # 最大列数
            last_col = last_cell.column
            # 在range中,cell的大小自适应
            sheet.range((1, 1), (last_row, last_col)).columns.autofit()

            # 保存文件
            wb.save()
            # 关闭工作簿
            wb.close()
            # 退出Excel
            app.quit()

    # 写入二维列表,重写模式
    @staticmethod
    def workbook_rewrite(data: list = None, file_name=__file_name, sheet_name=__sheet_name):
        # 工作簿文件路径
        workbook_file_path = os.path.join(os.getcwd(), "workbook", file_name)

        # 如果工作簿不存在,就创建工作簿
        if not os.path.exists(workbook_file_path):
            ToolExcel.workbook_new()

        # 如果文件存在,就执行
        if os.path.exists(workbook_file_path):
            # 打开Excel程序,APP程序(即Excel程序)不可见,只打开不新建工作薄,屏幕更新关闭
            app = xlwings.App(visible=False, add_book=False)
            # Excel工作簿显示警告,不显示
            app.display_alerts = False
            # 工作簿屏幕更新,不更新
            app.screen_updating = False
            # 打开工作簿
            wb = app.books.open(workbook_file_path)
            # 获取活动的工作表
            sheet = wb.sheets[sheet_name]

            # 清除sheet的内容和格式
            sheet.clear()

            # 写入二维列表,重写模式
            sheet.range("A1").options(expand='table').value = data

            # 获取已编辑的矩形区域,最底部且最右侧的单元格
            last_cell = sheet.used_range.last_cell
            # 最大行数
            last_row = last_cell.row
            # 最大列数
            last_col = last_cell.column
            # 所有range的大小自适应
            sheet.range((1, 1), (last_row, last_col)).columns.autofit()

            # 保存文件
            wb.save()
            # 关闭工作簿
            wb.close()
            # 退出Excel
            app.quit()


四、参考文献:

xlwings使用教程
https://blog.csdn.net/qq_37289115/article/details/106666073

xlwings 中文文档
https://www.kancloud.cn/gnefnuy/xlwings-docs/1127450

办公自动化系列(3)| 全网最详细的xlwings库解析-上篇 https://www.jianshu.com/p/5b1cbb0637bb

彻底搞懂Python切片操作
https://www.jianshu.com/p/15715d6f4dad

你可能感兴趣的:(xlwings使用教程,让excel飞起来!----Python读写Excel工具)