使用python处理excel表格

前言

python用于处理数据是非常合适的,所以难免会经常要对excel文档进行读取的操作,网上这方面的资料相对来说不多而且比较残缺;本人在做自己的工程项目的时候,搜索了很多资料,总结一下比较全面、有效的关于python处理excel的知识(但还是不够完美);

下载模块

  1. xlrd 下载
  2. xlutils 下载

安装模块

下载完成后, 按如下方式安装:
Python中安装xlrd模块的步骤:

  1. 从 https://pypi.python.org/pypi/xlrd 下载压缩包
  2. 解压所下载的压缩包
  3. CD到解压目录,执行 sudo python setup.py install

导入模块

import xlrd
from xlutils.copy import copy

使用模块

首先要明白两个概念:

  • table/ workbook: 指的是一个excel文件
  • sheet: 指的是excel里面的一张表


    使用python处理excel表格_第1张图片
    table_example.xlsm

下面开始看看如何使用加载的这些模块来完成对一个表的操作

读表

  • xlrd.open_workbook()函数
    input: 要读取的excel文件名,字符串类型
    output: excel文件的句柄,相当于一个用来标志这个文件的一个对象;
    例如:
    table0 = xlrd.open_workbook('table_example.xlsm')

table->

  • sheet_by_name(sheet_name)
    这是属于excel文件句柄的一个函数
    input:sheet的名字
    output:sheet类型的句柄,相当于一个用来标识这个sheet的一个对象
    例如:
    sheet_loss_table0 = table0.sheet_by_name('all_k1m60px')
    这就获得了一个在名为'table_example.xlsm'的excel文件中的一个叫all_k1m60px的sheet的对象;

sheet->

  • nrows, ncols
    属于sheet对像中的两个变量,代表这个sheet中有数据的行数(nrows) 和列数(ncols)
    例如:
    row = sheet_loss_table0.nrows
    column = sheet_loss_table0.ncols
  • col_values(),row_values()函数
    输入:要读取的列的标号,从0开始的整数,例如i
    输出:第i列数据的list
    例如:
    datase_list = sheet_loss_table0.col_values(0) #读取第0列的数据并以list形式存在dataset_list变量中

你可能感兴趣的:(使用python处理excel表格)