如何在Python对Excel进行读取

在python自动化中,经常会遇到对数据文件的操作,比如添加多名员工,但是直接将员工数据写在python文件中,不但工作量大,要是以后再次遇到类似批量数据操作还会写在python文件中吗?

  应对这一问题,可以将数据写excel文件,针对excel 文件进行操作,完美解决。

  本文仅介绍python对excel的操作

安装xlrd 库

  xlrd库 官方地址:https://pypi.org/project/xlrd/

  pip install xlrd

      笔者在安装时使用了 pip3 install xlrd

  原因:笔者同时安装了python2 和 python3

  如果pip的话会默认将库安装到python2中,python3中不能直接调用。

  那么到底是使用pip 还是pip3进行安装呢?

    如果系统中只安装了Python2,那么就只能使用pip。

    如果系统中只安装了Python3,那么既可以使用pip也可以使用pip3,二者是等价的。

    如果系统中同时安装了Python2和Python3,则pip默认给Python2用,pip3指定给Python3用。

Xlrd 库简单的使用

  以如下excel文件为例进行操作

  文件名为demo,有两个sheet,名为工作表1和工作表2

  工作表1中有如下数据

简单的使用

# coding=utf-8

import xlrd

# 打开文件

data = xlrd.open_workbook('file/demo.xlsx')

# 查看工作表

data.sheet_names()

print("sheets:" + str(data.sheet_names()))

# 通过文件名获得工作表,获取工作表1

table = data.sheet_by_name('工作表1')

# 打印data.sheet_names()可发现,返回的值为一个列表,通过对列表索引操作获得工作表1

# table = data.sheet_by_index(0)

# 获取行数和列数

# 行数:table.nrows

# 列数:table.ncols

print("总行数:" + str(table.nrows))

print("总列数:" + str(table.ncols))

# 获取整行的值 和整列的值,返回的结果为数组

# 整行值:table.row_values(start,end)

# 整列值:table.col_values(start,end)

# 参数 start 为从第几个开始打印,

# end为打印到那个位置结束,默认为none

print("整行值:" + str(table.row_values(0)))

print("整列值:" + str(table.col_values(1)))

# 获取某个单元格的值,例如获取B3单元格值

cel_B3 = table.cell(3,2).value

print("第三行第二列的值:" + cel_B3)

运行后结果

项目中使用

  获得所有的数据

# coding=utf-8

import xlrd

def read_xlrd(excelFile):

data = xlrd.open_workbook(excelFile)

table = data.sheet_by_index(0)

for rowNum in range(table.nrows):

rowVale = table.row_values(rowNum)

for colNum in range(table.ncols):

if rowNum > 0 and colNum == 0:

print(int(rowVale[0]))

else:

print(rowVale[colNum])

print("---------------")

# if判断是将 id 进行格式化

# print("未格式化Id的数据:")

# print(table.cell(1, 0))

# 结果:number:1001.0

if __name__ == '__main__':

excelFile = 'file/demo.xlsx'

read_xlrd(excelFile=excelFile)

结果

如果在项目中使用则可将内容方法稍为做修改,获得所有的数据后,将每一行数据作为数组进行返回

# coding=utf-8

import xlrd

def read_xlrd(excelFile):

data = xlrd.open_workbook(excelFile)

table = data.sheet_by_index(0)

dataFile = []

for rowNum in range(table.nrows):

# if 去掉表头

if rowNum > 0:

dataFile.append(table.row_values(rowNum))

return dataFile

if __name__ == '__main__':

excelFile = 'file/demo.xlsx'

print(read_xlrd(excelFile=excelFile))

结果

你可能感兴趣的:(如何在Python对Excel进行读取)