一、需要用到的库:
1.操作xls格式的表格文件:
读取:xlrd
写入:xlwt
修改(追加写入):xlutils
2.操作xlsx格式的表格文件:
读取/写入:openpyxl
二、实现代码
1.操作xls格式的表格文件:
#coding=UTF-8
importxlrdimportxlwtfrom xlutils.copy importcopydefwrite_excel_xls(path, sheet_name, value):
index= len(value) #获取需要写入数据的行数
workbook = xlwt.Workbook() #新建一个工作簿
sheet = workbook.add_sheet(sheet_name) #在工作簿中新建一个表格
for i inrange(0, index):for j inrange(0, len(value[i])):
sheet.write(i, j, value[i][j])#像表格中写入数据(对应的行和列)
workbook.save(path) #保存工作簿
print("xls格式表格写入数据成功!")defwrite_excel_xls_append(path, value):
index= len(value) #获取需要写入数据的行数
workbook = xlrd.open_workbook(path) #打开工作簿
sheets = workbook.sheet_names() #获取工作簿中的所有表格
worksheet = workbook.sheet_by_name(sheets[0]) #获取工作簿中所有表格中的的第一个表格
rows_old = worksheet.nrows #获取表格中已存在的数据的行数
new_workbook = copy(workbook) #将xlrd对象拷贝转化为xlwt对象
new_worksheet = new_workbook.get_sheet(0) #获取转化后工作簿中的第一个表格
for i inrange(0, index):for j inrange(0, len(value[i])):
new_worksheet.write(i+rows_old, j, value[i][j]) #追加写入数据,注意是从i+rows_old行开始写入
new_workbook.save(path) #保存工作簿
print("xls格式表格【追加】写入数据成功!")defread_excel_xls(path):
workbook= xlrd.open_workbook(path) #打开工作簿
sheets = workbook.sheet_names() #获取工作簿中的所有表格
worksheet = workbook.sheet_by_name(sheets[0]) #获取工作簿中所有表格中的的第一个表格
for i inrange(0, worksheet.nrows):for j inrange(0, worksheet.ncols):print(worksheet.cell_value(i, j), "\t", end="") #逐行逐列读取数据
print()
book_name_xls= 'xls格式测试工作簿.xls'sheet_name_xls= 'xls格式测试表'value_title= [["姓名", "性别", "年龄", "城市", "职业"],]
value1= [["张三", "男", "19", "杭州", "研发工程师"],
["李四", "男", "22", "北京", "医生"],
["王五", "女", "33", "珠海", "出租车司机"],]
value2= [["Tom", "男", "21", "西安", "测试工程师"],
["Jones", "女", "34", "上海", "产品经理"],
["Cat", "女", "56", "上海", "教师"],]
write_excel_xls(book_name_xls, sheet_name_xls, value_title)
write_excel_xls_append(book_name_xls, value1)
write_excel_xls_append(book_name_xls, value2)
read_excel_xls(book_name_xls)
2.操作xlsx格式的表格文件:
#coding=UTF-8
importopenpyxldefwrite_excel_xlsx(path, sheet_name, value):
index=len(value)
workbook=openpyxl.Workbook()
sheet=workbook.active
sheet.title=sheet_namefor i inrange(0, index):for j inrange(0, len(value[i])):
sheet.cell(row=i+1, column=j+1, value=str(value[i][j]))
workbook.save(path)print("xlsx格式表格写入数据成功!")defread_excel_xlsx(path, sheet_name):
workbook=openpyxl.load_workbook(path)#sheet = wb.get_sheet_by_name(sheet_name)这种方式已经弃用,不建议使用
sheet =workbook[sheet_name]for row insheet.rows:for cell inrow:print(cell.value, "\t", end="")print()
book_name_xlsx= 'xlsx格式测试工作簿.xlsx'sheet_name_xlsx= 'xlsx格式测试表'value3= [["姓名", "性别", "年龄", "城市", "职业"],
["111", "女", "66", "石家庄", "运维工程师"],
["222", "男", "55", "南京", "饭店老板"],
["333", "女", "27", "苏州", "保安"],]
write_excel_xlsx(book_name_xlsx, sheet_name_xlsx, value3)
read_excel_xlsx(book_name_xlsx, sheet_name_xlsx)
三、运行结果
image.png
image.png
image.png
但是我们会发现在读取xlsx格式的Excel时,传入formatting_info会直接抛出异常,而读取xls类型的文件时不存在此问题。
不难推断,抛异常的原因是formatting_info还没有对新版本的xlsx的格式完成兼容。
那么如果我们要操作的文件刚好是xlsx格式,又想保存其原有的格式该怎么办呢?
解决方法
1、修改为xlsx为xls(推荐)
将xlsx另存为xls,然后再进行后续操作,亲测有效,能正常保存Excel原有格式, 不用修改代码。
2、改用 openpyxl
coding尝试读取文件,处理速度真的很慢...而且规则和宏全部丢失。
3、使用pywin32
这是用于Win32 (pywin32)扩展的Python扩展库,它提供了对许多来自Python的Windows api的访问。
4、使用老旧的版本 xlrd-0.6.1
使用xlrd-0.6.1可以读取,没有异常抛出。直到我传入其他几个xls文件,出现Expected BOF record; found 0x4b50 错误,原因是xlrd-0.6.1不支持office2007
参考资料: