openyxl读取Excel

有一万年没来这儿写blog了,今天等着发版,抽空来写点东西吧。

python有很多模块都是用来操作excel的,比如xlrd,xlwt,pyExcelerator。用着很方便,但是问题是,只能支持到excel2003。虽然一般的应用其实足够了,但是如果遇到了导出大量数据(超过65535条)的需求时,excel2003就不够用了。所以我就只好去找一个能支持excel2007的模块。

 

google了一下,发现了这个openpyxl,不过网上也没什么中文的文档可以看,于是就自己琢磨琢磨。

 

 

I.安装

 

openpyxl的最新版本是1.5.0 下载地址 http://pypi.python.org/pypi/openpyxl/1.5.0

 

需求python的版本是2.6+  ,也就是说,如果centOS系统的机器想用,那得升级系统的python。。。

 

安装就是解压缩,然后cd到目录,然后

 

python setup.py install

 

你懂的~

 

 

 II.读取excel2007文件

 

 

[python] view plaincopy

  1. #-*- coding:utf-8 -*  

  2.   

  3. from openpyxl.reader.excel import load_workbook  

  4. import MySQLdb  

  5. import time  

  6.   

  7. #开始时间  

  8. startTime = time.time()  

  9.   

  10. #读取excel2007文件  

  11. wb = load_workbook(filename = r'empty_book.xlsx')  

  12.   

  13. #显示有多少张表  

  14. print "Worksheet range(s):", wb.get_named_ranges()  

  15. print "Worksheet name(s):", wb.get_sheet_names()  

  16.   

  17. #取第一张表  

  18. sheetnames = wb.get_sheet_names()  

  19. ws = wb.get_sheet_by_name(sheetnames[0])  

  20.   

  21. #显示表名,表行数,表列数  

  22. print "Work Sheet Titile:",ws.title  

  23. print "Work Sheet Rows:",ws.get_highest_row()  

  24. print "Work Sheet Cols:",ws.get_highest_column()  

  25.   

  26.   

  27. # 建立存储数据的字典   

  28. data_dic = {}   

  29.   

  30. #把数据存到字典中  

  31. for rx in range(ws.get_highest_row()):  

  32.       

  33.     temp_list = []  

  34.     pid = ws.cell(row = rx,column = 0).value  

  35.     w1 = ws.cell(row = rx,column = 1).value  

  36.     w2 = ws.cell(row = rx,column = 2).value  

  37.     w3 = ws.cell(row = rx,column = 3).value  

  38.     w4 = ws.cell(row = rx,column = 4).value  

  39.     temp_list = [w1,w2,w3,w4]  

  40.      

  41.     data_dic[pid] = temp_list  

  42.   

  43. #打印字典数据个数  

  44. print 'Total:%d' %len(data_dic)  

   

 

 

 

 注意的是ws.cell()方法,支持的参数有两种,cell(coordinate=Nonerow=Nonecolumn=None)

coordinate坐标,eg  ws.cell("B1")

row 和 column 是行和列 ,都是从0开始

 

还有,如果想取得格里的值,得用ws.cell("A1").value 取到,如果用过xlrd,因为写法差不多,可能就会忘记加value了。

 

III.写入excel2007

 

 

[python] view plaincopy

  1. 写excel2007  

  2.   

  3. #-*- coding:utf-8 -*  

  4.   

  5.   

  6. import MySQLdb  

  7. import time  

  8. import sys  

  9. #workbook相关  

  10. from openpyxl.workbook import Workbook  

  11. #万恶的ExcelWriter,妹的封装好了不早说,封装了很强大的excel写的功能  

  12. from openpyxl.writer.excel import ExcelWriter  

  13. #一个eggache的数字转为列字母的方法  

  14. from openpyxl.cell import get_column_letter  

  15.   

  16.   

  17. #新建一个workbook  

  18.   

  19. wb = Workbook()  

  20. #新建一个excelWriter  

  21. ew = ExcelWriter(workbook = wb)  

  22.   

  23. #设置文件输出路径与名称  

  24. dest_filename = r'empty_book.xlsx'  

  25.   

  26. #第一个sheet是ws  

  27. ws = wb.worksheets[0]  

  28.   

  29. #设置ws的名称  

  30. ws.title = "range names"   

  31.   

  32.   

  33. #录入数据,注意col是数字转字母,然后需要限定%s(string型)当参数传到ws.cell()方法中去,records可以想象为一个从数据库里查询出来的数据集合  

  34. i=1  

  35. table = {}  

  36. for record in records:  

  37.     for x in range(1,len(record)+1):  

  38.         col = get_column_letter(x)  

  39.         ws.cell('%s%s'%(col, i)).value = '%s' % (record[x-1])        

  40.               

  41.     i+=1  

  42.   

  43. #又建了一个sheet,ws名字都没变,太省了。。。但是确实是一个新的sheet,不会影响之前那个sheet的东西  

  44. ws = wb.create_sheet()  

  45.   

  46. ws.title = 'Pi'  

  47.   

  48. ws.cell('F5').value = 3.14  

  49.   

  50.       

  51. #写文件  

  52. ew.save(filename = dest_filename)  

 

 

 注意的地方:

 

# col是用列号x为参数,调用了这个模块的get_column_letter方法算出来的字母,这个比较蛋疼。

   col = get_column_letter(x)

 

#在为数据格赋值的时候,注意写的格式:要不会有各种不靠谱的问题出现(这个是用坐标的方式写的,其实用row ,col的方式可能没那么麻烦)

  ws.cell('%s%s'%(col, i)).value = '%s' % (record[x-1])

 

关于该模块的API  可以查询官方文档  http://packages.python.org/openpyxl/api.html

 

总体来说,这个模块还是挺方便的,但是问题就是在对于python的版本有一定要求,如果在centOs上用,可能会有些问题。

 

本文只是简单的写了下使用的方法,之后格式超链接神马的之后再填上~

 

 

关于pyExcelerator的使用教学,给朋友做个广告  http://blog.csdn.net/suofiya2008/archive/2010/05/14/5589627.aspx

 


你可能感兴趣的:(openyxl读取Excel)