python3使用pandas库处理excel文件

Pandas介绍

Pandas 是基于 NumPy 的一个开源 Python 库,它被广泛用于快速分析数据,以及数据清洗和准备等工作。它的名字来源是由“ Panel data”(面板数据,一个计量经济学名词)两个单词拼成的。简单地说,你可以把 Pandas 看作是 Python 版的 Excel

Pandas使用中的一些技巧内容

读取

对于处理excel文件,我们首先需要将excel文件中的内容载入到内存中,读取常用的函数名为:read_excel
示例代码

import pandas as pd
#xls_file为文件路径,usecols为读取的数据列抬头
#注意以此种方式读取的数据会自动加一个索引列
#例如原数据为 A     B     C
#			 data1 data2 data3
#			 data4 data5 data6
#按照如下方式读取会得到: A     B     C
#					 1 data1 data2 data3
#			 		 2 data4 data5 data6
data_xls = pd.read_excel(xls_file,usecols=list_name)

#同时值得注意的是usecols参数内容填写的list_name虽然可以提取到属于list_name中的内容,但是会按照读取的列名顺序来读取
#例如列名为 A B C D E
#list_name = ["B","C","A"]
#则读取到的data_xls内容依旧为 A B C

保存

保存数据内容有很多种方式
①to_csv

DataFrame.to_csv(path_or_buf, sep=', ', na_rep='', float_format=None, cols=None, header=True, index=True, index_label=None, mode='w', nanRep=None, encoding=None, quoting=None, line_terminator='n', chunksize=None, tupleize_cols=False, date_format=None, **kwds)

②to_xml

DataFrame.to_xml(path_or_buffer=None, index=True, root_name='data', row_name='row', na_rep=None, attr_cols=None, elem_cols=None, namespaces=None, prefix=None, encoding='utf-8', xml_declaration=True, pretty_print=True, parser='lxml', stylesheet=None, compression='infer', storage_options=None)   

③to_excel

to_excel(excel_writer,sheet_name=‘sheet1’,na_rep=’ ’ ,float_format=None,columns=None,header=True,index=True,index_label=None,startrow=0,startcol=0,engine=None,merge_cells=True,encoding=None,inf_rep=‘inf’,verbose=True,freeze_panes=None)

你可能感兴趣的:(pandas,excel,python)