pandas 处理 excel 文件 之 read_excel 篇

pandas读取excel文件

 

p = pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False,dtype=None, engine=None,converters=None, true_values=None, false_values=None,skiprows=None, nrows=None, na_values=None, parse_dates=False,date_parser=None, thousands=None, comment=None, skipfooter=0,convert_float=True, **kwds)

pandas读取后返回DataFrame类

io:文件路径,python3以上格式如:C:\\Users\\sjyyz\\file\\pd2.xls

sheet_name : 读取工作表名称,默认为0,代表第一个工作表。sheet_name=[0,'人员信息‘,Sheet4],如果读取多个工作表,则显示表格的字典

header=(n):取哪一行作为表头或者列名,可以是多行

names=['id','name'....]:长度必须与列长一致,主要是用来修改列名或是没有列明的文件

index_col = ['id'../0,1.....]:用作索引的列

usecols = [A:C/0,1,3]:需要读取的列

squeeze=True/False: squeeze为True时,返回Series,反之返回DataFrame。

converters={'Name': str, 'Age': int} :强制规定列数据类型,pandas默认将文本类的数据读取为整型,用来保留以文本形式存储的数字。

skiprows=n/[a,b,c]:跳过特定行(前几行或者特定行a+1,b+1,c+1)

dtype={'id':str}#当python从excel读取数据是NAN时,自动会将它设置为float

import pandas as pd
books = pd.read_excel("C:\\Users\\sjyyz\\file\\books.xls",skiprows=3,usecols='c:f',dtype={'id':str})
print(books.index)
for i in books.index:
    books['id'].at[i] = i+1
#当python从excel读取数据是NAN时,自动会将它设置为float,注意NAN不能强制转换成int
print(books['id'])
结果
0    NaN
1    NaN
2    NaN
3    NaN
4    NaN
5    NaN
6    NaN
7    NaN
8    NaN
9    NaN
10   NaN
11   NaN
12   NaN
13   NaN
14   NaN
15   NaN
16   NaN
17   NaN
18   NaN
19   NaN
Name: date, dtype: float64

 

 

 

 

 

 

 

 

 

 

 

 

你可能感兴趣的:(python)