python的pandas库的pd.read_excel()常用解析

python的pandas库的pd.read_excel()常用解析_第1张图片
在我们日常当中,CSV格式的文件占大多数,但是我们也经常读入EXCEl表格文件,接下来我们聊聊常用的pd.read_excel()函数的常用参数

  • 首先,认识一下pd.read_excel(),函数的官方文档是这么说的:将Excel文件读取到pandas DataFrame中,系统默认支持‘xls’和‘xlsx’后缀的文件名,函数都可以处理,看一下这个函数的所有参数:
    在这里插入图片描述
    参数实在是太多了把,我们看看常用的把:

io参数

(1)这个参数可以接受的有:字符串str,excel文件,或者路径对象,一般是路径+文件的名字,这是最重要的参数,必须传入:
pd.read_excel(r’F:\data\aa.xlsx’)

sheet_name

这个参数是指定excel表格的第几个sheet表,不指定默认是第一个sheet,对应的值是0,如果需要打开第二个sheet,可以将sheet_name=1,如果你的sheet自定义了名字,则把数字换成你名字即可
python的pandas库的pd.read_excel()常用解析_第2张图片

header

这个参数是为了解决是否将前面的表头读入数据表中,如果header = 2,则说明指定位置是2的行作为列名,如果没有设置则说明是所有的数据作为数据,然后另外一行(系统默认输入0-n)作为列名字

index_col

这个参数是默认是None,和header一样,可以填入数字,意思是设置第几列为行索引

dtype

这个参数输入可以表示类型的名称字符或者字典,如果dtype=‘str’,则说明整个表格的书数据都转换成字符串的数据类型,如果输入的是字典,则dtype={‘列1’:‘str’,‘列2’:‘int’}则说明每个字段都可以指定不同的数据类型,上面的定义的意思就是第一列是字符串,第二列是整型

以上是我比较常用的参数,后面还有很多参数,需要的可以自己探索下~

你可能感兴趣的:(数据分析思维,数据分析入门,python,字符串,excel,大数据,经验分享)