pandas 表格创建与查看read_excel/head

创建dataframe

从python字典创建

df = pd.DataFrame(python_dic)# python字典的键将会变成列标签,值则变为每一行的内容。

pandas中DataFrame类似于一个二维数组,而每一列可以看成一个一维数组,该一维数组在pandas中被称作Series。即DataFrame为一个二维数组,由一列一列的一维数组Series组成。

从csv文件读取

df= pd.read_csv('path_to_csv_file')# 读取csv文件

读取其他类型的文件(csv,excel,json)也相同,将命令替换成read_***即可,比如读取excel文件使用read_excel()

从excel文件读取

xls = pd.ExcelFile(path)
data = pd.read_excel(xls, 'sheet3') #读取文件的sheet3表格 

因为一个excel文件中可以有多张表格,所以在读取excel文件时最好按以上方法,不然pandas会一次性读取所有表格,可能会出现意想不到的后果。

[TIPS]
将当前表格导出的方法为

df.to_excel("name.xlsx",sheet_name="sheet_name",index=Flase)
 #`name.xlsx` #整个输出文件的文件名
 #`sheet_name `#文件中具体一张表格sheet的名称
 #`index=Flase`#是否保存行标签0,1,2....

基础查看

  • df.head()
  • df.tail()
    使用head()tail()可以显示大文档的前5行和末尾5行,加上参数可以声明到底要查看几行,如head(6)显示开头前六行。
  • 省略项太多,想要强制不省略显示,使用下述命令,这样pandas会完整打印整个表格。
    pd.set_option('display.max_columns', None )
    pd.set_option('display.max_rows' , None )

显示信息的概况

  • df.dtypes # 显示每一列的数据类型
  • df.shape# 显示数组维数

你可能感兴趣的:(pandas,python,pandas)