对pandas常用的函数进行了一下汇总,供自己以后回顾使用。
import pandas as pd
df = pa.DataFrame(Data, index=(...), columns=(...), dtype=)
df.shape#获取DataFrame的形状。[0]代表行数,[1]代表列数
df.dtypes#获取DataFrame中的数据类型
df.ndim#获取DataFrame的维数
df.index#获取DataFrame的索引(指行名称)
df.columns#获取DataFrame的列名称
df.values#获取DataFrame中的内容,如果全为数字,格式为ndarray
df.head#获取DataFrame的头几行
df.tail#获取DataFrame的尾几行
df.info#获取DataFrame自身的有关信息(行数、列标题、数据类型等)
df.describe#获取DataFrame的统计信息(均值、方差、最大值、最小值、中位数)
df.sort_values(by=列名,ascending=True)#默认为True,代表升序,False代表降序
df[2:4]#使用df自身,只能对行操作
df.loc[]#按照行、列名称进行切片,采用多行多列时,不会像Numpy取点,会取到右端点
df.iloc[]#按照行、列的索引进行切片,采用多行多列时,不会像Numpy 取点,不会取到右端点
df[df["列名"]>10]=20#单个条件
df[df["列名"]>10]&df[df["列名"]<30]#多个条件
df["列名"]#返回Series
df.[["列名"]]#返回DataFrame