四、pandas数据统计函数

一、读取数据

数据内容如下:

ymd,bwendu,ywendu,tianqi,fengxiang,fengli,aqi,aqiinfo,aqiLevel
2018-01-01,3C,-6C,多云,东北风,1-2级,59,良,2
2018-01-02,4C,-6C,多云,东北风,3-4级,60,良,2
2018-01-03,5C,-6C,多云,东北风,5-6级,61,良,2
df = pd.read_csv(data_path)
image.png

二、describe 用法

df.describe()

ps:该函数会抽取df中的数字列进行计算


image.png

三、mean、max、min 用法

df['bwendu'].mean()
df['bwendu'].max()
df['bwendu'].min()
image.png

四、去重 unique 用法

df['fengli'].unique()
image.png

五、value_counts值数量统计用法

df['bwendu'].value_counts()
image.png

六、协方差cov、相关性corr用法

df.cov() #协方差矩阵
df.corr() 
df['bwendu'].corr(df['aqi'])
df['bwendu'].corr(df['bwendu']-df['ywendu'])
image.png

你可能感兴趣的:(四、pandas数据统计函数)