pandas基础的汇总与统计

pandas基础的汇总与统计,求平均值、中位数、众数等

from pandas import DataFrame

data={"语文":[99,100,80,80,97],
      "数学":[89,88,88,60,79],
      "英语":[87,80,87,78,85],
     "科学":[95,100,84,69,84],}
     
df=DataFrame(data,index = ['张三','李四','王五','赵六','刘八'])
print(df)
print(df.max())#默认按列进行统计,当axis=1,按行汇总
print(df.min())
print(df.mean())#计算平均值
print(df.median())#计算中位数
print(df.mode())#计算众数,
#如果有两个值出现了同样的次数,那么这两个值都会作为众数计算在内
print(df.std())#计算标准差
print(df.quantile(q=[0.25,0.5,0.75]))#计算分位数,这里是四分位
     语文  数学  英语   科学
张三   99  89  87   95
李四  100  88  80  100
王五   80  88  87   84
赵六   80  60  78   69
刘八   97  79  85   84
语文    100
数学     89
英语     87
科学    100
dtype: int64
语文    80
数学    60
英语    78
科学    69
dtype: int64
语文    91.2
数学    80.8
英语    83.4
科学    86.4
dtype: float64
语文    97.0
数学    88.0
英语    85.0
科学    84.0
dtype: float64
   语文  数学  英语  科学
0  80  88  87  84
语文    10.281051
数学    12.316655
英语     4.159327
科学    11.970798
dtype: float64
        语文    数学    英语    科学
0.25  80.0  79.0  80.0  84.0
0.50  97.0  88.0  85.0  84.0
0.75  99.0  88.0  87.0  95.0

需要一次性了解整个数据集情况的,可以使用describe()

print(df.describe())#一次性了解整个数据集的情况
               语文         数学         英语          科学
count    5.000000   5.000000   5.000000    5.000000
mean    91.200000  80.800000  83.400000   86.400000
std     10.281051  12.316655   4.159327   11.970798
min     80.000000  60.000000  78.000000   69.000000
25%     80.000000  79.000000  80.000000   84.000000
50%     97.000000  88.000000  85.000000   84.000000
75%     99.000000  88.000000  87.000000   95.000000
max    100.000000  89.000000  87.000000  100.000000

你可能感兴趣的:(python,pandas,开发语言)