统计学中的第p百分位数的理解

相信大家在做数据分析,需要用到统计学的知识的时候,应该都会遇到第p百分位数
那么在这里我将要讲讲我个人的理解:
从维基百科上查找相关概念:

百分位数,统计学术语,如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数,以Pk表示第k百分位数。
Pk表示至少有k%的资料小于或等于这个数,而同时也有(100-k)%的资料大于或等于这个数。
P25=Q1
P50=Q2
P75=Q3
P50称为中位数
P75与P25的差称为四分位距

看到上面的描述,也大概是一知半解,不过只需关注这个核心句子:Pk表示至少有k%的资料小于或等于这个数,而同时也有(100-k)%的资料大于或等于这个数。
相信都理解都差不多了,也就是看这个数的在全部的排好序(小->大)的位置,那么我们再看看求法:

求法:
若一群资料的个数为N,且由小到大排列,设N×k%=a

  • a 是整数 那么取第a和a+1的数它们的平均值
  • a不是整数 取a接近的下一个整数(a=1.2 取2)

那么我们看看例子吧
假设数据是:
栗子1

1,2,3,4,5,6,7,8,9,10

total :10
那么第p(25)百分位数是多少:3 ----------------->10 25% = 2.5 取第3个数 也就是3
第p(50)百分位数是多少:5.5---------------------->10
50% = 5 整数 取 5个和第5+1个的平均值
第p(75)百分位数是多少:8----------------------->10*75%=7.5 取第8个数

栗子2

6,7,15,36,39,40,41,42,43,47,49

那么第p(25)百分位数是多少:15
第p(50)百分位数是多少:40
第p(75)百分位数是多少:43

栗子3

7,15,36,39,40,41

那么第p(25)百分位数是多少:15
第p(50)百分位数是多少:37.5
第p(75)百分位数是多少:40

栗子4

1,2,3,4

那么第p(25)百分位数是多少:1.5
第p(50)百分位数是多少:2.5
第p(75)百分位数是多少:3.5

相信看到这里大家都理解得差不多,就算不是很理解,起码这个百分位数也是会算了吧
也从几个栗子看出来,第50百分位数明显就是中位数,所以有时候我们在算中位数的时候就可以使用第p百分位数进行计算。

你可能感兴趣的:(机器学习)