关于分位数

分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置。百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息。对于无大量重复的数据,第p百分位数将它分为两个部分。大约有p%的数据项的值比第p百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大。对第p百分位数,严格的定义如下。

第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值。

分位数是个统计值, 如果将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。但是这个量度并不是一个百分数,而是指向该百分数的一个样本或总体的具体值。
高等院校的入学考试成绩经常以百分位数的形式报告。比如,假设某个考生在入学考试中的语文部分的原始分数为54分。相对于参加同一考试的其他学生来说,他的成绩如何并不容易知道。但是如果原始分数54分恰好对应的是第70百分位数,我们就能知道大约70%的学生的考分比他低,而约30%的学生考分比他高。

关于图像的p分位数

p-分位数法(也称p-tile法)是最古老的阈值选取方法之一。其基本思想是使图像中目标所占图像像素数的比例等于其先验概率 来设定阈值。在很多图像中像素属于目标的先验概率可以根据解剖结构中背景和目标的相对比例预先估计出来。然后根据先验概率直接在图像直方图上找到合适的阈值,把大于阈值的像素作为目标,小于阈值的像素作为背景,最终实现图像的快速分割。图像中感兴趣目标和背景之间像素数目可能并不存在相对固定的比例关系,此时就不容易估计出目标的先验概率 ,也就不能用 p-分位数法进行阈值分割。实际上,即使在先验概率能够预先估算出来这一先决条件满足的情况下,也只有当图像背景和目标差别比较显著时候, p-分位数法才可能得到又快又好的分割效果;而对于目标比较多,目标和背景对比不是很明显的图像其分割效果就未必理想,甚至可能完全失效。


 

你可能感兴趣的:(关于分位数)