设 (X1,X2,⋯,Xn) 是总体 X 的一个样本。如果 X∗i(i=1,2,⋯,n) 是样本 (X1,X2,⋯,Xn) 这样的的函数:它总是取样本观察值 (x1,x2,⋯,xn) 按从小到大排序后第 i 个值为自己的观测值。那么就称 X∗1,X∗2,⋯,X∗n 为顺序统计量。顺序统计量可以简记为
设 x1,x2,⋯,xn 是总体 X 的一组容量为 n 的样本观测值,将它们按从小到大的顺序重新排列为 x∗1,x∗2,⋯,x∗n ,对于任意实数 x ,定义函数
经验分布函数 Fn(x) 的图形(如下图所示)是一条呈跳跃上升的阶梯形曲线。如果样本观测值 x1,x2,⋯,xn 中没有重复的数值,则每一跳跃为 1/n ,若有重复 l 次的值,则按 1/n 的 l 倍跳跃上升。图中圆滑曲线是总体 X 的理论分布函数 F(x) 的图形。若把经验分布函数的图形连成折线,那么它实际就是累积频率直方图的上边。
这和概率分布函数的性质是一致的。
根据大数定理可知,当试验次数增大时,事件的频率稳定于概率。那么,当试验次数增大时,表示事件 {X≤x} 出现频率的经验分布函数是否接近于表示事件 {X≤x} 出现概率的总体分布函数呢?这个问题可由格利文科定理来回答。
格利文科定理:设总体 X 的分布函数 F(x) ,经验分布函数 Fn(x) ,则有
欢迎关注白马负金羁的博客 http://blog.csdn.net/baimafujinji,为保证公式、图表得以正确显示,强烈建议你从该地址上查看原版博文。本博客主要关注方向包括:数字图像处理、算法设计与分析、数据结构、机器学习、数据挖掘、统计分析方法、自然语言处理。
[1] 葛余博,概率论与数理统计,清华大学出版社
[2] 李时,应用统计学,清华大学出版