什么是极值
在极值统计的研究中,首先是建立一个极值的数学模型,如果观测数据服从已知的分布(称之为底分布)就可以得到最大值与最小值的精确模型。
大多数情况,观测数据服从的分布是未知的,因此,就只能够得到极值的渐进分布。在应用中,这就要求数据有比较大的规模,而且实际证明,在大多数情况之下极值的渐进分布提供了一个简单,满意的模型。
极值统计理论就是为观测到的基于某个样本量的极值建立一个概率模型,但是需要具备一定的条件:
- 观测对象是随机变量
- 随机变量的底分布应该是不变的
- 观测到的极值是独立的
极值统计分析与一般统计的差别主要在于数据的收集。首先要收集到有资格被称为极值的观测数据,满足三个条件,并且有一定的规模。
不同的模型对数据有不同的要求:
- 对于极值的经典模型而言,即规范化样本最大值的渐进分布模型,只有“区组最大值”才能作为极值观测数据(什么意思)。
- r个次序统计量模型里面对于区组内的r个最大值都作为极值的观测数据
- 对于平稳时间序列,只有超过阈值的峰(POT)可以作为极值的观测数据
对于阈值模型如何确定阈值是比较难的问题,类似于在r个最大次序统计量模型中,如何确定r。对于点过程模型,如何确定远离原点的区域,选取阈值是否合适,关系到极值理论应用的成败。
极值理论的应用
- 风险管理中的风险测量。Var模型(Value at Risk)
但是Var模型有一个缺陷,其不具有次可加性,就是说证劵组合的损失不一定超过各个证劵损失的和。于是提出了带有条件的Var模型(Conditional Value at Risk) - 保险业
- 自然遭害的预测
选择恰当的极值模型,统计方法在处理极值问题就非常重要:
- 估计方法,就是用数据去估计模型的未知参数。频率直方图用于估计密度,概率图用于你和分布,极大似然估计,据估计,贝叶斯估计
- 不确定性的定量表示。估计模型的时候必须考虑样本的变异性引起的模型的不确定性,比如模型参数的方差
- 模型诊断 需要评价这个模型对于数据拟合的好坏情况
- 信息的极大使用 尽可能的充分使用所有信息。
一元极值理论
极值的基本理论,包括由
- 经典的极值理论导出的极值分布
2.由阈值模型导出的广义Pareto分布,稳定分布,后尾分布,次指数分布以及与极值相关的分布 - Fisher-Tippett 的极值类型定理是极值分布渐进原理的基础
- 规范化最大值的极限分布形式,极值分布的最大值吸引场,规范化常熟的计算公式(norming constants)
理论我写不下去了