转自:http://xg1990.com/blog/archives/222
学过空间插值的人都知道克里金插值,但是它的变种繁多、公式复杂,还有个半方差函数让人不知所云
本文讲简单介绍基本克里金插值的原理,及其推理过程。
空间插值问题,就是在已知空间上若干离散点 (xi,yi) 的某一属性(如气温,海拔)的观测值 zi=z(xi,yi) 的条件下,估计空间上任意一点 (x,y) 的属性值的问题。
直观来讲,根据地理学第一定律,
All attribute values on a geographic surface are related to each other, but closer values are more strongly related than are more distant ones.
大意就是,地理属性有空间相关性,相近的事物会更相似。由此人们发明了反距离插值,对于空间上任意一点 (x,y) 的属性 z=z(x,y) ,定义反距离插值公式估计量
其中 α 通常取1或者2。
即,用空间上所有已知点的数据加权求和来估计未知点的值,权重取决于距离的倒数(或者倒数的平方)。那么,距离近的点,权重就大;距离远的点,权重就小。
反距离插值可以有效的基于地理学第一定律估计属性值空间分布,但仍然存在很多问题:
因此更加准确的克里金插值方法被提出来了
相比反距离插值,克里金插值公式更加抽象
其中 zo^ 是点 (xo,yo) 处的估计值,即 zo=z(xo,yo) 。
这里的 λi 是权重系数。它同样是用空间上所有已知点的数据加权求和来估计未知点的值。但权重系数并非距离的倒数,而是能够满足点 (xo,yo) 处的估计值 zo^ 与真实值 zo 的差最小的一套最优系数,即
同时满足无偏估计的条件
不同的克里金插值方法的主要差异就是假设条件不同。本文仅介绍普通克里金插值的假设条件与应用。
普通克里金插值的假设条件为,空间属性 z 是均一的。对于空间任意一点 (x,y) ,都有同样的期望c与方差 σ2 。
即对任意点 (x,y) 都有
换一种说法:任意一点处的值 z(x,y) ,都由区域平均值 c 和该点的随机偏差 R(x,y) 组成,即
其中 R(x,y) 表示点 (x,y) 处的偏差,其方差均为常数
先分析无偏估计条件 E(zo^−zo)=0 ,将 zo^=∑ni=0λizi 带入则有
又因为对任意的z都有 E[z]=c ,则
即
这是 λi 的约束条件之一。
再分析估计误差 Var(zo^−zo) 。为方便公式推理,用符号 J 表示,即
则有
为简化描述,定义符号 Cij=Cov(zi,zj)=Cov(Ri,Rj) ,这里 Ri=zi−c ,即点 (xi,yi) 处的属性值相对于区域平均属性值的偏差。
则有
再定义半方差函数 rij=σ2−Cij ,带入J中,有
考虑到 ∑ni=0λi=1
我们的目标是寻找使J最小的一组 λi ,且J是 λi 的函数,因此直接将J对 λi 求偏导数令其为0即可。即
但是要注意的是,我们要保证求解出来的最优 λi 满足公式 ∑ni=0λi=1 ,这是一个带约束条件的最优化问题。使用拉格朗日乘数法求解,求解方法为构造一个新的目标函数
其中 ϕ 是拉格朗日乘数。求解使这个代价函数最小的参数集 ϕ,λ1,λ2,⋯,λn ,则能满足其在 ∑ni=0λi=1 约束下最小化 J 。即
由于 Cij=Cov(zi,zj)=Cji ,因此同样地 rij=rji ,那么有
式子中半方差函数 rij 十分重要,最后会详细解释其计算与定义
在以上计算中我们得到了对于求解权重系数 λj 的方程组。写成线性方程组的形式就是:
写成矩阵形式即为
对矩阵求逆即可求解。
唯一未知的就是上文中定义的半方差函数 rij ,接下来将详细讨论
上文中对半方差函数的定义为
其等价形式为
这也是半方差函数名称的来由,接下来证明这二者是等价的:
根据上文定义 Ri=zi−c ,有 zi−zj=Ri−Rj ,则
又因为:
于是有
σ2−Cij=12E[(zi−zj)2] 得证,现在的问题就是如何计算