半方差函数详解

1 引言

托布勒的地理第一定律指出,“一切都与其他事物有关,但近处的事物比远处的事物更相关。

在半变异函数的情况下,更接近的事物更可预测,变异性更小,而遥远的事物则难以预测,相关性也较低

例如,当前位置的地形更可能与前方 1 米处的地形相似,而不是与 100 米外的地形相似。

半变异函数绘制了样本值(污染、海拔、噪声等)如何随距离变化

接下来以土壤水分样本作为案例进行说明。

案例包含 10 英亩田地中的 73 个土壤水分样本。在西北角,样品更湿润,含水量更高。但在东部象限,它们要干燥得多,如下图所示。

半方差函数详解_第1张图片

针对上图存在以下疑问

  • 不同地点的值的可预测性如何?
  • 距离较近的已知值是否距离较远的值更相似

可以用统计依赖性或自相关来描述这个想法。此外,空间自相关(距离较近的事物比距离较远的事物更相似)为预测提供了有价值的信息。

2 半变异函数原理

要了解空间依赖性,可以使用半变异函数进行估计。半变异函数取 2 个采样位置,并将两点之间的距离称为 h

x 轴上,它以滞后为单位绘制距离 (h),滞后只是分组距离。取每组 2 个样本位置,测量响应变量(土壤中的含水量)之间的方差,并将其绘制在 y 轴上

根据观察者的不同,半变异函数看起来像是一大堆点。例如,土壤水分图如下所示:

半方差函数详解_第2张图片

但是可以通过选择单个点来做一些侦探工作。当在半变异函数上取这个点时:

半方差函数详解_第3张图片

可以在地图上看到它们代表哪 2 个点。这是有道理的,因为它们彼此相距很远。因此,它在半变异函数中的极右位置。下面强调的正是这一点:

半方差函数详解_第4张图片

它们与该特定滞后距离的平均值也存在很大差异。如果半方差较高,则它在 y 轴上的位置较高。可以看到,半方差在滞后距离越近时越小,滞后距离越大,半方差就越大

我们正在研究 2 个样本之间的所有距离及其变异性。半变异函数考虑所有点及其与方差的距离。

半方差函数详解_第5张图片

这就是为什么半变异函数上有这么多点的原因。这是上面数据集的一个子集,可以看到我们可以在半变异函数中绘制的所有不同点集。

3 半变异函数计算

半方差函数是距离 h 的函数,也是方向 α 的函数。当一个变量分布于空间时,该变量叫区域化变量(regionalized variable),半方差函数就是区域化变量 Z ( x i ) Z(x_i) Z(xi) Z ( x i + h ) Z(x_i+h) Z(xi+h) 增量平方的数学期望即区域化变量增量的方差(variograms)。其计算公式:

r ( h ) = 1 2 N ( h ) ∑ i = 1 N ( h ) [ Z ( x i ) − Z ( x i + h ) ] 2 r(h)=\frac{1}{2N(h)}\sum_{i=1}^{N(h)}[Z(x_i)-Z(x_i+h)]^2 r(h)=2N(h)1i=1N(h)[Z(xi)Z(xi+h)]2

式中, r ( h ) r(h) r(h) 是相隔距离为 h h h 的半方差图的估计值 N ( h ) N(h) N(h)相隔距离为 h 的所有点的配对数 Z ( x i ) Z(x_i) Z(xi) 是样点 x i x_i xi 的平均密度, Z ( x i + h ) Z(x_i+h) Z(xi+h) 是样点 x i + h x_i+h xi+h 的平均密度。

半方差图是 r ( h ) r(h) r(h) 作为距离 h h h 的函数的图形,其值为某一特定方向的值,其中有4个最重要的参数:

  • 变程(RANGE):是当变异函数的值达到平衡时的间隔距离,反映了区域化变量影响范围的大小。
  • 块金值(NUGGET):指变异函数曲线延伸到间隔距离为零时的截距,反映区域化变量内部随机性的可能程度
  • 基台值 C 0 + C C_0+C C0+C(SILL):是指达到平衡时的变异函数值,反映变量变化幅度的大小
  • 空间变异比 C 0 / ( C 0 + C ) C_0/(C_0+C) C0/(C0+C):反映变量空间变异的程度,其值较高,说明随机部分引起的空间异质性程度较高较低则说明由空间自相关部分引起的空间变异较大;如果该比值接近1,则说明该变量在整个尺度上具有恒定的变异。从结构性因素看,其表示系统变量的空间相关程度,比值小于25%,说明变量具有强烈的空间相关;比值在25%-75%,变量是中等程度的空间相关;大于75%,变量空间相关性很弱。

r ( h ) r(h) r(h) 为纵轴, h h h 为横轴,绘制出 r ( h ) r(h) r(h) h h h 增加的变化曲线为半方差图。

半方差函数详解_第6张图片

从图中可以看出:

  • 在距离较近的采样点,点之间的值差异往往很小。换言之,半方差很小。
  • 随着远离采样点的距离增加,采样点之间不再存在关系。它们的方差开始趋于平缓,样本值彼此之间没有关联。
  • 当同一位置有两个采样点时,可以预期具有相同的值,因此块金值应为零。有时他们不会,这增加了随机性。但在图形开始调平之前,这些值在空间上是自相关的。
  • 当距离增加时,半方差会增加。相隔很远的点对较少,因此样本点之间的相关性较低。
  • 正如半变异函数所示,它开始达到其平坦的渐近水平。尝试拟合函数以对此行为进行建模。
4 半方差图拟合模型

计算取样范围内所有可能距离间隔的变异函数,绘制函数曲线图,进而建立变异函数理论模型

地统计学中常用来拟合实际变异曲线的理论模型有球状模型、指数模型、高斯模型、线状模型等。

  • 一般情况下,球状模型说明所研究的种群呈聚集分布,表示当样本点间隔距离达到变程之前,样点的空间依赖性随样点间距离增大而降低
  • 指数模型与球状模型相似,但其基台值是渐进线
  • 随机分布 r ( h ) r(h) r(h) 不随距离变化而规律性变化
  • 非水平线状模型表示种群为中等程度的聚集分布,其空间依赖范围超过研究尺度
  • 完全随机或均匀的数据,曲线表现为纯块金变异图, r ( h ) r(h) r(h) 呈水平直线或稍有斜率,表明在抽样尺度下无空间相关性

选择何种模型去拟合样本半方差图是一个复杂的过程,一般是根据样本方差图的形状或研究目的来确定。

自然界中许多生物和非生物因子的空间分布与方向有密切关系,因此,也产生了相应的各项异性模型。

有些区域化变量往往包含各种尺度或各种层次的变化,反映在半方差函数上其结构往往不是一种模型结构,而是多种模型结构相叠加在一起的套合结构。

半方差函数详解_第7张图片

python实现:

https://scikit-gstat.readthedocs.io/en/latest/userguide/variogram.html#the-variogram

参考:
https://gisgeography.com/semi-variogram-nugget-range-sill/

你可能感兴趣的:(概率论,人工智能,统计学)