托布勒的地理第一定律指出,“一切都与其他事物有关,但近处的事物比远处的事物更相关。
在半变异函数的情况下,更接近的事物更可预测,变异性更小,而遥远的事物则难以预测,相关性也较低。
例如,当前位置的地形更可能与前方 1 米处的地形相似,而不是与 100 米外的地形相似。
半变异函数绘制了样本值(污染、海拔、噪声等)如何随距离变化。
接下来以土壤水分样本作为案例进行说明。
案例包含 10 英亩田地中的 73 个土壤水分样本。在西北角,样品更湿润,含水量更高。但在东部象限,它们要干燥得多,如下图所示。
针对上图存在以下疑问:
可以用统计依赖性或自相关来描述这个想法。此外,空间自相关(距离较近的事物比距离较远的事物更相似)为预测提供了有价值的信息。
要了解空间依赖性,可以使用半变异函数进行估计。半变异函数取 2 个采样位置,并将两点之间的距离称为 h。
在 x 轴上,它以滞后为单位绘制距离 (h),滞后只是分组距离。取每组 2 个样本位置,测量响应变量(土壤中的含水量)之间的方差,并将其绘制在 y 轴上。
根据观察者的不同,半变异函数看起来像是一大堆点。例如,土壤水分图如下所示:
但是可以通过选择单个点来做一些侦探工作。当在半变异函数上取这个点时:
可以在地图上看到它们代表哪 2 个点。这是有道理的,因为它们彼此相距很远。因此,它在半变异函数中的极右位置。下面强调的正是这一点:
它们与该特定滞后距离的平均值也存在很大差异。如果半方差较高,则它在 y 轴上的位置较高。可以看到,半方差在滞后距离越近时越小,滞后距离越大,半方差就越大。
我们正在研究 2 个样本之间的所有距离及其变异性。半变异函数考虑所有点及其与方差的距离。
这就是为什么半变异函数上有这么多点的原因。这是上面数据集的一个子集,可以看到我们可以在半变异函数中绘制的所有不同点集。
半方差函数是距离 h 的函数,也是方向 α 的函数。当一个变量分布于空间时,该变量叫区域化变量(regionalized variable),半方差函数就是区域化变量 Z ( x i ) Z(x_i) Z(xi) 和 Z ( x i + h ) Z(x_i+h) Z(xi+h) 增量平方的数学期望,即区域化变量增量的方差(variograms)。其计算公式:
r ( h ) = 1 2 N ( h ) ∑ i = 1 N ( h ) [ Z ( x i ) − Z ( x i + h ) ] 2 r(h)=\frac{1}{2N(h)}\sum_{i=1}^{N(h)}[Z(x_i)-Z(x_i+h)]^2 r(h)=2N(h)1i=1∑N(h)[Z(xi)−Z(xi+h)]2
式中, r ( h ) r(h) r(h) 是相隔距离为 h h h 的半方差图的估计值, N ( h ) N(h) N(h) 是相隔距离为 h 的所有点的配对数, Z ( x i ) Z(x_i) Z(xi) 是样点 x i x_i xi 的平均密度, Z ( x i + h ) Z(x_i+h) Z(xi+h) 是样点 x i + h x_i+h xi+h 的平均密度。
半方差图是 r ( h ) r(h) r(h) 作为距离 h h h 的函数的图形,其值为某一特定方向的值,其中有4个最重要的参数:
以 r ( h ) r(h) r(h) 为纵轴, h h h 为横轴,绘制出 r ( h ) r(h) r(h) 随 h h h 增加的变化曲线为半方差图。
从图中可以看出:
计算取样范围内所有可能距离间隔的变异函数,绘制函数曲线图,进而建立变异函数理论模型。
地统计学中常用来拟合实际变异曲线的理论模型有球状模型、指数模型、高斯模型、线状模型等。
选择何种模型去拟合样本半方差图是一个复杂的过程,一般是根据样本方差图的形状或研究目的来确定。
自然界中许多生物和非生物因子的空间分布与方向有密切关系,因此,也产生了相应的各项异性模型。
有些区域化变量往往包含各种尺度或各种层次的变化,反映在半方差函数上其结构往往不是一种模型结构,而是多种模型结构相叠加在一起的套合结构。
python实现:
https://scikit-gstat.readthedocs.io/en/latest/userguide/variogram.html#the-variogram
参考:
https://gisgeography.com/semi-variogram-nugget-range-sill/