算法笔记:地理探测器

1 空间分层异质性(spatial stratified heterogeneity)

  • 空间分层异质性(空间分异性/区异性):层内方差小于层间方差的地理现象
  • 例如气 候带、土地利用图、地貌图、生物区系、区际经济差异、城乡差异以及主体功能区等 等[,是空间数据的一大特性。
  • “层(strata)”是统计学概念,对应地理上的子区域(sub region)

2 地理探测器介绍

2.1 核心思想

  • 如果某个自变量(x)对某个因变量(y)有重要影响,那么自变量和因变 量的空间分布应该具有相似性

2.2 原理

2.2.1 分异及因子探测

算法笔记:地理探测器_第1张图片

  • 探测Y的空间分异性,以及探测某因子X多大程度上解释了属性Y 的空间分异。
  • 用q值度量,表达式为
    • 算法笔记:地理探测器_第2张图片
      • h = 1, …, L为变量Y或因子X的分层 【子区域数量】
      • Nh和N分别为层h 和全区的单元数
      • \sigma_h^2,\sigma^2——层h和全区的Y值的方差
      • SSW和SST——层内方差之和 ,全区总方差 
  • 值越大说明Y的空间分异性越明显【值越大,说明层内方差越小,方差主要来自层间,也就是空间分异性导致的方差】
  • 如果分层是由自变量X生成的,则q值越大表示自变 量X对属性Y的解释力越强,反之则越弱
    • 极端情况下,q值为1表明因子X完全控制了Y 的空间分布【q为1,说明SSW为0,层内没有方差,方差全是由层间贡献的,说明层内完全一模一样,也就是因子X完美地进行了子空间的划分】
    • q值为0则表明因子X与Y没有任何关系
    • q值表示X解释了100×q%的Y

2.2.2 交互作用探测

  • 识别不同风险因子Xs之间的交互作用
    • 即评估因子X1和X2共同作用时是否会增加或减弱对因变量 Y 的解释力, 或这些因子对Y的影响 是相互独立的
  • 评估的方法是
    • 分别计算两种因子 X1 和 X2 对 Y 的 q 值 : q(X1) 和 q(X2)
    • 计算它们交互时的q 值: q(X1 ∩ X2)
    • 对 q(X1)、q(X2)与q(X1 ∩ X2) 进行比较

算法笔记:地理探测器_第3张图片

算法笔记:地理探测器_第4张图片

2.2.3 风险区探测 

  • 判断两个子区域间的属性均值是否有显著的差别,用t统计量来检验

  • \bar{Y_h}表示子区域h内的属性均值
  • n_h为子区域h内样本数量, Var表示方差
  • 统计量t近似地服从Student's t分布,其中自由度的计算方法为:
    • 算法笔记:地理探测器_第5张图片

2.2.4 生态探测

 算法笔记:地理探测器_第6张图片

 3 举例

  • 对某县1998-2006年的神经管畸形出生缺陷 (NTDs) 的发生 (Y) 进行环境风险因子分析
    • X包括:高程、土壤类型、流域 分区以及蔬菜产量和化肥使用量等社会经济变量
  • 网格点,格点间距为1 km,共1145个,用于将Y和X匹配起来
    • 算法笔记:地理探测器_第7张图片
  • 算法笔记:地理探测器_第8张图片

算法笔记:地理探测器_第9张图片

  • 图8显示了风险因子探测的结果。
    • 图8a 显示了对于单个风险因子(高程等级)而言的风险区探测的结果
      • 其中图8a的表格第一 行的数字“21”、“22”、“23”等是此环境因子各分区的编号,第二行是在每个类型区内的NTDs的平均发病率
      • 接下来的第6~10行是各类型分区的NTDs 发病率之间是否存在统计差异的判断,采用显著性水平为0.05的t检验,“Y”表示存在显 著性差异,“N”表示不存在显著性差异
    • 图8b 展示的是所有风险因子q值的计算结果,结果 表明水文流域变量 X3 具有最高的q值
      • 说 明这些变量中河流是决定 NTDs 空间格局的最 主要的环境因子
    • 图8c是生态探测(2.2.4)的输出,结 果显示就对NTD空间分布的作用而言,水文流 域与其他变量存在着显著差异
    • 图8d是交互探 测(2.2.2)的结果,其中第3~5行是两两变量交互作用 后的q值,结果表明,任何两种变量对NTDs空 间分布的交互作用都要大于第一种变量的独自 作用

参考内容:10王劲峰 (geog.com.cn)

你可能感兴趣的:(地理,笔记)