地理分析方法论|地理探测器(Geo Detector)

目录

1相关理论

1.1地理探测器概念

1.2地理探测器原理

1.2.1分异及因子探测

1.2.2交互作用探测

​1.2.3风险区探测

1.2.4生态探测

1.3地理探测器主流应用

2相关操作(Excel版本)

2.1地图转为表格

2.2地理探测器运行

2.3结果分析

2.3.1因子探测结果分析

2.3.2交互作用探测结果分析

2.3.3生态探测结果分析

2.3.4风险区探测结果分析


1相关理论

      地理探测器是由中国科学院地理科学与资源研究所王劲峰研究员团队在《Geographical Detectors-Based Health Risk Assessment and its Application in the Neural Tube Defects Study of the Heshun Region, China》一文中首次提出,解决了中国山西省和顺县新生儿神经管畸形地理环境影响发病因子分析,为环境健康研究提供新方法。如今,地理探测器已成为主流地理分析模型,广泛应用至流行病研究、环境影响因子分析、植被变化驱动力分析等领域。

1.1地理探测器概念

      地理探测器是探测空间分异性,以及揭示其背后驱动力的一组统计学方法。其核心思想是基于这样的假设:如果某个自变量对某个因变量有重要影响,那么自变量和因变量的空间分布应该具有相似性。地理探测器擅长分析类型量,而对于顺序量、比值量或间隔量,只要进行适当的离散化,也可以利用地理探测器对其进行统计分析。即地理探测器既可以探测数值型数据,也可以探测定性数据,这正是地理探测器的一大优势。地理探测器的另一个独特优势是探测两因子交互作用于因变量。交互作用一般的识别方法是在回归模型中增加两因子的乘积项,检验其统计显著性。然而,两因子交互作用不一定就是相乘关系。地理探测器通过分别计算和比较各单因子q值及两因子叠加后的 q 值,可以判断两因子是否存在交互作用,以及交互作用的强弱、方向、线性还是非线性等。两因子叠加既包括相乘关系,也包括其他关系,只要有关系,就能检验出来。

      地理探测器现有Excel、R语言、QGIS插件三种版本形式,均可在GeoDetector网站下载(Welcome to visit GeoDetector Website)。

地理分析方法论|地理探测器(Geo Detector)_第1张图片

1.2地理探测器原理

      空间分异性是地理现象的基本特点之一。地理探测器是探测和利用空间分异性的工具。地理探测器包括4个探测器:分异及因子探测、交互作用探测、风险区探测、生态探测。

1.2.1分异及因子探测

      探测Y的空间分异性;以及探测某因子X多大程度上解释了属性Y 的空间分异。用q值度量,表达式为:地理分析方法论|地理探测器(Geo Detector)_第2张图片

(式中:h = 1, …, L为变量Y或因子X的分层(Strata),即分类或分区;Nh和N分别为层h 和全区的单元数; σh2和 σ2 分别是层h和全区的Y值的方差。SSW和SST分别为层内方差之和(Within Sum ofSquares)和全区总方差(Total Sum of Squares)。q的值域为[0, 1],值越大说明Y的空间分异性越明显;如果分层是由自变量X生成的,则q值越大表示自变量X对属性Y的解释力越强,反之则越弱。极端情况下,q值为1表明因子X完全控制了Y 的空间分布,q值为0则表明因子X与Y没有任何关系,q值表示X解释了100×q%的Y。)

      q值的一个简单变换满足非中心F分布:地理分析方法论|地理探测器(Geo Detector)_第3张图片

 (式中:λ为非中心参数;为层h的均值。根据式(3),可以查表或者使用地理探测器软件来检验q值是否显著。)

地理分析方法论|地理探测器(Geo Detector)_第4张图片

1.2.2交互作用探测

      识别不同风险因子Xs之间的交互作用,即评估因子X1和X2共同作用时是否会增加或减弱对因变量Y的解释力,或这些因子对Y的影响是相互独立的。评估的方法是首先分别计算两种因子X1和X2对Y的q值:q(X1)和q(X2),并且计算它们交互(叠加变量X1和X2两个图层相切所形成的新的多边形分布,图2)时的q值:q(X1∩X2),并对q(X1)、q(X2)与q(X1∩X2)进行比较。两个因子之间的关系可分为以下几类。

 地理分析方法论|地理探测器(Geo Detector)_第5张图片

地理分析方法论|地理探测器(Geo Detector)_第6张图片1.2.3风险区探测

      用于判断两个子区域间的属性均值是否有显著的差别,用t统计量来检验:

地理分析方法论|地理探测器(Geo Detector)_第7张图片

(式中:表示子区域 h内的属性均值,如发病率或流行率;nh为子区域h内样本数量, Var表示方差。统计量t近似地服从Student's t分布,其中自由度的计算方法为式(5))

地理分析方法论|地理探测器(Geo Detector)_第8张图片 

      零假设H0:

      如果在置信水平α下拒绝H0,则认为两个子区域间的属性均 值存在着明显的差异。 

1.2.4生态探测

      用于比较两因子X1和X2对属性Y的空间分布的影响是否有显著的差异,以F统计量来衡量:

地理分析方法论|地理探测器(Geo Detector)_第9张图片

(式中:NX1及NX2分别表示两个因子X1和X2的样本量;SSWX1和SSWX2分别表示由X1和X2形成的分层的层内方差之和;L1和L2分别表示变量X1和X2分层数目。)

      零假设:

 

      如果在α的显著性水平上拒绝H0,这表明两因子X1和X2对属性Y的空间分布的影响存在着显著的差异。 

1.3地理探测器主流应用

(1)新生儿神经管畸形空间变异的环境因子识别

(2)美国陆表切割度空间变异的主导因素探测

(3)中国县域城市化空间变异的驱动力

(4)土壤抗生素残留空间变异的因子分析

(5)植被变化特征影响因素分析

(6)NPP、NDVI等空间格局驱动力分析

        ......

2相关操作(Excel版本)

2.1地图转为表格

      将研究区神经管畸形出生缺陷的发生、高程、土壤类型、流域分区等矢量数据导入ArcGIS软件见图1。通过要素转点工具,将神经管畸形出生缺陷发生的村庄信息转为点数据,提取村庄中心点,操作见图2,结果见图3

地理分析方法论|地理探测器(Geo Detector)_第10张图片

图1 导入研究区地图数据

地理分析方法论|地理探测器(Geo Detector)_第11张图片

图2 要素转点操作

地理分析方法论|地理探测器(Geo Detector)_第12张图片

图3 要素转点结果

      将高程、土壤类型、流域分区提取到中心点中。通过运行Analysis ToolsOverlayIntersect工具实现。操作见图4,结果见图5。最后导出属性表中的数据。

地理分析方法论|地理探测器(Geo Detector)_第13张图片

图4 提取信息到中心点操作

地理分析方法论|地理探测器(Geo Detector)_第14张图片

图5 提取信息到中心点结果

2.2地理探测器运行

      打开集成到Excel中的地理探测器,导入地图转换的表格数据,读取数据,设置XY变量,运行地理探测器,最终得到四个探测器的结果数据,分别呈现在Interaction_detectorEcological_detectorFactor_detectorRisk_detector四个表格内。操作见图6,结果见图7

地理分析方法论|地理探测器(Geo Detector)_第15张图片

图6 地理探测器运行操作

地理分析方法论|地理探测器(Geo Detector)_第16张图片

图7 地理探测器运行结果(交互作用探测结果)

2.3结果分析

2.3.1因子探测结果分析

      因子探测结果为“factor_detector”表格内,见图8。其内容有qp两个值表示。q表示每一个自变量在多大程度上解释了因变量的空间分异,值越大说明该自变量对因变量的空间分异解释程度越大。图8中可见流域分区(region)因子q值最大,可以说明流域分区(region)这一因子与该区域空间分析关系最大。P值是显著性检验的一个结果,本次实验采用0.05进行显著性检验。

地理分析方法论|地理探测器(Geo Detector)_第17张图片

图8 因子探测结果

2.3.2交互作用探测结果分析

      交互作用探测结果为“Interaction_detector”表格内,见图7。交互作用探测评估因子X1和X2共同作用时是否会增加或减弱对因变量Y的解释力,或这些因子对Y的影响是相互独立的。评估的方法是首先分别计算两种因子X1和X2对Y的q值:q(X1)和q(X2),并且计算它们交互时的q值:q(X1 ∩ X2) ,并对 q(X1)、q(X2)与q(X1 ∩ X2) 进行比较。可以从图7中看出,土壤类型因子(type)与流域分区(region)交互作用,对Y(神经管畸形出生缺陷的发生)的解释力最大。相对于单个因素来看,土壤类型因子(type)与流域分区(region)交互作用比他们单独作用解释力增加。

2.3.3生态探测结果分析

      生态探测结果为“Ecological_detector”表格内,见图9。生态探测用于比较两因子X1和X2对属性Y的空间分布的影响是否有显著的差异。图9可以看出土壤类型因子(type)与流域分区(region)、土壤类型因子(type)与高程因子(level)对Y(神经管畸形出生缺陷的发生)的解释力有显著差异,流域分区(region)与高程因子(level)的解释力没有显著差异。

地理分析方法论|地理探测器(Geo Detector)_第18张图片

9 生态探测结果

2.3.4风险区探测结果分析

      风险区探测结果为“Risk_detector”表格内,见图10。风险区探测结果用于判断两个子区域间的属性均值是否有显著的差别。表格1-3行内容表示不同土壤类型的神经管畸形出生缺陷的平均发生率。表格5-11行表示空间分异性是否显著,“Y”表示具有显著差异“N”表示不显著差异。后面表格内容表示其余因子的平均发病率和显著性检验。

地理分析方法论|地理探测器(Geo Detector)_第19张图片

10 风险区探测结果

【参考文献】

[1] Wang JF, Li XH, Christakos G, Liao YL, Zhang T, Gu X & Zheng XY. 2010. Geographical detectors-based health risk assessment and its application in the neural tube defects study of the Heshun region, China. International Journal of Geographical Information Science 24(1): 107-127.

[2]王劲峰,徐成东.地理探测器:原理与展望[J].地理学报,2017,72(01):116-134.

[3]部分来源于网络资料,包括微信公众号文章、新闻报道等其他网络文献来源。此博客仅供相关学习者交流,不进行任何商业活动,如有侵权冒犯,请联系删除。

你可能感兴趣的:(地理分析方法论,r语言)