目录
1相关理论
1.1地理探测器概念
1.2地理探测器原理
1.2.1分异及因子探测
1.2.2交互作用探测
1.2.3风险区探测
1.2.4生态探测
1.3地理探测器主流应用
2相关操作(Excel版本)
2.1地图转为表格
2.2地理探测器运行
2.3结果分析
2.3.1因子探测结果分析
2.3.2交互作用探测结果分析
2.3.3生态探测结果分析
2.3.4风险区探测结果分析
地理探测器是由中国科学院地理科学与资源研究所王劲峰研究员团队在《Geographical Detectors-Based Health Risk Assessment and its Application in the Neural Tube Defects Study of the Heshun Region, China》一文中首次提出,解决了中国山西省和顺县新生儿神经管畸形地理环境影响发病因子分析,为环境健康研究提供新方法。如今,地理探测器已成为主流地理分析模型,广泛应用至流行病研究、环境影响因子分析、植被变化驱动力分析等领域。
地理探测器是探测空间分异性,以及揭示其背后驱动力的一组统计学方法。其核心思想是基于这样的假设:如果某个自变量对某个因变量有重要影响,那么自变量和因变量的空间分布应该具有相似性。地理探测器擅长分析类型量,而对于顺序量、比值量或间隔量,只要进行适当的离散化,也可以利用地理探测器对其进行统计分析。即地理探测器既可以探测数值型数据,也可以探测定性数据,这正是地理探测器的一大优势。地理探测器的另一个独特优势是探测两因子交互作用于因变量。交互作用一般的识别方法是在回归模型中增加两因子的乘积项,检验其统计显著性。然而,两因子交互作用不一定就是相乘关系。地理探测器通过分别计算和比较各单因子q值及两因子叠加后的 q 值,可以判断两因子是否存在交互作用,以及交互作用的强弱、方向、线性还是非线性等。两因子叠加既包括相乘关系,也包括其他关系,只要有关系,就能检验出来。
地理探测器现有Excel、R语言、QGIS插件三种版本形式,均可在GeoDetector网站下载(Welcome to visit GeoDetector Website)。
空间分异性是地理现象的基本特点之一。地理探测器是探测和利用空间分异性的工具。地理探测器包括4个探测器:分异及因子探测、交互作用探测、风险区探测、生态探测。
探测Y的空间分异性;以及探测某因子X多大程度上解释了属性Y 的空间分异。用q值度量,表达式为:
(式中:h = 1, …, L为变量Y或因子X的分层(Strata),即分类或分区;Nh和N分别为层h 和全区的单元数; σh2和 σ2 分别是层h和全区的Y值的方差。SSW和SST分别为层内方差之和(Within Sum ofSquares)和全区总方差(Total Sum of Squares)。q的值域为[0, 1],值越大说明Y的空间分异性越明显;如果分层是由自变量X生成的,则q值越大表示自变量X对属性Y的解释力越强,反之则越弱。极端情况下,q值为1表明因子X完全控制了Y 的空间分布,q值为0则表明因子X与Y没有任何关系,q值表示X解释了100×q%的Y。)
(式中:λ为非中心参数;为层h的均值。根据式(3),可以查表或者使用地理探测器软件来检验q值是否显著。)
识别不同风险因子Xs之间的交互作用,即评估因子X1和X2共同作用时是否会增加或减弱对因变量Y的解释力,或这些因子对Y的影响是相互独立的。评估的方法是首先分别计算两种因子X1和X2对Y的q值:q(X1)和q(X2),并且计算它们交互(叠加变量X1和X2两个图层相切所形成的新的多边形分布,图2)时的q值:q(X1∩X2),并对q(X1)、q(X2)与q(X1∩X2)进行比较。两个因子之间的关系可分为以下几类。
用于判断两个子区域间的属性均值是否有显著的差别,用t统计量来检验:
(式中:表示子区域 h内的属性均值,如发病率或流行率;nh为子区域h内样本数量, Var表示方差。统计量t近似地服从Student's t分布,其中自由度的计算方法为式(5))
零假设H0:
如果在置信水平α下拒绝H0,则认为两个子区域间的属性均 值存在着明显的差异。
用于比较两因子X1和X2对属性Y的空间分布的影响是否有显著的差异,以F统计量来衡量:
(式中:NX1及NX2分别表示两个因子X1和X2的样本量;SSWX1和SSWX2分别表示由X1和X2形成的分层的层内方差之和;L1和L2分别表示变量X1和X2分层数目。)
零假设:
如果在α的显著性水平上拒绝H0,这表明两因子X1和X2对属性Y的空间分布的影响存在着显著的差异。
(1)新生儿神经管畸形空间变异的环境因子识别
(2)美国陆表切割度空间变异的主导因素探测
(3)中国县域城市化空间变异的驱动力
(4)土壤抗生素残留空间变异的因子分析
(5)植被变化特征影响因素分析
(6)NPP、NDVI等空间格局驱动力分析
......
将研究区神经管畸形出生缺陷的发生、高程、土壤类型、流域分区等矢量数据导入ArcGIS软件见图1。通过要素转点工具,将神经管畸形出生缺陷发生的村庄信息转为点数据,提取村庄中心点,操作见图2,结果见图3。
图1 导入研究区地图数据
图2 要素转点操作
图3 要素转点结果
将高程、土壤类型、流域分区提取到中心点中。通过运行Analysis Tools—Overlay—Intersect工具实现。操作见图4,结果见图5。最后导出属性表中的数据。
图4 提取信息到中心点操作
图5 提取信息到中心点结果
打开集成到Excel中的地理探测器,导入地图转换的表格数据,读取数据,设置X、Y变量,运行地理探测器,最终得到四个探测器的结果数据,分别呈现在Interaction_detector、Ecological_detector、Factor_detector、Risk_detector四个表格内。操作见图6,结果见图7。
图6 地理探测器运行操作
图7 地理探测器运行结果(交互作用探测结果)
因子探测结果为“factor_detector”表格内,见图8。其内容有q、p两个值表示。q表示每一个自变量在多大程度上解释了因变量的空间分异,值越大说明该自变量对因变量的空间分异解释程度越大。图8中可见流域分区(region)因子q值最大,可以说明流域分区(region)这一因子与该区域空间分析关系最大。P值是显著性检验的一个结果,本次实验采用0.05进行显著性检验。
图8 因子探测结果
交互作用探测结果为“Interaction_detector”表格内,见图7。交互作用探测评估因子X1和X2共同作用时是否会增加或减弱对因变量Y的解释力,或这些因子对Y的影响是相互独立的。评估的方法是首先分别计算两种因子X1和X2对Y的q值:q(X1)和q(X2),并且计算它们交互时的q值:q(X1 ∩ X2) ,并对 q(X1)、q(X2)与q(X1 ∩ X2) 进行比较。可以从图7中看出,土壤类型因子(type)与流域分区(region)交互作用,对Y(神经管畸形出生缺陷的发生)的解释力最大。相对于单个因素来看,土壤类型因子(type)与流域分区(region)交互作用比他们单独作用解释力增加。
生态探测结果为“Ecological_detector”表格内,见图9。生态探测用于比较两因子X1和X2对属性Y的空间分布的影响是否有显著的差异。图9可以看出土壤类型因子(type)与流域分区(region)、土壤类型因子(type)与高程因子(level)对Y(神经管畸形出生缺陷的发生)的解释力有显著差异,流域分区(region)与高程因子(level)的解释力没有显著差异。
图9 生态探测结果
风险区探测结果为“Risk_detector”表格内,见图10。风险区探测结果用于判断两个子区域间的属性均值是否有显著的差别。表格1-3行内容表示不同土壤类型的神经管畸形出生缺陷的平均发生率。表格5-11行表示空间分异性是否显著,“Y”表示具有显著差异“N”表示不显著差异。后面表格内容表示其余因子的平均发病率和显著性检验。
图10 风险区探测结果
【参考文献】
[1] Wang JF, Li XH, Christakos G, Liao YL, Zhang T, Gu X & Zheng XY. 2010. Geographical detectors-based health risk assessment and its application in the neural tube defects study of the Heshun region, China. International Journal of Geographical Information Science 24(1): 107-127.
[2]王劲峰,徐成东.地理探测器:原理与展望[J].地理学报,2017,72(01):116-134.
[3]部分来源于网络资料,包括微信公众号文章、新闻报道等其他网络文献来源。此博客仅供相关学习者交流,不进行任何商业活动,如有侵权冒犯,请联系删除。