如何利用Arcgis进行地统计学分析(二):探索性数据分析

地统计学的相关介绍及概念参考上篇博客:

如何利用Arcgis进行地统计学分析(一):地统计学分析概念及其分析流程_小咖~的博客-CSDN博客

 探索性数据分析是为了让用户更深入地认识研究对象,从而对与其数据相关的问题做出更好的分析与决策。

    使用插值方法之前,应先使用探索性空间数据分析工具浏览数据,确定数据属性,探测数据分布、查找异常值、分析全局变化趋势、研究空间自相关和理解多种数据集之间相关性,为插值模型选择最适合的方法和参数。

    探索性空间数据分析工具主要包括:

    1. 直方图

    2. QQPlot分布图

    3. Voronoi图

    4. 趋势分析

    5. 半变异函数与协方差云

    6. 交叉协方差

本文基于点文件(shp文件),利用arcgis提供的探索性分析工具箱进行探索性分析,不同的分析工具分析的属性不同,根据需要进行分析。

1.直方图分析

直方图(Histogram)是对采样数据按一定的分级方案(等间隔分级、标准差分级等)进行分级,统计采样点落入各个级别中的个数或占总采样数的百分比,并通过条带图和柱状图表示出来。它显示了数据集的频率分布,并计算了汇总统计数据,可以用来检验数据分布和寻找数据离群值(当个别数据与群体数据严重偏离时,被称为离群数据)。

    ArcGIS操作步骤:1.打开扩展模块,单击ArcMap菜单栏上“Customize”|“Extensions”命令,弹出对话框,选中Geostatistical Analyst的复选框。

    2.添加“Geostatistical Analyst”工具条,选择“Explore Data”|“Histogram”。

    3.选择“ca_ozone_pts”图层的“OZONE”属性,查看数据直方图。

如何利用Arcgis进行地统计学分析(二):探索性数据分析_第1张图片

结果分析:通过柱状图表现出来了各个采样点落入各个级别中的比例,直方图也是正态分布的一种检验方式,该直方图展示了采样数据基本服从正态分布。

2.QQPlot分布图

QQPlot分布图是可以将现有数据的分布与标准正态分布对比,从而来分析和评价现有数据,包括正态QQ分布图和常规QQ分布图。如果数据图形越接近一条直线,则它越接近于服从正态分布。

    正态QQ分布图是将已知数据集与正态分布数据集进行比较,检查数据的正态分布情况。

    常规QQ分布图对两个数据集进行比较,评估两个数据集分布的相似程度。

   2.1 正态分布QQ分布图:

    ArcGIS操作步骤:1. 点击“Geostatistical Analyst”工具条,选择“Explore Data”|“Normal QQPlot”。

    2.选择“ca_NO2_pts”图层的“NO2AAM”属性,查看QQPlot分布图。

如何利用Arcgis进行地统计学分析(二):探索性数据分析_第2张图片

正态分布QQ分布图结果分析:

 数据图形越接近一条直线,表明它接近于服从正态分布。

2.2常规QQ分布:

ArcGIS操作步骤

1. 点击“Geostatistical Analyst”工具条,选择“Explore Data”|“General QQPlot”。

2.选择“ca_ozone_pts”图层的“OZONE”属性与“ca_NO2_pts”图层的“NO2AAM”属性,查看常规QQ分布图。

如何利用Arcgis进行地统计学分析(二):探索性数据分析_第3张图片

结果分析

通过对“ca_ozone_pts”与“ca_NO2_pts”两个数据集进行比较,数据图形越接近一条直线,说明两个数据集分布的相似程度高。

3.Voronoi图(Voronoi Map)

Voronoi图(泰森多边形)是由样点以及样点周围的一系列多边形所组成。

多边形生成的要求就是多边形内任何位置距这一样点的距离都比到其他样点的距离要近。

ArcGIS操作步骤

1. 点击“Geostatistical Analyst”工具条,选择“Explore Data”|“Voronoi Map”。

2.选择“ca_pm10_pts”图层的“PM10AGM”属性,Clip Layer项选择“ca_outline”,Type项选择“Simple”,查看Voronoi图。

如何利用Arcgis进行地统计学分析(二):探索性数据分析_第4张图片

4.趋势分析(Trend Analysis)

趋势分析用一个三维视图来探察空间数据。样品点分布在X、Y平面上,在每一个样品点上,以一个平行于Z轴的线段表示样品点的值。将样品点的值分别投影到X、Z平面和Y、Z平面上形成散点图。通过这些散点可以做出一条最佳拟合线,并用它来模拟特定方向上存在的趋势。若拟合线是平的,则不存在趋势;如果拟合线不是平的,说明数据存在某种趋势,那么在创建表面时要使用确定性插值方法(如全局或局部多项式法),或在使用克里金法时移除这种趋势。

ArcGIS操作步骤:

1. 点击Geostatistical Analyst”工具条,选择“Explore Data”|“Trend Analysis”。

2.选择“ca_pm10_pts”图层的“PM10AGM”属性,可以设置“Number of Grid Lines”来调整网格线数量,查看趋势分析效果图。

如何利用Arcgis进行地统计学分析(二):探索性数据分析_第5张图片

结果分析:蓝线表示南北方向,呈水平,可见南北方向无趋势。绿线表示东西方向,呈倒"U"形,可用二阶曲线拟合

5.半变异/协方差函数云(Semivariogram/Covariance Cloud)

半变异/协方差函数云表示的是数据集中所有样点对的半变异值和协方差,并把它们用两点间距离的函数来表示,用此函数作图来表示。

    半变异函数有三个表征空间变异特征的参数:基台值(still)、块金值(nugget)和变程(range)。可以反应数据的空间相关程度,只有数据空间相关,才有必要进行空间插值法。图表的横坐标表示任两点的空间距离,纵坐标表示该两点的半变异函数值。根据距离越近越相似的原理,因而x值越小,y值应该越小。

如何利用Arcgis进行地统计学分析(二):探索性数据分析_第6张图片

ArcGIS操作步骤

点击“Geostatistical Analyst”工具条,选择 Explore Data|“Semivariogram | Covariance Cloud”。

设置分析的图层,以及属性值,分别切换“Semivariogram”与“Covariance”选项卡

查看半变异/协方差函数云效果。

如何利用Arcgis进行地统计学分析(二):探索性数据分析_第7张图片

结果分析:

    如果存在空间相关性,则距离较近的点对(在 x 轴的最左侧)应具有较小的差值(在 y 轴上的值较小)。随着各个点之间的距离越来越大(点在 x 轴上向右移动),通常,差值的平方也应随之增大(在 y 轴上向上移动)。通常,平方差超过某个距离后就会保持不变。超过这个距离的位置对被视为不相关。

6.正交协方差云(Crosscovariance Cloud)

正交协方差函数云表示的是两个数据集中所有样点对的理论正交协方差,用于多数据集协变分析。

 通过分析多因素(数据集)关联特征,在地统计空间分析中可以有效利用这种相关特征增强建模效果,如协同克里格插值分析。

如何利用Arcgis进行地统计学分析(二):探索性数据分析_第8张图片

你可能感兴趣的:(ArcGIS,GIS,arcgis,数据分析,数据挖掘)