距离上次更新又过去了一个星期,都不知道更新啥了,借着上次买了一个教程视频,加上以前看过很多的论文中,觉得地理加权回归GWR模型很实用,就想着出了这一期推送。
这一个星期,我们寝室在周六周天一起出去玩了两天,第一天租了gofun小汽车,去宁波山里小溪泡了个澡,第二天用神州租车租了SUV去了趟绍兴,我还在城区开了两趟车,感觉车技亟待联系和提高,当然晚上还住了一家庭套房,只感叹还是要努力挣钱啊。还有就是出去记得带上身份证。。。。
回学校了,建工又催着搬实验室,不知道实验9月底能否做完啊,比较测个氮磷钾都需要七八天的样子,关键是没有稳定的环境,无法安心做实验,只能等把实验室搬到植物园了,才能安安心心做实验吧。前天实验室还被淹了,铲了一下午水,都快离开建工了,这是多催我们搬走啊。
研一研二承蒙师兄师姐照顾,我的师姐马上就去南京大学读博了,师门一起昨天晚上给师姐送行,带着一大波农贸买的菜,果然是想的多吃得少,还带了一大盆菜回来。师姐也离开了,我们也是升为研三的大师兄大师姐了,三年时间很长也很短,相遇就是缘分。记得第一次大鹏师兄、改丽师姐和佰香师姐带着我们研一的三个去鸡公煲吃饭的场景,还是很深刻,师姐好像说过他们仨很好相处,的确是的呢,虽然相处时间也不是特别久,但依然感觉感情很深厚。只期望今朝一别,各自珍重,前途似锦,未来可期,虽在不同地方,但都在为自己心中的那个梦努力着。
好了进入今天的正题,这期推送主要为普通最小二乘法OLS与地理加权回归GWR模型的ArcGIS软件操作,主要可以做分析某影响因素的时空特征及影响因素的解释能力,在论文写作中要探析具有地理空间异质性的影响因素,这种方法较好适用。
普通最小二乘法(Oordinary least squares)是一种统计学习优化技术,它的目标是最小化误差平方之和来作为目标,从而找到最优模型,这个模型可以拟合(fit)观察数据。网上关于OLS的介绍较多,这里不多详细介绍(https://blog.csdn.net/iterate7/article/details/78992015)。
地理回归加权模型:传统线性回归模型只表示参数的“平均”效果,然而地区各市经济发展不均衡,资源禀赋存在差异,为得出更加符合实际的结论,引入地理加权回归模型(Geographically Weighted Regression,简称 GWR),该方法将数据的空间特性纳入模型中,扩展了传统回归,容许局部参数随着空间位置变化,探索影响因素在不同地理位置的空间变异特征及规律。(关伟,郝金连.东北地区旅游经济影响因素时空特征研究[J].地理科学,2018,38(6):935-943.)
1数据介绍
当前很多做区域某影响因素的时空特征研究,主要方法就是先分析空间关联特征(空间自相关),运用OLS和GWR模型各变量的关系,以及比较OLS和GWR模型的拟合优度(GWR模型拟合优度优于OLS)。这期推送以某街区步行事故次数为因变量Y,利用OLS与GWR模型,选取了11个独立变量X1、X2、X3…X11,即用来解释因变量Y,矢量数据来自于某宝。如下图所示,共938个街区,也即研究对象938个,各街区矢量矢量表里面都对应了因变量和独立变量。
2.软件操作
(1)OLS操作界面
普通最小二乘法OLS一般在SPSS里面运行即可,当然也可以在arcgis里面操作,位于空间统计工具下面的空间关系建模,界面如下:
输入要素类:输入街区数据;
唯一ID字段:一般自动选取属性表里面的唯一字段;
输出要素类:更改输出位置;
因变量:即Pedin,步行事故次数;
解释变量:即11个独立变量;
输出报表文件:输出OLS报告;
其它选项里面的系数输出表与诊断输出表,也输出到相应位置。
点击确定即可得到结果。
最后生成了OLS结果,以及两个系数表,及一个Pdf的一个报告。
读一下这个报告:
输出报表里面的数字较多,每个系数有不同的含义,但主要看的也就几个系数:
变量系数Coefficient:主要反映各解释变量X1、X2、X3…X11对因变量Y的解释大小,数值大小判断以及数值的正负确定正影响还是负作用。
拟合优度R_adjusted:位于0-1之间,越接近于1,表明拟合优度越好,该数据的R2为0.677224,即独立变量对因变量的解释能力为68%左右。
VIF共线性检验,临界值为7.5,如果某解释变量的VIF大于7.5.,则表明共线性存在,需要剔除该变量。
probability值, P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P <0.05 为有统计学差异, P<0.01 为有显著统计学差异,P<0.001为有极其显著的统计学差异。
当Koenker显著时,看robust的显著性;反之看常规显著性。Koenker值表明的是某一变量在某一区域明显,而在某一区域不明显,即空间异质性明显。如果K值显著,则可以考虑做一下地理加权回归。
ACI:拟合效果指标,越小越好。如果两个拟合优度大于3,则表明小的ACI模型更好。
输入:输入街区;
因变量:即Pedin,步行事故次数;
解释变量:即11个独立变量;
输出:选择相应文件夹;
系数栅格选取:输出文件夹;
其它按默认就好,稍等几分钟就好。
结果解读:
运行完成后的GWR,会出现一个总的GWR结果,及11个解释变量的结果,下图为GWR的结果。属性表里面是包括11个解释变量的系数、R2、标准差,也可以通过系数来展示11个解释变量的系数空间分异图。而生成的11个栅格图分别为11个解释变量的单独展示。
此外还生成了一个GWR表格,里面包括基本的系数,包括系数、R2、标准差、ACI,上面也说的ACI 的比较,如例子中OLS的ACI值为1527.66,而GWR的ACI值为1136.60,相比较GWR的拟合优度远大于OLS。
以上也就是这期的主要内容了,感谢大家关注,马上就要开学咯,下个星期再见。