新坑!!!
本系列文章主要参考CHICAGO大学的空间数据科学中心的相关课程( ̄∇ ̄)/感谢分享~
空间分析不仅仅是指做一个地图这么简单,而是为这些位置空间添加实际的值,并通过对这些值的转换、计算等操作,以及应用一些分析方法来获取/发现更深层面的地理空间知识,使这些数据超越地图️本身。
从原始数据转化成信息,然后演变成知识,甚至有可能演变智慧。
事件的发生在空间上有什么分布特征,不同区域之间的差异性和关联性等
决定在这个位置发生的背后原因是什么(因果关系)
某些事件发生在某个区域是如何影响该区域的其他因素的,反之,该区域的其他因素又是如何影响这些事件的(相互作用)
如何利用空间分析来优化决策,比如你想开一家医院,在什么地方开会比较好,等等问题
空间分析中涉及到两类数据:一类是与地理位置相关的,一类是我们更熟悉的常规值和变量(属性信息)。
在非空间分析中,位置并不重要,这称为位置不变性,即即使你在空间中任意排列事物,结果是相同的。
而在空间分析中,改变位置会导致结果发生变化。
空间分析其实是一种数据科学(即是从数据中挖掘知识)
简单地说就是地理和科学的结合。
如果,那么这就定义了空间数据科学
计算社会科学已经将计算视为除了实验和观察之外的科学发现的第三种方法,例如模拟技术(simulation)、机器学习(machine learning)、数据挖掘(data mining)、视觉数据探索(visual data exploration)等。此外,随着数据驱动科学的第四范式的发展,大量的公司将数据用于科学研究,进一步进行产业化应用。而数据科学正是包括统计计算以及如何访问、转换、操作、探索、可视化和推理数据等方面,以挖掘出有用的信息、见解和应用模式的研究。
有一种比较有趣的说法,形容数据科学是黑客技术+数学/统计学知识+实质性专业知识三者的交集(如下图)。
简单理解,当正在分析和用于推断见解的数据本质上是空间数据,那么就构成了空间数据科学,But!标准数据科学和空间数据科学有一个很重要但常常被忽视的一个区别:
如何区分标准数据科学(standard data science)/ 常规分析 (regular analysis)和空间数据科学(spatial data science)/ 空间分析(spatial analysis)?
空间数据科学可以视为通用数据科学的子集,而标准数据科学和空间数据科学的区别是对于标准数据科学来说,空间数据只是一个附加的变量(不影响使用的分析方法),但是真正的空间数据科学是把距离位置、空间交互视作数据的核心方面,并因此采用专门的方法和软件对数据进行存储(store)、检索(retrieve)、探索(explore)、分析(analyze)、可视化(visualize) 和学习(learn)。即并不是说在机器学习中使用了经纬度就算得上是空间分析了,而是这些空间相关的变量变成了方法中的一部分,它们对你所使用的方法(methodology)产生了影响,这才能称之为真正的空间数据科学。
如下流程图展示了数据科学的基本处理过程:
我们解释下这个流程图:原始数据输入以后进行清洗(clean up),然后进入一个循环♻️(可视化、转换、建模进行循环交互),直到有你获得了一些推断见解,进而去向世界传达分享所发现的见解。