地理信息系统(汤国安)重点整理与推导(第三章)

1. 地理空间

地理空间是指地球表面及近地表空间,是地球上大气圈,水圈,生物圈,岩石圈和智慧圈交互作用的区域,地球上最复杂的物理过程,化学过程,生物过程和生物地球化学过程就发生在该区域。

2. 地理空间实体

地理空间实体就是对复杂地理事物和现象进行简化抽象得到的结果,简称空间实体,它们的一个典型特征就是与一定的地理空间位置有关,都具有一定的几何形态,分布状况以及彼此之间的相互关系。

3. 空间实体的基本特征

(1)空间位置特征

表示空间实体在一定的坐标系中的空间位置或几何定义,通常采用地理坐标的经纬度,空间直角坐标,平面直角坐标和极坐标等来表示。空间位置特征也称为几何特征,包括空间实体的位置,大小,形状和分布状况等。

(2)属性特征

属性特征也称为非空间特征或专题特征,是与空间实体相联系的,表征空间实体本身性质的数据或数量,如实体的类型,语义,定义,量值等。属性通常分为定性和定量两种,定性属性包括名称,类型,特性等;定量属性包括数量,等级等。

(3)时间特征

时间特征是指空间实体随着时间变化而变化的特性。空间实体的空间位置和属性包括名称,类型,特性等,定量属性包括数量,等级等。

(4)空间关系特征

在地理空间中,空间实体一般都不是独立存在的,而是相互之间存在着密切的联系。这种相互联系的特性就是空间关系。空间关系包括拓扑关系,顺序关系和度量关系。

4. 空间实体抽象的3个层次

先对现实世界进行抽象,描述和表达,逐步得到概念模型,进而转换为逻辑数据模型和物理数据模型。

概念模型是地理空间中地理事物与现象的抽象概念集,是地理数据的语义解释,从计算机系统的角度来看,它是系统抽象的最高层。构造概念模型应该遵循的基本原则是:语义表达能力强,作为用户与GIS软件之间交流的形式化语言,应易于用户理解,独立于具体计算机实现,尽量与系统的逻辑数据模型保持同一的表达形式,不需要任何转换,或者容易向逻辑数据模型转换。

逻辑数据模型是GIS描述概念模型中实体及其关系的逻辑结构,是系统抽象的中间层。它是用户通过GIS看到的现实世界地理空间。逻辑数据模型的建立既要考虑用户易理解,又要考虑易于物理实现,易于转换成物理数据模型。通常所说的空间数据模型其实是空间数据的逻辑模型。

5. 数据概念模型

地球表面上的各种地理现象和物体错综复杂,用不同的方法或从不同的角度对地理空间进行认知和抽象,可能产生不同的概念模型。许多方法局限于某一范围或反演地理空间的某一侧面,因此,概念模型只能体现地理空间的某一方面。根据GIS数据组织和处理方式,目前地理空间数据的概念模型大体分为3类,即对象模型、场模型和网络模型。

①对象模型

对象模型,也称作要素模型,将研究的整个地理空间看作一个空域,地理现象和空间实体作为独立的对象分布在该空域中。按照其空间特征分为点、线、面、体4中基本对象,对象也可能与其他对象构成复杂对象,并且与其他分离的对象保持特定的关系,如点、线、面、体之间的拓扑关系。每个对象对应着一组相关的属性以区分各个不同的对象。

对象模型强调地理空间中的单个地理现象。任何现象,不论大小,只要能从概念上与其相邻的其他现象分离开来,都可以被确定为一个对象。对象模型一般适合于对具有明确边界的地理现象进行抽象建模,如建筑物、道路、公共设施和管理区域等人文现象以及湖泊、河流、岛屿和森林等自然现象,因为这些现象可看做是离散的单个地理现象。

对象模型把地理现象当做空间要素或空间实体。一个空间要素必须同时符合三个条件;①可被标识②在观察中的重要程度③有明确的特征且可被描述。实体可按空间、时间和非空间属性以及其他要素在空间、时间和语义上的关系来描述。传统的地图是以对象模型进行地理空间抽象和建模的典型案例。

②场模型

场模型,也叫域模型,是把地理空间中的现象作为连续的变量或体来看待,如大气污染程度、地表温度、土壤湿度、地形高度以及大面积空气和水域的流速和方向等。根据不同的应用,场可以表现为二维或三维。一个二维场就是在二维空间R²中任意给定的一个空间位置上,都有一个表现某现象的属性值,即A=f(x,y)。一个三维场是在三维空间R³中任意给定的一个空间位置上,都对应一个属性值,即A=f(x,y,z)。一些现象如大气污染的空间分布本质上是三维的,但为了便于表达和分析,往往采用二维空间来表示。

由于连续变化的空间现象难以观察,在研究实际问题中,往往在有限时空范围内获取足够高精度的样点观测值来表征场的变化。在不考虑时间变化时,二维空间场一般采用6种具体的场模型来描述。

(1)规则分布的点:在平面区域布设数目有限、间隔固定且规则排列的样点,每个点都对应一个属性值,其他位置的属性值通过线性内插方法求得。

(2)不规则分布的点:在平面区域根据需要自由选定样点,每个点都对应一个属性值,其他任意位置的属性值通过克里金内插、距离倒数加权内插等空间内插方法求得。

(3)规则矩形区:将空间区域划分为规则的、间距相等的矩形区域,每个矩形区域称作格网单元。每个格网单元对应一个属性值,而忽略格网单元内部属性的细节变化。

(4)不规则多边形区:将平面区域划分为简单连通的多边形区域,每个多边形区域的边界由一组点所定义;每个多边形区域对应一个属性常量值,而忽略区域内部属性的细节变化。

(5)不规则三角形区:将剖面区域划分为简单连通三角形区域,三角形的顶点由样点定义,且每个顶点对应一个属性值;三角形区域内部任意位置的属性值通过线性内插函数得到。

(6)等值线:用一组等值线内C1,C2...Cn,将平面区域划分为若干个区域。每条等值线对应一个属性值,两条等值线中间区域任意位置的属性是这两条等值线的连续插值。

③网络模型

网络模型与对象模型的某些方面相同,都是描述不连续的地理现象,不同之处在于它需要考虑通过路径相互连接多个地理现象之间的连通情况。网络是由欧式空间R²中的若干点及它们之间相互连接的线段构成,亦即在地理空间中,通过无数“通道”相互连接的一组地理空间位置。现实设计许多地理事物和现象可以构成网络,如公路、铁路、通信线路、管道、自然界中的物质流、能量流和信息流等,都可以表示成相应的点之间的连线,由此构成现实世界中多种多样的地理网络。

由于网络是由一系列节点和环链组成的,从本质上看与对象模型没有本质的区别。按照基于对象的观点,网络模型也可以看成对象模型的一个特例,它是由点对象和线对象之间的拓扑空间关系构成的。因此可将空间数据概念模型归结为对象模型和场模型两类。

6. 空间数据类型

地理信息中的数据来源和数据类型很多,概括起来主要有5种:

①几何图形数据:来源于各种类型的地图和实测几何数据。几何图形数据不仅反映空间实体的地理位置,还要反映实体间的空间关系。

②影像数据:主要来源于卫星遥感、航空遥感和摄影测量等。

③属性数据:来源于实测数据、文字报告或地图中的各类符号说明,以及从遥感影像数据通过解译得到的学信息等。

④地形数据:;来源于地形图等高线的数字化,已建立的格网状的数字化高程模型(DTM),或其他形式表示的地形表面(如TIN)等。

⑤元数据:对空间数据进行推理、分析和总结得到的关于数据的数据,如数据来源、数据权属、数据产生的时间、数据精度、数据分辨率、元数据比例尺、地理空间参考基准、数据转换方法等。

7. 空间关系

空间关系是指地理空间实体之间相互作用的关系。空间关系主要有:

①拓扑空间关系:用来描述实体间的相邻、连同、包含和相交等关系。

②顺序空间关系:用于描述实体在地理空间上的排列顺序,如实体之间前后、上下、左右和东南西北等方位关系

③度量空间关系:用于描述空间实体之间的距离远近等关系。

(1)空间拓扑关系:地图上的拓扑关系是指图形在保持连续状态下的变形(缩放、旋转和拉伸等)但图形关系不变的性质。地图上各种图形的形状、大小会随图形的变形而改变,但是图形要素间的邻接关系、关联关系、包含关系和连同关系保持不变。除了在逻辑上定义节点、弧度和多边形来描述图形要素的拓扑关系外,不同类型的空间实体间也存在拓扑关系。

点线面三种类型的空间实体,它们两两之间也存在着分离、相邻、重合、包含或覆盖、相交5种可能的关系。

(i)点-点关系:点实体和点实体之间只存在相离和重合两种关系。

(ii)点-线关系:点实体和线实体之间只存在相邻、相离和包含(有时也称为相交)3种关系。

(iii)点-面关系:点实体与面实体间存在着相邻(有时也叫相交)、相离和包含3中关系。

(iv)线-线关系:线实体与线实体间存在着相邻、相交、相离、包含和重合5种关系。

  (V) 线-面关系:线实体与面实体间存在着相邻、相交、相离、包含4种关系。

(vi)面-面关系:面实体与面实体间存在着相邻、相交、相离、包含和重合5种关系

空间数据的拓扑关系,对数据处理和空间分析具有重要意义:

①拓扑关系能清楚地反映实体之间的逻辑结构关系,它比几何坐标关系有更大的稳定性,不随投影变换而变化

②利用拓扑关系有利于空间要素的查询

③可以根据拓扑关系重建地理实体

因此在描述空间数据的逻辑数据模型时,通常将拓扑空间关系作为一个主要的内容。

(2)顺序空间关系

顺序空间关系是基于空间实体在地理空间的分布,采用上下、左右、前后、东西南北等方向性名词来描述。同拓扑空间关系的形式化描述类似,也可以按点—点、点—线、点—面、线—线、线—面和面—面等多种组合来考察不同类型空间实体间的顺序关系。由于顺序空间关系必须是在对空间实体间方位进行计算后才能得出相应的方位描述,而这种计算非常复杂,实体间的顺序空间关系的构建目前尚没有很好的解决方法,另外随着空间数据的投影、几何变换,顺序空间关系也会发生变化,所以在现在的GIS中,并不对顺序空间关系进行描述和表达。

从计算的角度来看,点—点顺序关系只要计算两点连线与某一基准方向的夹角即可。同样,在计算点实体与线实体、点实体与面实体的顺序空间关系时,只要将线实体和面实体简化至其中心,并将其视为点实体,按点—点顺序关系进行计算。但这种简化需要判断点实体是否落入线实体或面实体内部。

在计算线—线、线—面和面—面实体间的顺序关系时,情况变得异常复杂。当实体渐渐的距离很大时,此时实体的大小和形状对它们之间的顺序关系没有影响,则可将其转化为点,其顺序关系则转化为点—点之间的顺序关系。

(3)度量空间关系

度量空间关系主要指空间实体间的距离关系。也可以按照拓扑空间关系中建立点—点、点—线、点—面、线—线、线—面和面—面等不同组合来考察不同类型空间实体间的度量关系。

8. 空间逻辑数据模型的定义及作用

作为概念模型向物理数据模型转换的桥梁,是根据概念模型确定的空间信息内容,以计算机能理解和处理的形式,具体地表达空间实体及其关系。

9. 空间逻辑数据模型的分类

针对对象模型和场模型两类概念模型,一般采用矢量数据模型、栅格数据模型、矢量—栅格一体化数据模型、镶嵌数据模型、面向对象数据模型等逻辑数据模型来进行空间实体及其关系的逻辑表达。

10. 矢量数据模型

这是一种产生于计算机地图制图的数据模型,适合于用对象模型抽象的地理空间对象。在矢量数据模型中,点实体用一对空间坐标表示,二维空间中对应为(x,y);线实体由一串坐标对组成,二维空间中表示为(x1,y1),(x2,y2),(xn,yn);面由其边界线表示,表示为首尾相连的坐标串,二维空间中对应为(x1,y1),(x2,y2),(xn,yn),(x1,y1)。每个实体都给定一个唯一标识符来标识该实体。

11. 栅格数据模型

栅格数据模型比较适宜于用场模型抽象表达空间对象,采用面域或空域的枚举来直接描述空间实体。栅格可以用数字矩阵来表示,地理空间坐标隐含在矩阵的行列上。

在栅格数据模型中,点实体是一个栅格单元(cell)或像元,线实体由一串彼此相连的像元构成,面实体则由一系列相邻的像元构成,面实体则由一些列相邻的像元构成,像元的大小是一致的。每个像元对应于一个表示该实体属性的值。若需要描述统一地理空间的不同属性,则按不同的属性将数据分层,每层描述一种属性。当栅格单元太粗糙,未能与空间目标相吻合时,就会丢失某些高分辨率情况下的细节信息。栅格单元的形状通常是正方向,有时也采用矩形。栅格的行列信息和原点的地理位置被记录在每一层中。

栅格的空间分辨率是指一个像元在地面所代表的实际面积大小。

栅格数据模型的一个优点是不同类型的空间数据层可以进行叠加操作,不需要经过复杂的几何计算,但对于一些变换、运算,如比例尺变换、投影变换等则操作不太方便。

12. 矢量—栅格一体化数据模型

矢量数据模型和栅格数据模型在描述和表达空间实体时各有优缺点。将两种数据模型的优点结合起来,构造矢量—栅格一体化数据模型,将有利于地理空间现象的同一表达。

在矢量—栅格数据模型中,对地理空间实体同时按矢量数据模型和栅格数据来表述。面状实体的边界采用矢量数据模型描述,而其内部采用栅格数据模型表达;线实体一般采用矢量数据模型表达,同时将线所经过位置以栅格单元进行充填;点实体则同时描述其空间坐标以及栅格单元位置,这样则将矢量模型和栅格模型的特点有机地结合在一起。

矢量—栅格一体化数据模型一方面保留了矢量数据模型的全部特性,空间实体具有明确的位置信息,并能建立和描述拓扑关系;另一方面又建立了栅格与实体的联系,即明确了栅格与实体的对应关系。从本质上来说,矢量—栅格数据模型是一种以栅格为基础的数据模型,对空间实体及其关系描述的数据量增大。

13. 镶嵌数据模型

镶嵌数据模型采用的是规则或不规则的小面块集合来逼近自然界不规则的地理单元,适合于用场模型抽象的地理现象。通过描述小面块的几何形态、相邻关系及面块内属性特征的变化来建立空间数据的罗家数据模型。小面块之间不重叠且能完整铺满整个地理空间。根据面块的形状,镶嵌数据模型可分为规则镶嵌数据模型和不规则镶嵌数据模型。

①规则镶嵌数据模型

即用规则的小面块集合来逼近自然界不规则的地理单元。在实际应用中,普遍采用正方向或矩形进行地理空间的划分。此时的规则镶嵌数据模型就转化为栅格数据模型。

构造规则镶嵌的具体做法是:用数学手段将一个铺盖网格叠置在做研究的区域上,把连续的地理空间离散为互补覆盖的面块单元(格网)。划分之后,简单化了空间变化的描述,同时也使得空间关系(如毗邻、方向和距离等)明确,可以进行快速的布尔集合运算。在这种结构中,每个网格的有关信息都是基本的存储单元。

从数据结构上来看,规则格网系统的主要优点在于其数据结构为通常的二维矩阵结构,每个格网单元表示二维空间的一个位置,不管是沿水平方向还是沿垂直方向均能方便地遍历这种结构。处理这种结构的算法很多,并且大多数程序语言中都有矩阵处理功能。此外,以矩阵形式存储的数据具有隐式坐标,不需要进行坐标数字化;规则格网系统还便于实现多要素的叠置分析。因而,规则镶嵌是一种重要的空间数据处理工具。

② 不规则镶嵌数据模型

不规则镶嵌数据结构是指用来进行镶嵌的小面块具有不规则的形状或边界。最典型的不规则镶嵌数据模型有Voronoi图(也称Thiessen多边形)和不规则三角网(TIN)模型。当用有限离散的观测样点来表示某地理现象的空间分布规律时,适合于采用不规则镶数据模型。

Voronoi多边形的特点是,组成多边形的变总是与两相邻样点的连线垂直、并且多边形内的任何位置总是离该多边形内样点的距离更近,离相邻多边形内样点的距离远,且每个多边形内包含且仅包含一个样点。

以Voronoi多边形内的样点属性作为整个多边形区域的属性。因此只要给定具有若干空间离散点,根据多边形的构造方法就可以获得完整覆盖地理区域的多边形。表达多边形的顶点位置、多边形各点与顶点的连接关系、多边形间的连接关系,以及多边形包含的样点就可以得到多边形的逻辑数据模型。

除表达地理空间现象外,多边形还可有效地用于许多空间分析问题,如邻接、接近度和可达性分析等,以及解决最近点、最小封闭圆问题。

→→TIN采用不规则的三角形形成对地理空间的完整覆盖。在TIN模型中,样点的位置控制着三角形的顶点,这些三角形尽可能接近等边。TIN能较好地表达地理现象的空间变化,如地形表面就可用三角网拟合,此时三角形看做是空间的三角面片。三角网的优点是,三角形大小随样点密度的变化自动变化,所有样点都称为三角形的顶点,当样点密集时生成的三角形小,而样点较稀时则三角形较大。TIN在表示不连续地理现象时也具有优势,如用TIN表示地形的变化,将悬崖、断层、海岸线、山谷山脊线等作为约束条件,可以构造约束TIN。

→→在TIN模型中,有一种与Voronoi多边形对偶的Delaunay三角网,这是一种满足最大空圆准则的三角网,即任一三角形的外接圆内不包含其他样点。

由样点构成的Delaunay三角网有如下特性:①三角形的网形是惟一的,即点的次序不变;②每一个三角形的内角为可能的最大角度,符合“三角剖分最小内角为最大”的最优化条件。Delaunay三角网可以按照最大空圆准则,根据离散点直接构造。在实际应用中,往往先构造Voronoi多边形或Delaunay三角网,再构造另一种模型。将相邻Voronoi多边形内包含的样点连接起来,即形成Delaunay三角网;对Delaunay三角网的每个三角形计算其外心(各垂直平分线的交点),将相邻三角形的几何中心点两两相连,即可得到Voronoi多边形的边。

对三角网,表达各三角形的顶点位置和属性、顶点与三角形的连接关系、三角形的连接关系,就可以得到TIN的逻辑数据模型。

不规则格网具有某些优越性,主要表现在:可以消除数据冗余,格网的结构本身可适应于数据的实际分布。这种模型是一种变化分辨率的模型,因为基本多边形的大小和密度在空间上是变动的。不规则格网能进行调整,以反映空间每一个区域中的数据事件的密度。这样,每个单元可定义为包含同样多数据事件,其结果是数据越稀,则单元越大;数据越密,则单元越小。单元的大小、形状和走向反映着数据元素本身的大小、形状和走向。

14. 面向对象数据模型

面向对象数据模型应用面向对象方法描述空间实体及其相互关系,特别适合于采用对象模型抽象和建模的空间实体的表达。

面向对象技术的核心是对象和类。对象是指地理空间的实体或现象,是系统的基本单位。一个对象是由描述该对象状态的一组数据和表达它的行为的一组操作(方法)组成的。类是具有部分系统属性和方法的一组对象的集合,是这些对象的统一抽象描述,其内部也包括属性和方法两个主要部分。类是对象的共性抽象,对象则是类的实例。属于同一类的所有对象共享相同的属性和方法,但也可具有类之外的自身特有的属性和方法。类的共性抽象构成超类,类成为超类的一个子类,表示为“is-a”的关系。一个类可能是某些类的超类,也可能是某个类的子类,从而形成类的“父子”关系。

面向对象方法将对象的属性和方法进行封装,还具有分类、概括、聚集、联合等对象抽象技术以及继承和传播等强有力的抽象工具。

(1)分类:分类是把具有部分相同属性和方法的实体对象进行归类抽象的过程。

(2)概括:把具有部分相同属性和方法的类进一步抽象为超类的过程,称为概括。

(3)联合:联合是把一组属于同一类中的若干具有部分相同属性的对象组合起来,形成一个新的集合对象的过程。集合对象中的个体对象称作它的成员对象,表示为“is member of”的关系。联合不同于概括,概括是对类的进一步抽象得到超类,而联合是对类中的具体对象进行合并得到新的对象。

(4)聚集:聚集是把一组属于不同类中的若干对象组合起来,形成一个更高级别的复合对象的过程。复合对象中的个体对象称作它的组件对象,表示为“is part of”的关系。

(5)继承:继承是一种服务于概括的语义工具。在上述概括的概念中,子类的某些属性和操作来源于它的超类。继承有单一继承和多方继承。单一继承是指子类仅有一个直接的父类,而多方继承允许多于一个直接父类。多方继承的现实意义是子类的属性和操作可以是多个父类的属性和操作的综合。

(6)传播:传播是作用于联合和聚集的语义工具,它通过一种强制性的手段将子对象的属性信息传播给复杂对象。也就是说,复杂对象的某些属性值不单独描述,而是从它的子对象中提取或派生。这一概念可以保证数据库的一致性,因为独立的属性仅存储一次,不会因空间投影和几何变换而破坏它的一致性。

基于以上面向对象思想,OCG(open GIS consortium)组织给出了适合于二维空间实体及其关系表达的面向对象空间逻辑数据模型。并以UML(unified modeling language)语言表示。

在实际地理空间对象描述和表达中,按照面向对象方法,对空间实体进行“概括”、“聚集”、“联合”等处理,可得到复杂地理对象的逻辑数据模型。

你可能感兴趣的:(GIS地理信息系统课程整理,知识图谱)