在知识传播途中,向涉及到的相关著作权人谨致谢意!
文章目录
- 数据采集
- 考虑因素
- 空间数据采集的方法
- 野外数据采集
- 地图数字化
- 摄影测量方法
- 遥感图像处理方法
- 属性数据采集的方法
- 数据编辑
- 数据处理
- 数学基础变换
- 数据重构
- 图幅拼接
- 拓扑生成
- 点线拓扑关系的建立
- 多边形拓扑关系的建立
- 网络拓扑关系的建立
- 空间数据的简化处理
- 空间数据质量评价与控制
- 相关概念
- 空间数据质量的指标
- 空间数据的误差源及误差传播
- 空间数据质量问题的原因
- 误差类型分析
- 空间数据的质量控制
- 数据入库
数据采集
考虑因素
- 是否能够满足系统功能的需要
- 所选数据源是否已有使用经验(优先选择有经验的,避免陌生数据源)
- 系统成本:数据成本占GIS工程成本的70%甚至更多
空间数据采集的方法
野外数据采集
- 平板测量:获取的是非数字化数据
虽然现在已不是GIS野外数据获取的主要手段,但由于它的成本低、技术容易掌握,少数部门和单位仍然在使用
- 全野外数字测图
全野外空间数据采集与成图分为三个阶段:数据采集、数据处理、地图数据输出。
- 空间定位测量
地图数字化
- 手扶跟踪数字化
- 扫描矢量化
摄影测量方法
【垂直摄影】航测上规定当主轴线与铅垂线方向的夹角小于3°时
【立体摄影测量方法】摄影测量通常采用立体摄影测量方法采集某一地区空间数据
- 对同一地区同时摄取两张或多张重叠的像片
- 在室内的光学仪器上或计算机内恢复它们的摄影方位,重构地形表面,即把野外的地形表面搬到室内进行观测
- 航测上对立体覆盖的要求是当飞机沿一条航线飞行时相机拍摄的任意相邻两张像片的重叠度(航向重叠)不少于55%-65%,在相邻航线上的两张相邻像片的旁向重叠应保持在30%。
遥感图像处理方法
属性数据采集的方法
- 从相关部门的观测、测量数据
- 各类统计数据
- 专题调查数据
- 文献资料数据
- 遥感图像解译
数据来源
国家资源与环境信息系统规范在“专业数据分类和数据项目建议总表”中,将数据分为社会环境、自然环境和资源与能源三大类共14小项,并规定了每项数据的内容及基本数据来源
- 社会环境数据
- 城市与人口
- 交通网
- 行政区划
- 地名
- 文化和通信设施
- 自然环境
- 地形数据
- 海岸及海域数据
- 水系及流域数据
- 基础地质数据
- 资源与能源
- 土地资源相关数据
- 气候和水热资源相关数据
- 生物资源相关数据
- 矿产资源相关数据
- 海洋资源相关数据
属性数据的分类
我国《国土基础地理信息数据分类与代码》(GB/T 13923-1992)
- 将地球表面的自然和社会基础信息分为9个大类
分别为测量控制点、水系、居民地、交通、管线与垣栅、境界、地形与土质、植被和其他类
- 在每个大类下又依次细分为小类、一级和二级类
数据编码方案的制定
- 层次分类编码法:按照分类对象的从属和层次关系为排列顺序的一种代码
【优点】能明确表示出分类对象的类别,代码结构有严格的隶属关系
- 多源分类编码法(独立分类编码法)指对于一个特定的分类目标,根据诸多不同的分类依据分别进行编码,各位数字代码之间并没有隶属关系
数据编辑
图形数据编辑
空间数据采集过程中,人为因素是造成图形数据错误的主要原因
【错误类型】
- 伪节点(Pseudo Node)
- 悬挂节点(Dangling Node)
- 碎屑多边形(Sliver Polygon)
- 不正规的多边形(Weird Polygon)
- 规则的人为对象(栅格、立方体元)
- 其他错误:遗漏某些实体、重复录入某些实体、图形定位错误
【检查方法】
- 叠合比较法
- 目视检查法
- 逻辑检查法
属性数据编辑
【属性数据校核】
- 属性数据与空间数据是否正确关联,标识码是否唯一,不含空值
- 属性数据是否准确,属性数据的值是否超过其取值范围等
【检查方法】
- 首先可以利用逻辑检查,检查属性数据的值是否超过其取值范围,属性数据之间或属性数据与地理实体之间是否有荒谬的组合
- 把属性数据打印出来进行人工校对,这和用校核图来检查空间数据准确性相似
数据处理
数学基础变换
几何纠正
【原因】由于如下原因,使扫描得到的地形图数据和遥感数据存在变形,必须加以纠正
- 地形图的实际尺寸发生变形
- 在扫描过程中,工作人员的操作会产生一定的误差,如扫描时地形图或遥感影像没被压紧、产生斜置或扫描参数的设置不恰当等
- 遥感影像本身就存在着几何变形
- 地图图幅的投影与其它资料的投影不同,或需将遥感影像的中心投影或多中心投影转换为正射投影等
- 扫描时受扫描仪幅面大小的影响,有时需将一幅地形图或遥感影像分成几块扫描
地形图的纠正方法
- 四点纠正法:一般是根据选定的数学变换函数,输入需纠正地形图的图幅行、列号、地形图的比例尺、图幅名称等,生成标准图廓,分别采集四个图廓控制点坐标来完成
- 逐网格纠正法:是在四点纠正法不能满足精度要求的情况下采用的。这种方法和四点纠正法的不同点就在于采样点数目的不同,它是逐方里网进行的,也就是说,对每一个方里网,都要采点
遥感影像的纠正
一般选用和遥感影像比例尺相近的地形图或正射影像图作为变换标准,选用合适的变换函数,分别在要纠正的遥感影像和标准地形图或正射影像图上采集同名地物点。
坐标变换
【坐标变换的实质】是建立两个空间参考系之间点的一一对应关系
投影变换
投影变换必须已知变换前后的两个空间参考的投影参数,然后利用投影公式的正解和反解算法,推算变化前后两个空间参考系之间点的一一对应函数关系
【评价】投影变换是坐标变换中精度最高的变换方法
仿射投影
【仿射变换】是在不同的方向上进行不同的压缩和扩张,可以将球变为椭球,将正方形变为平行四边形,如下图图所示
相似变换
【相似变换】是由一个图形变换为另一个图形,在改变的过程中保持形状不变(大小可以改变)。在二维坐标变换过程中
- 平移:是将图形的一部分或者整体移动到笛卡尔坐标系中另外的位置
- 旋转
- 缩放:缩放操作可用于输出大小不同的图形
橡皮拉伸
【橡皮拉伸缩】通过坐标几何纠正来修正缺陷
主要针对几何变形,通常发生在原图上
它们可能由于在地图编绘中的配准缺陷、缺乏大地控制或其它各种原因产生
栅格数据重采样
【重采样】是栅格数据空间分析中处理栅格分辨率匹配问题的常用数据处理方法
【问题背景】进行空间分析时,用来分析的数据资料由于来源不同,经常要对栅格数据进行何纠正、旋转、投影变换等处理,在这些处理过程中都会产生重采样问题
最邻近像元法
直接取与P(x,y)点位置最近像元N的值作为该点的采样值,即:I(P)=I(N)
N为最近点,其坐标值为:
xN = INT(x + 0.5)
yN = INT(y + 0.5)
INT表示取整
双线性插值法
双三次卷积法
当推广到双三次多项式时,采用分块方式,每一分块可以定义出一个不同的多项式曲面,当n次多项式与其相邻分块的边界上所有n-1次导数都连续时,称之为【样条函数】
数据重构
【数据重构】
- 数据结构的转换
通用的空间数据结构有栅格和矢量两种,在地理信息系统中,它们之间的相互转换是经常性的
- 数据格式转换
GIS在其发展过程中,出现了很多研究机构和企业,它们所使用的数据格式往往不尽相同。为了实现相互之间的数据和资源共享,需要对数据格式进行转换。
数据结构的转换
矢量数据 转 栅格数据
栅格数据 转 矢量数据
- 从图幅西北角开始,按顺时针或逆时针方向,从起始点开始,根据八个邻域进行搜索,依次跟踪相邻点,找出线段经过的栅格
- 将栅格(i,j)坐标变成直角坐标(X,Y)
- 生成拓扑关系,对于矢量表示的边界弧段,判断其与原图上各多边形的空间关系,形成完整的拓扑结构,并建立与属性数据的联系
- 去除多余点及曲线圆滑:常用的算法有线性叠代法、分段三次多项式插值法、正轴抛物线平均加权法、斜轴抛物线平均加权法、样条函数插值法等
数据格式转换
【数据交换的模式大致有四种】
- 外部数据交换模式
- 直接数据访问模式
- 数据互操作模式
- 空间数据共享平台模式
【数据转换分为三类】
- 分层和编码原则都不同的数据转换
- 分层不同,编码原则相同的数据转换
- 分层不同,编码方案完全一致的数据转换
【空间数据格式转换的途径有】
- 外部文件交换方式
GIS产商转成自己软件的外部文件,再进行转换
- 标准空间数据交换方式
不同的GIS产商转成中间的交换格式,再进行转换
- 空间数据互操作方式
Open GIS的思想是实现不同GIS软件系统之间空间数据的互操作
不同的GIS厂商提供转换成自己的标准API函数
- 基于语义数据转换方式
基于语义层次上的空间数据转换,除了数据结构的转换外,更重要的是对语义数据模型的转换和操作,更注重数据所蕴含的知识背景。语义转换模型与传统数据转换有很大的不同
图幅拼接
几何接边
【几何裂缝】指由数据文件边界分开的一个地物的两部分不能精确地衔接 --> 几何接边
逻辑接边
【问题】逻辑裂缝:同一地物地物编码不同或具有不同的属性信息,如公路的宽度,等高线高程等 --> 逻辑接边
【逻辑接边】
- 检查同一地物在相邻图幅的地物编码和属性值是否一致,不一致,进行人工编辑。
- 将同一地物在相邻图幅的空间数据在逻辑上连在一起。
拓扑生成
点线拓扑关系的建立
- 在图形采集和编辑中实时建立,此时有两个文件表,一个记录结点所关联的弧段,一个记录弧段两端点的结点
- 在图形采集与编辑之后,系统自动建立拓扑关系。在执行过程中逐渐建立弧段与起终结点和结点关联的弧段表。
多边形拓扑关系的建立
【多边形的三种情况】
- 独立多边形:它与其他多边形没有共同边界,如独立房屋,这种多边形可以在数字化过程中直接生成,因为它仅涉及一条封闭的弧段
- 具有公共边界的简单多边形,在数据采集时,仅输入了边界弧段数据,然后用一种算法自动将多边形的边界聚合起来,建立多边形文件
- 嵌套的多边形,除了要按第二种方法自动建立多边形外,还要考虑多边形内的多边形
网络拓扑关系的建立
确定结点与弧段之间的拓扑关系,其方法与建立多边形拓扑关系时相似,只是不需要建立多边形。但在一些特殊情况下,两条相互交叉的弧段在交点处不一定需要结点,如道路交通中的立交桥,在平面上相交,但实际上不连通,这时需要手工修改,将在交叉处连通的节点删除。
空间数据的简化处理
【数据简化】是从数据集合S中抽出一个子集A,这个子集作为一个新的信息源,在规定的精度范围内最好地逼近原集合,同时取得尽可能大的压缩比。
栅格数据压缩
游程编码、四叉树法
矢量数据简化
实际上是对原矢量坐标串中的多个矢量点根据曲线形态,减少数据点
实体线对象的简化
-
间隔取点法
比较相邻两特征点的距离与阈值的大小,确定 是否保留或舍弃?
-
垂距和偏角法
利用曲线上顺序的3点Pn-1,Pn,Pn+1,将Pn-1与Pn+1相连,计算Pn到Pn+1的垂直距离(垂距法)或Pn-1Pn 与PnPn+1直线的夹角(偏角),并规定限差,决定点的取舍。
【举例】Douglas Peucker算法:
双线中心线生成
【举例】根据道路边线抽取道路中心
多边形消融
消除具有相同属性相邻多边形的公共边界
空间数据质量评价与控制
【空间数据质量】是指数据对特定用途的分析和操作的适用程度,与空间分辨率或制图比例尺有关
相关概念
- 【准确性(Accuracy)】 一个记录值(测量或观察值)与它的真实值之间的接近程度
- 【数据的精密度(Precision)】对某一量的多次观测,各观测值的离散程度
- 【分辨率(Resolution)】两个可测量数值之间最小的可辨识的差异
- 【比例尺(Scale)】地图上两个点间图面距离和它所表现的真实世界的距离之间的一个比值
- 【误差(Error)】表示数据与其真值之间的差异
- 【不确定性(Uncertainty)】关于空间事物、现象的特征和过程不能被准确地确定的程度
空间数据质量的指标
- 数据情况说明(source /lineage)
- 位置精度(metric accuracy)
- 属性精度(attribute accuracy)
- 时间精度(temporal accuracy)
- 逻辑一致性(logical consistency)
- 数据完整性(completeness)
- 数据相容性(compatibility)
- 数据可得性(accessibility)
- 表达形式的合理性(reasonability)
空间数据的误差源及误差传播
空间数据质量问题的原因
- 空间现象自身存在的复杂性、不稳定性和模糊性 ;
- 空间数据的获取和表达所产生的质量问题;
- 空间数据处理过程中产生的空间数据质量问题;
- 空间数据应用中产生的空间数据质量问题。
误差类型分析
【空间数据误差】包括几何误差、属性误差、时间误差和逻辑误差四大类
空间数据的质量控制
空间数据质量控制方法
- 传统的手工方法
- 元数据方法
- 地理相关法
数据质量控制应体现在数据生产和处理的各个环节
- 数据源的选择 ;
- 数字化过程的数据质量控制:
- 数据预处理;
- 数字化设备的选用;
- 数字化对点精度(准确性) ;
- 数字化限差 ;
- 数据的精度检查
数据入库
数据的入库流程
元数据
元数据与元数据的作用
- 帮助用户了解和分析数据
- 空间数据质量控制
- 在数据集成中的应用
- 数据存贮和功能实现