GIS:地理信息系统(Geographic Information System或 Geo-Information system,GIS)有时又称为“地学信息系统”。地理信息系统是一个可以建立、浏览、查询、分析地理空间数据的软件系统,其功能小至地图的展示,大至空间决策分析与支持。
功能:1.空间数据输入;2.属性数据管理;3.资料展示;4.数据查询;5.资料分析;6.地理模型建立
•ArcGIS
ESRI公司的ArcGIS系列软件已成为中国用户群体最大,应用领域最广的GIS技术平台
功能强大的专业的GIS数据处理工具
•QGIS
Quantum GIS,是一个开源的桌面GIS软件
市面上难得一见一款免费且好用的GIS数据处理工具
矢量数据:矢量式资料以点、线、面构成,来表示真实世界的地理现象。点(point)由一组坐标组成,用符号表示,是最简单的空间地理单元,属于零维空间;线(Line)由一线段或连续线段组成,属一维空间之图征,具有长度、起点和终点。面(Polygon)由线所组成的闭合空间,是一个封闭的多边形,具有面积及周长,属二维空间之图征。矢量模式中的点、线、面都是带有属性的不连续性同质单元,其最大的特点就是在显示时不会失真。
矢量数据(VectorData)是在坐标系中,用各个维度的坐标值(X、Y等)表示位置或描述形状的数据
平常我们称呼的矢量数据,其实是一种包含了空间数据的集合,其中也包含了大量字段属性
矢量数据存储结构:
数据集(dataset) 以特定的文件存储格式,将数据存放在一起
层(layer/table) 一个数据库中包含多个层
字段定义(field) 一个层中可包含多个字段,字段定义用于一次性对数据属性进行描述
数据(Feature) 一个层中可包含多条数据,每条数据都具有字段描述的详细属性
空间对象 一条数据中通常包含一个空间对象
矢量数据存储形式
文件形式:
Shp文件: .shp
Csv文件: .csv
Mapinfo文件:.mif
Sqlite文件: .db
数据库形式:(多层数据)
Oracle
MySql
PostgreSql
栅格数据:栅格数据则是以规律栅格单元(grid of cell)所组成,每一个栅格单元中都记录着一个数值,以不同的数值代表不同类别。其记录方式多以行、列的方式表示。栅格的的大小决定了栅格式数据的分辨率,格子愈小,图形愈清晰,数据愈精准,相对的资料量愈大。此种数据适合用于连续性数据储存,像是数字高程模型、土壤、土地利用等覆盖全地表类的数据。常见的栅格式数据如数值地图、卫星影像、航空照片、数值高程模型等。
矢量数据由于符合真实世界之形貌,比较容易被接受,故建立数据的时间及成本提高,也符合事实之需求。栅格式数据易于分析,比矢量式数据更容易表现地形地貌,所以被广泛应用于自然资源方面的研究计划与管理中。
gdf文件:地理数据文件(Geographical Data File, GDF) 是一种保存地理数据的文件格式,用于描述和传输道路网络和道路相关数据。与传统的GIS数据格式相比, GDF为获取数据及标准特征、属性和关系的扩展分类提供更多详细的规则。
SHP文件
一组SHP文件通常包含后缀名为shp、dbf、shx、prj、cpg、qix、sbn、sbx等的多个文件
•shp文件用于存储矢量数据信息,记录的是每个图形元素的坐标位置信息,在gdal处理时,不可超过4G。文件大小最好控制在2G以内。
•dbf用于存储字段属性与字段值信息,记录的是每个图形元素的特征信息。dbf字段名长度限制为10,字段值长度限制为255 ,文件大小最好控制在2G以内
•shx是一个映射文件,关联shp和dbf,用于记录shp和dbf关联关系,很多情况下,缺失shx仍能正常处理,也能反向生成
•prj记录的是整个文件用到的投影坐标信息。其中prj文件是可选的,其它三个是必需的。
•cpg用于记录dbf的编码方式,可用文本方式查看
•qix是一种形式的矢量数据空间索引
•sbn和sbx是另一种矢量数据的空间索引文件
•基本对象:点(POI)、线(道路)、面(AOI)
•复合对象:多点、多线、多面、空间集合
•空对象(Empty):由于各种原因,存在一种空对象,工作中理论上不应存在,但数据处理时经常遇到这类数据引发的异常,不可忽视
基本对象
•点:点可以用坐标X,Y来确定位置
•线:线可以认为是由连续的直线段组成的曲线,可以用坐标串的集合(X1,Y1,X2,Y2……Xn,Yn)来记录
•面:面通常通过记录面状地物的边界来表现
WKT(Well-Known Text)是一种文本标记语言,用以表示矢量几何对象,空间参照系统,以及空间参照系统之间的转换
WKB(Well-Known binary)是wkt的二进制表达方式。它在传输和存储时占用更少的空间
WKT描述几何对象
•POINT(6 10)
•LINESTRING(3 4,10 50,20 25)
•POLYGON((1 1,5 1,5 5,1 5,1 1),(2 2,2 3,3 3,3 2,2 2))
•MULTIPOINT(3.5 5.6, 4.8 10.5)
•GEOMETRYCOLLECTION(POINT(4 6),LINESTRING(4 6,7 10))
WKT描述空间参照系
GEOGCS[
"GCS_WGS_1984",
DATUM[
"D_WGS_1984",
SPHEROID["WGS_1984",6378137.0,298.257223563]],
PRIMEM["Greenwich",0.0],
UNIT["Degree",0.0174532925199433],
AUTHORITY["EPSG",4326]]
•点:POI,Point of Interest,兴趣点。
地图中的门址,收派件网点、高速出入口,收费站点都属于POI
•线:ROAD,道路。
包括各种高速、城市环线及大小干道、桥梁、隧道等
•面:AOI,Area of Interest,兴趣区域。
包括楼块、小区、公园、绿地、水系等
电子围栏、图幅区域、行政区划
ADCODE
•各省市的行政区域划分,是一种典型的面数据
•ADCODE即行政区号,由中国国家标准化管理委员会制定,用以标志各区域在国家行政级别上的编号,用9位数字表示。国家统计局补充了三位表示居委会、村委会的代码。
*我国公民身份证号码前6位即是出生时户口登记所在地行政区号的前6位
12位的ADCODE结构采用五层数字表示:
•第一层:1~2位 标志省级码(省、自治区、直辖市)
•第二层:3~4位 标志地级码(地级市、地区)
•第三层:5~6位 标志县级码(县、县级市、市辖区)
•第四层: 7~9位 标志乡级码(乡、镇、街道、类似乡级单位)
•第五层: 10~12位 标志村级码(村民委员会、居民委员会、类似村民委员会、类似居民委员会)
6位和15位的ADCODE
•常见的6位ADCODE省略了12位中的后6位
•也有15位的ADCODE,它在12位的基础上追加了3位表示城乡分类的代码
•111表示主城区
•112表示城乡结合区
•121表示镇中心区
•122表示镇乡结合区
•123表示特殊区域
•210表示乡中心区
•220表示村庄
城乡分类代码第1位为1,表示城镇;为2,表示乡村
•质量的中心,二维平面描述下,空间对象视作质量均匀的对象,此时与重心重合
•重心:有重力场时,质量被相互吸引产生的力的集中点
•质心不一定在空间对象内部
•Boundary意为边界,可理解为边缘。
•不同的对象的boundary类型不同。
•点:无Boundary,或理解自己本身就是
•线:线的两个端点
•面:包围面的线
•Envelope也称包络线,是一个由最小x,y和最大x,y值组成的矩形区域,它定义了一个要素的空间范围。 Envelope构成的接矩形平行于x轴和y轴。
•MBR严格意义上讲是包围几何体的最小外接矩形,它不一定平行于x轴和y轴。
•MBR有最小面积外接矩形和最小周长外接矩形之分
•在很多场景下,如果没有同时这两个概念,则将两者视作同一个,即平行于x轴和y轴的最小外接矩形
•凸包:包含空间对象的最小凸多边形
•凸多边形指如果把一个多边形的所有边中,任意一条边向两方无限延长成为一直线时,其他各边都在此直线的同旁
•缓冲区:围绕空间对象周围一定宽度范围内的多边形
•建立缓冲区通常需要两个参数:宽度、导角细分数。宽度决定缓冲区的大小,导角细分数决定了导角位置过渡的平滑度
•缓冲区能在一定程度上反映空间对象环境,在地图渲染和电子围栏中应用广泛
•分离(Disjoin):两个对象包含的点集不存在交集
•相交(Intersect):两个对象包含的点集存在交集
•相邻(Touch):交集为两者boundary的子集
•重叠(Overlap):交集类型与两者类型均相同,并且交集只能是两者子集
•交叉(Cross):与线类型相关的
•包含(Contain) /嵌入(Within):一个对象是另一个对象的子集
•相等(Equal):两者以及交集具有完全相同的对象属性
•Intersection:两个空间对象的交集
•Union:两个空间对象的并集
•空间索引
•类似于一般数据使用的索引,使用某种算法使数据查询更高效
•牺牲一定空间,极大地提高查询速度
•空间索引原理
•使用MBR特性进行初次筛选,后续需再次求证真实位置关系
•存储形式
•文件索引
•内存索引
•数据库的空间索引(文件索引)
•Shapefile的文件索引
•QIX后缀
•SBN后缀
•内存索引常见算法基本思想
•四叉树:查询速度极快,但初次过滤会滤出很多无效对象
•右叉树(R树):查询速度相对四叉树稍慢,但初次过滤更精准
•越来越多的数据库支持空间数据存储,同时也必然支持空间索引,如
•Oracle(OracleSpatial)、
•MySql、
•Sqlite(Spatialite)、
•PostgreSql(PostGIS)
•坐标:在一个参考体系内描述一个点的相对位置
•坐标系:描述这种相对位置的参考体系
地理坐标系:为球面坐标。 参考平面地是椭球面,坐标单位:经纬度;
地心坐标系:地球椭球体中心与重心重合,适应于全球定位,例如WGS84 、 CGCS2000(大地2000)
参心坐标系:地球椭球体中心通常不与重心重合,适用局部相对精确的定位,例如beijing54、xian80
投影坐标系:为平面坐标。参考平面地是水平面,坐标单位:米、千米等
•Web墨卡托投影、BD09MC
典型的地理坐标系:WGS84,WGS84 由美国国防部制图局(Defense Mapping Agency)于 1980 年代所建立的地球参考坐标。以全球地心参考框架和一组相应模型(包括地球重力模型EGM 和WGS84 大地水平面)所组成,全球定位系统(GPS)所采用的坐标系统就是WGS84 坐标
常见厂商使用的坐标系
•谷歌(google):WGS84
•高德:GCJ02
•百度:BD09MC
•四维:GCJ02
•立得:GCJ02(单位为:秒)