GIS基础知识

1.地理信息系统:

GIS地理信息系统(Geographic Information SystemGeoInformation systemGIS)有时又称为“地学信息系统”。地理信息系统是一个可以建立、浏览、查询、分析地理空间数据的软件系统,其功能小至地图的展示,大至空间决策分析与支持。

功能:1.空间数据输入;2.属性数据管理;3.资料展示;4.数据查询;5.资料分析;6.地理模型建立

2.常用的GIS软件

    ArcGIS     

         ESRI公司的ArcGIS系列软件已成为中国用户群体最大,应用领域最广的GIS技术平台

         功能强大的专业的GIS数据处理工具

    •QGIS

        Quantum GIS,是个开源的桌面GIS软件

        市面上难得一见一款免费且好用的GIS数据处理工具

3.GIS数据格式——矢量数据与栅格数据

矢量数据:矢量式资料以点、线、面构成,来表示真实世界的地理现象。点(point)由一组坐标组成,用符号表示,是最简单的空间地理单元,属于零维空间;线(Line)由一线段或连续线段组成,属一维空间之图征,具有长度、起点和终点。面(Polygon)由线所组成的闭合空间,是一个封闭的多边形,具有面积及周长,属二维空间之图征。矢量模式中的点、线、面都是带有属性的不连续性同质单元,其最大的特点就是在显示时不会失真。

        矢量数据(VectorData)是在坐标系中,用各个维度的坐标值XY等)表示位置或描述形状的数据

        平常我们称呼的矢量数据,其实是一包含了空间数据的集合,其中也包含大量字段属性

矢量数据存储结构:

数据集(dataset     以特定的文件存储格式,将数据存放在一起

层(layer/table)            一个数据库中包含多个层

字段定义(field)           个层中可包含多个字段,字段定义用于一次性对数据属性进行描述

数据(Feature)            个层中可包含多条数据,每条数据都具有字段描述的详细属性

空间对象                    一条数据中通常包含一个空间对象

矢量数据存储形式

    文件形式:

      Shp文件 .shp

      Csv文件:  .csv

      Mapinfo文件.mif

      Sqlite文件: .db

    数据库形式:(多层数据)

      Oracle

      MySql

      PostgreSql

栅格数据:栅格数据则是以规律栅格单元(grid of cell)所组成,每一个栅格单元中都记录着一个数值,以不同的数值代表不同类别。其记录方式多以行、列的方式表示。栅格的的大小决定了栅格式数据的分辨率,格子愈小,图形愈清晰,数据愈精准,相对的资料量愈大。此种数据适合用于连续性数据储存,像是数字高程模型、土壤、土地利用等覆盖全地表类的数据。常见的栅格式数据如数值地图、卫星影像、航空照片、数值高程模型等。

矢量数据由于符合真实世界之形貌,比较容易被接受,故建立数据的时间及成本提高,也符合事实之需求。栅格式数据易于分析,比矢量式数据更容易表现地形地貌,所以被广泛应用于自然资源方面的研究计划与管理中。

4.文件格式

gdf文件:地理数据文件(Geographical Data File, GDF) 是一种保存地理数据的文件格式,用于描述和传输道路网络和道路相关数据。与传统的GIS数据格式相比, GDF为获取数据及标准特征、属性和关系的扩展分类提供更多详细的规则。

SHP文件

    一组SHP文件通常包含后缀名为shpdbfshxprjcpgqixsbnsbx等的多个文件

          •shp文件用于存储矢量数据信息,记录的是每个图形元素的坐标位置信息,在gdal处理时,不可超过4G。文件大小最好控制在2G以内。

          •dbf用于存储字段属性与字段值信息,记录的是每个图形元素的特征信息。dbf字段名长度限制为10,字段值长度限制为255 ,文件大小最好控制在2G以内

          •shx是一个映射文件,关联shp和dbf,用于记录shpdbf关联关系,很多情况下,缺失shx仍能正常处理,也能反向生成

          •prj记录的是整个文件用到的投影坐标信息。其中prj文件是可选的,其它三个是必需的。

          •cpg用于记录dbf的编码方式,可用文本方式查看

          •qix是一种形式的矢量数据空间索引

          •sbnsbx是另一种矢量数据的空间索引文件

5.图幅

6.空间对象

    •基本对象:点(POI)、线(道路)、面(AOI

    •复合对象:多点、多线、多面空间集合

    •对象Empty):由于各种原因,存在一种空对象,工作中理论上不应存在,但数据处理时经常遇到这类数据引发的异常,不可忽视

空间对象的表达

  基本对象

     •:点可以用坐标XY来确定位置

     •线:线可以认为是由连续的直线段组成的曲线,可以用坐标串的集合X1Y1X2Y2……XnYn)来记录

     •:面通常通过记录面状地物的边界来表现

WKT

      WKT(Well-Known Text)是一种文本标记语言,用以表示矢量几何对象,空间参照系统,以及空间参照系统之间的转换

      WKB(Well-Known binary)是wkt的二进制表达方式。它在传输和存储时占用更少的空间

    WKT描述几何对象    

       •POINT(6 10)

       •LINESTRING(3 4,10 50,20 25)

       •POLYGON((1 1,5 1,5 5,1 5,1 1),(2 2,2 3,3 3,3 2,2 2))

       •MULTIPOINT(3.5 5.6, 4.8 10.5)

       •GEOMETRYCOLLECTION(POINT(4 6),LINESTRING(4 6,7 10))

    WKT描述空间参照系

GEOGCS[

  "GCS_WGS_1984",

  DATUM[

  "D_WGS_1984",

  SPHEROID["WGS_1984",6378137.0,298.257223563]],

  PRIMEM["Greenwich",0.0],

  UNIT["Degree",0.0174532925199433],

  AUTHORITY["EPSG",4326]]

工作中的点、线、面

         •点:POIPoint of Interest,兴趣点。

地图中的门址,收派件网点、高速出入口,收费站点都属于POI

         •线:ROAD,道路。

包括各种高速、城市环线及大小干道、桥梁、隧道等

        •面:AOIArea of Interest,兴趣区域。

包括楼块、小区、公园、绿地、水系等

电子围栏、图幅区域、行政区划

ADCODE

           •各省市的行政区域划分,是一种典型的面数据

ADCODE即行政区号,由中国国家标准化管理委员会制定,用以标志各区域在国家行政级别上的编号,用9数字表示。国家统计局补充了三位表示居委会、村委会的代码。

*我国公民身份证号码前6位即是出生时户口登记所在地行政区号的前6

12ADCODE结构采用五层数字表示

第一层:1~2  标志省级(省、自治区、直辖市)

第二层:3~4  标志地级(地级市、地区)

第三层:5~6  标志县级(县、县级市、市辖区)

第四层7~9  标志乡级(乡、镇、街道、类似乡级单位)

第五层10~12  标志村级(村民委员会、居民委员会、类似村民委员会、类似居民委员会)

           6位和15位的ADCODE

常见的6ADCODE省略12位中的后6

也有15位的ADCODE,它在12位的基础上追加了3位表示城乡分类的代码

111表示主城区

112表示城乡结合区

121表示镇中心区

122表示镇乡结合区

123表示特殊区域

210表示乡中心区

220表示村庄

城乡分类代码第11,表示城镇;为2,表示乡村

空间对象的周边属性:质心

    •质量的中心,二维平面描述下,空间对象视作质量均匀的对象,此时与重心重合

 •重心:有重力场时,质量被相互吸引产生的力的集中点

 •质心不一定在空间对象内部

空间对象周边属性:boundary

    •Boundary意为边界,可理解为边缘。

    •不同的对象的boundary类型不同。

点:无Boundary,或理解自己本身就是

线:线的两个端点

面:包围面的线

空间对象周边属性:EnvelopeMBR

Envelope称包络线,是一个由最小x,y和最大x,y值组成的矩形区域,它定义了一个要素的空间范围。 Envelope构成的接矩形平行x轴和y轴。

MBR严格意义上讲是包围几何体的最小外接矩形,它不一定平行于x轴和y

MBR有最小面积外接矩形和最小周长外接矩形之分

在很多场景下,如果没有同时这两个概念,则将两者视作同一个,即平行于x轴和y的最小外接矩形

空间对象周边属性:ConvexHull

凸包:包含空间对象的最小凸多边形

凸多边形指如果把一个多边形的所有,任意一条边向两方无限延长成为直线时,其他各边都在此直线的同旁

空间对象的周边属性Buffer

缓冲区:围绕空间对象周围一定宽度范围内的多边形

建立缓冲区通常需要两个参数:宽度、导角细分数。宽度决定缓冲区的大小,导角细分数决定了导角位置过渡的平滑度

缓冲区能在一定程度上反映空间对象环境,在地图渲染和电子围栏中应用广泛

空间位置关系

分离(Disjoin):两个对象包含的点集不存在交集

相交(Intersect):两个对象包含的点集存在交集

•相邻(Touch):交集为两者boundary的子集

•重叠(Overlap):交集类型与两者类型均相同,并且交集只能是两者子集

•交叉(Cross):与线类型相关的

•包含(Contain) /嵌入(Within):一个对象是另一个对象的子集

•相等(Equal):两者以及交集具有完全相同的对象属性

  •Intersection:两个空间对象的交集

  •Union:两个空间对象的并集

空间索引

空间索引

类似于一般数据使用的索引,使用某种算法使数据查询更高效

牺牲一定空间,极大地提高查询速度

空间索引原理

使用MBR特性进行初次筛选,后续需再次求证真实位置关系

存储形式

文件索引

内存索引

数据库的空间索引(文件索引)

空间索引的存储形式

Shapefile的文件索引

QIX后缀

SBN后缀

内存索引常见算法基本思想

•四叉树:查询速度极快,但初次过滤会滤出很多无效对象

•右叉树(R树):查询速度相对四叉树稍慢,但初次过滤更精准

空间数据库

越来越多的数据库支持空间数据存储,同时也必然支持空间索引,如

Oracle(OracleSpatial)

MySql

Sqlite(Spatialite)

PostgreSql(PostGIS)

7.坐标与坐标系

坐标:在一个参考体系内描述一个点的相对位置

坐标系:描述这种相对位置的参考体系

地理坐标系:为球面坐标。 参考平面地是椭球面,坐标单位:经纬度

        地心坐标系:地球椭球体中心与重心重合,适应于全球定位,例如WGS84 CGCS2000(大地2000)

        参心坐标系:地球椭球体中心通常不与重心重合,适用局部相对精确的定位,例如beijing54xian80

投影坐标系:为平面坐标。参考平面地是水平面,坐标单位:米、千米等

        Web墨卡托投影、BD09MC

典型的地理坐标系:WGS84,WGS84 由美国国防部制图局(Defense Mapping Agency)于 1980 年代所建立的地球参考坐标。以全球地心参考框架和一组相应模型(包括地球重力模型EGM 和WGS84 大地水平面)所组成,全球定位系统(GPS)所采用的坐标系统就是WGS84 坐标

常见厂商使用的坐标系

谷歌(google):WGS84

高德:GCJ02

百度:BD09MC

四维:GCJ02

得:GCJ02(单位为:秒)

 

 

 

 

 

 

 

你可能感兴趣的:(GIS)