海量空间数据库实施策略--矢量数据1

这个系列涉及到的是海量矢量数据库的各个方面,包括入库,管理,效率等各个方面。先从序言开始吧:

序言主要包括以下三个方面:

1. 什么是GDB

2. 什么样子的数据算是海量数据

3. 谁能胜任

先看看什么是GDB,GDB全称为GeoDatabase,即空间数据库,实际就是用来存储,查询,管理空间数据的数据库或者文件。ESRI的产品现在支持以下几方面的存储:

A. Personal GDB(Access)

B. File GDB

C. 关系型数据库

    现在的ArcSDE一共支持五种关系型数据库,分别是,

    Informix

    Oracle

    DB2

    PostgreSQL

    Oracle

然后再看看什么样子的数据算是海量数据,海量数据有一个共同的特点,那就是数据量大,那是不是数据量大的空间数据库都属于海量呢,不一定,下面的表格可以说明一些问题:

我现在有一个图层的数据,其数据量为1Tbytes,但是会有以下几种情况组成这个图层:

 

一共分为7中情况,Feature的数量分别从500一直到500000000,每个Feature的大小分别从2G到2K,针对这7种类型,其中第一个类型是最容易处理的,最后一种情况是最难处理的。

如对这7中情况的数据分别建立一下空间索引,所耗费的时间的长短一定是第一种情况所耗费的时间最短,最后一种情况所耗费的时间是最长的。

因此我认为第一种情况的数据并不能算作海量数据。

那到底谁能胜任这个海量数据的存储以及管理任务,

personal GDB:因为Access数据库的最大存储量只有2G,因此其并不能胜任这个任务。

file GDB: 其没有存储大小的限制,其并发读的效率很高,但是不能同时写,因此并不适合多人进行编辑的业务,有点NoSQL的感觉

剩下的就是ArcSDE所支持的这5种类型的关系型数据库,除了informix没有进行测试外,其它五种类型的数据库都进行过相关的测试,是可以胜任的。

你可能感兴趣的:(数据库,NoSQL,存储,PostgreSQL,Access,Informix)