数据整合2018-12-26


什么是数据整合?

数据整合就是把不同数据源的数据收集、整理、清洗、转换后加载都一个新的数据源,是为了给用户提供统一数据视图的解决方案。

首先它是一种过程,在这个过程中可能会发生合并、重构,数据结构一样的可以合并,不一样的则需要先将它变成一样的,然后再进行重构。


什么是数据集成?

数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机(完整)的集中。

不同来源的数据如果是各个国家,那数据集成就是给这些国家中放一个联合国。


什么是数据共享?

数据共享是让不同地方使用不同计算机、不同软件的用户能读取他人分享的数据并进行操作。

数据共享简单的来讲,就是要将数据进行共享。它本就应该这么理解,你数据共享就是让人共同享用数据,至于会遇到什么问题?谁来解决?用什么方法解决?就不关数据共享的事了。

什么是空间数据?

空间数据又称为几何数据,它用来表示物体的位置、形态、大小分布等各方面信息,是对现实世界中存在的具有定位意义的事物和现象的定量描述。根据计算机系统中对于现实事物的存储组织、处理方法不同,以及空间数据本身的几何特征,空间数据又可分为图形数据图像数据

空间数据是随着时间变化了,而变化是有规律的。

空间数据实际上是更全面的定量描述信息。它能够描述一个人在哪(坐标信息)、属于哪个国家、哪个城市、此人的形状、颜色、体积、身高、生成日期、智商、能力指数等等等等。这个只是举个例子。其实像我们使用地图时,你的定位信息和周围的路段、建筑、商家信息都是从空间数据中取到的,国家有一个专门存储空间信息的仓库,并有一个对不同领域的空间数据进行管理的交换中心。

图形数据和图像数据的区别是,图形数据的显示是二维的,图像的显示是三维的。


什么是定量描述?

定量描述就是,你描述一个物体的内容可以用于计算。


什么是数据交换?

数据交换是为了实现数据共享的一种手段,手段实现是这样的,有一个管理者,它控制着所用部门数据的调用,a部分想使用b部门的数据,管理者就给他b部门的数据,b部门想使用a部门的数据,管理者就给他a部门的数据,不论是a还是b,在他们使用别人的数据的时候,同时也允许别人来访问自己的数据,这个就是交换行为,所以称为数据交换.


数据整合和数据集成有什么区别?

在我看来它们的目的是一样的,区别在于面向的对象不同,集成面向的对象是能够独立运行的,集成只需要建立数据交互的连接就行。而整合面向的对象可能不能够独立运行,但整合起来就能形成一套完整的系统。


什么是分布式?

分布式是计算机的一种算法,更是一种解决问题的思想,有一个故事就能很好的说明这个概念.古时候有人送给曹操一只大象,曹操想知道这只大象有多重,这就难住了在场所有大臣——上哪找这么大的称去?上哪找这么大的秤砣去?上哪找这么大的称杆去?这么大一只象谁能把它放在称上呀?在场有一个小家伙,名叫曹冲,它懂得分布式的思想,那就把没法计算的大目标,分成可计算的小目标,不能分大象,因为大象骨肉分开会死,于是他利用水的浮力找到了和大象一样重的石头,然后把石头分成很多份来称,最终将结果相加,就得到了大象的重量。这就是分布式思想,这个故事应该叫"首次分布式称重"。

你可能感兴趣的:(数据整合2018-12-26)