异构数据的整合

每一个组织都存在众多的下属机构,每个下属机构都保存维护着自己相对独立的信息数据,而决策制定人员需要关心的是全局的、一致的、完整的信息。这种全局数据就需要从各个下属机构保存的异构数据中进行提取、清洗、转换,最后装载到一个统一标准的结构当中,这一过程称为异构数据的整合

异构数据顾名思义就是不同结构的数据,异构数据体现在五个层次上:

1.计算机体系结构的异构;数据的物理存储来源于不同体系结构的计算机中,如:大型机、小型机、工作站、PC或嵌入式系统中。
2.操作系统的异构;数据的存储来源于不同的操作系统,如:Unix、Windows、Linux、OS/400等。
3.数据格式的异构;数据的存储管理机制不同,可以是关系型数据库系统,如:Oracle、SQL Server、DB2等,也可以是文件行二维数据,如:txt、CSV、XLS等。
4.数据存储地点异构;数据存储在分散的物理位置上,此类情况大多出现在大型机构中,如:销售数据分别存储在北京、上海、日本、韩国等多个分支机构的本地销售系统中。
5.数据存储的逻辑模型异构;数据分别在不同的业务逻辑中存储和维护,从而相同意义的数据存在表现的异构;如:独立的销售系统和独立的采购系统中存在部门的编码不一致等。


异构数据往往不是一个层面的异构,而是在多个层面上都存在异构。

异构数据整合的目标就在于实现不同结构的数据之间的数据信息资源、硬件设备资源和人力资源的合并和共享。其中关键的一点就是以分散的局部的数据为基础,通过各种工具和处理逻辑建立全局的统一的数据或视图。
101 异构数据采集技术的原理是通过获取软件系统的底层数据交换和网络流量包,进行包流量分析和使用仿真技术采集到应用数据,并且输出结构化数据。所以,它能做到无需软件厂商接口,异构数据直接采集,解决了和厂商协调难、接口费用高、实施周期长等问题。

你可能感兴趣的:(数据仓库)