什么是数据仓库

什么是数据仓库
 
建立数据仓库的目的,是把企业的内部数据和外部数据进行有效的集成,为企业的各层决策、分析人员使用。企业内部数据是指通过业务系统收集到的数据,这些数据可能分布在不同的硬件、数据库、网络环境中,为不同的业务部门服务。比如对一个制造业用户来说,可能有生产数据、销售数据、财务数据、市场数据、人事数据等等,所有这些数据从结构上看,是相对独立的,是不利于企业决策者进行全面分析和查询的。如果我们针对决策者的需求,对这引起数据进行结构上的重组,按更方便决策分析的角度去设计,并且充分考虑今后的扩展性与外部数据的接口,会对企业的宝贵资源-数据,实现真正的信息价值。

对数据仓库中信息的使用,不同层次的用户有不同的使用风格。比如:

主管信息系统(EIS):提供界面丰富,定制容易的决策分析,主要适合企业的高层决策者使用。
联机分析处理(OLAP):灵活丰富的多 维分析与查询,可以从不同的角度去分析企业的运作情况,并对未来进行预测。主要适合于企业的中层领导和业务分析人员。
限席查询(Ad Hoc Query):提供从多个角度的灵活查询。适合于业务分析人员。
灵活报表(Reporting):提供灵活报表的设计。适合于制作报表的人员。

什么是数据仓库处理

数据仓库不同于数据库。数据库是一种通用的平台,用来管理企业的数据;而数据仓库是一种概念,在此概念下进行的构造过程,我们叫它数据仓库处理。所以,数据仓库不是花钱可以购买的现成产品(而数据库是),它是一个建立的过程。

数据仓库处理包括许多方面的内容,我们可以把它们分成:

数据准备:
充分了解决策需求;
按数据仓库方法设计数据仓库结构;
业务系统数据向数据仓库结构中进行移动(复制、抽取、清洗…);
数据仓库数据向小规模数据集市的数据复制和分布;

数据展现:
面向高层决策者的主管信息系统(EIS);
面向决策分析者的联机分析系统(OLAP);
为各层决策者服务的即席查询系统(Ad Hoc);
为报表服务的灵活报表系统(Reporting);
数据展现采用多种灵活的方式,比如客户/服务器模式或浏览器模式。

过程管理

数据仓库的建立需要很好的过程管理和方法。我们把数据仓库的建立作为过程(Process)来看待,而不是作为工程(Project)看待。作为过程看待,主要基于几方面考虑:

适应业务发展:企业在市场环境中可能经常需要进行机构、产品、市场的调整,从而导致决策者决策模式的变化。对于数据仓库的建立过程来说,就是产生了新的需求。

适应技术的发展:计算机技术发展迅速,新技术不断出现,如何在数据仓库建立过程中保证技术不落后,保护原有的技术投资,最佳方式就是采用面向过程的方法:自上而下的总体设计;自下而上的实施。

数据仓库的投资回报(ROI)

应用数据仓库技术,改善企业决策支持模式,并取得最大的投资回报,已经成为大多数成功企业的共识。具调查,幸福500中已经有85%的企业建成或正在建立数据仓库,数据仓库与Internet一样,正在成为最快的IT增长点。1996年,全球企业在数据仓库上的投资达到16.8亿美元,并且每年以19.1%的速度增长。据IDC调查,数据仓库的平均投资回报率在401%。

你可能感兴趣的:(设计模式,数据结构,应用服务器,网络应用,企业应用)