数据仓库是什么?

阅读更多


包含运作数据(运行业务日常交易的数据)的系统包含了业务分析员可用来更好地理解业务是如何运作的信息。例如,他们可以看到一年中的哪些时候在哪些地区销售了哪些产品。这有助于识别异常情况,或者规划未来的销售。

但是,如果分析员直接访问运作数据,那么会产生几个问题:

他们可能没有查询运作数据库的专门知识。例如,查询 IMS 数据库需要一个使用专门类型的数据操作语言的应用程序。一般而言,那些拥有查询运作数据库专门技术的程序员都全职维护数据库及其应用程序。

性能对于许多运作数据库(例如银行的数据库)是关键。系统无法处理用户对运作数据存储所进行的“特别的”查询。想象一下您正在因特网上处理您的银行业务并支付帐单。当您按下 OK 按钮时,处理付款通常只要几秒钟。现在,请考虑银行分析员正在设法搞清楚如何从现有的客户群赚取更多的钱。该分析员运行了一个查询,它非常复杂,以致于现在完成您的事务要花大约 30 秒时间。很显然,这个性能时间是不能接受的(而且分析员所幻想的新费用也是不可能的)。由于这个原因,一般将运作数据存储和报告数据存储(包括 OLAP 数据库)分开。

但是,在近几年中,报告数据存储已经逐渐成为伪操作(pseudo-operational)数据存储而且很流行。这样的存储称为操作数据存储(operation data store)(ODS)。例如,请考虑电信业。ODS 在这些公司中很流行,因为它们尽可能快地设法识别欺骗性的费用。DB2 是非常适合于运作和报告工作负载的少数几个数据库之一。

运作数据通常并不是业务分析员使用的最佳格式。例如,对于分析员来说,根据产品、地区和季节而汇总的销售数据比原始数据有用得多。

数据仓库解决了这些问题。在数据仓库中,您创建信息化的数据(informational data)(该数据抽取自运作数据,随后对其进行转换和清理,以用于最终用户的决策)存储。例如,数据仓库工具可能会复制运作数据库中的所有销售数据、执行计算以汇总数据以及将汇总好的数据写到与运作数据分开的数据库。最终用户可以查询这个分开的数据库(数据仓库),而不会影响运作数据库。

你可能感兴趣的:(电信,DB2,工作)