Microsoft7.0数据仓库框架

 本文中包含的信息代表了微软公司在发布之日对所讨论的一些问题的当前观点。由于微软公司必须对变化的市场条件作出反应,所以不应将本文解释为微软公司的一个承诺,而且微软公司不能保证自发布之日后出现的任何信息的准确性。

  本文档只用于资料用途。在本文档中,微软不做任何担保,无论明示还是暗示。

  1998微软公司。保留所有权利。

  

  以更快的速度做出更好的商业决策是在当今充满竞争的市场中取得成功的关键。组织机构寻求提高决策能力的努力被来自众多运营和生产系统的大量、复杂的数据所淹没。对于当今的信息技术专业人员来讲,确保数据的可访问性是最具挑战性的任务之一。

  为应付这一挑战,许多组织机构选择建立数据仓库来挖掘隐藏于OLTP系统中的有用信息。数据仓库对那些来自作为决策支持和数据分析基础的各系统所拥有的信息进行集中存储。虽然基于不同的方法和学术理念,存在多种类型的数据仓库,但它们都有下列共同的特性:

   ·围绕公司考虑的主要问题(如客户、产品、销售或供货商)来组织信息,这反映了数据驱动的设计思想。

   ·从非集成运行的和传统的应用中收集原始数据,经过筛选、综合后以某种有意义的方式提交给最终用户。

   ·基于最终用户的反馈意见和在数据仓库中的发现,数据仓库的体系结构将随时间而不断变化,这反映了该处理过程所具有的反复性。

  因此数据仓库过程本质上来讲是复杂、昂贵且耗时的。在过去的几年中,微软公司一直致力于与其他软件公司一起以创建由组件技术和先进产品组成的数据仓库平台,这些技术和产品能用来降低费用、提高数据仓库创建、管理和使用的有效性。同时微软公司也一直致力于开发大量的产品和工具,如 Microsoft?SQLServer?7.0版,以很好地配合数据仓库过程(datawarehousingprocess)。通过与那些能与微软 数据仓库框架集成使用的第三方产品相结合,客户就能从大量的可互用的、最佳的产品中选择适应自己数据仓库所需的产品。

  SQLServer7.0提供了广泛的功能以支持数据仓库过程。微软公司并为数据仓库发行了一个平台与DataWarehousing结合起来使用,以降低费用和复杂性,并提高数据仓库工作的效率。
  数据仓库过程(DataWarehousingProcess)

  从信息技术的观点来看,数据仓库关心的是在一个组织机构中将适当的信息传送到适当的个人手中。这是一个正在进行的过程,而不是以前的解决方案,并且需要不同的方法以满足面向事务系统开发工作的需求。

  数据仓库是数据的集合,以对那些面向主题的、集成的、时间不同的、非易失性的决策的管理工作给以支持。数据仓库关注的是概念(如销售),而不是过程(如提供发票)。它包括从多种处理系统收集到的有关某一概念的所有相关信息。信息进行定期收集和存储,并且是相对稳定的。

  通过一致命名约定、测量、物理属性和语义,数据仓库对操作数据进行集成。在数据仓库物理设计的第一步是确定应包括哪些主题领域,并开发一套意见一致的定义集。这需要约见最终用户、分析员、高级管理人员,以了解所需信息的范围,并给出相应文档。在将逻辑处理转化成物理数据仓库之前,必须对相关问题有彻底的了解。

  在物理设计之后,是在运作系统基础上产生数据仓库。因为运作系统和数据仓库包含不同的数据类型,所以将数据载入数据仓库需要进行数据的转换:汇总、转换、解码、去除非法数据等等。这些过程需能自动完成以便在变化的基础上也能完成:经常需要对源数据进行抽取、转换和移动以满足数据仓库的商业需求。

  在运作系统中,当存取数据时,数据应有具有数值,并且数据是精确的。.例如,一个订单输入系统总是为手头存有的每一产品提供当前价格。这样仅仅是时间稍有差别的两个查询所获得的价格就有可能不同。在数据仓库中,数据表示在很长一段时期收集到的信息,作为某一特定时间点来讲是精确的。因此,数据仓库包含有关商业关键领域的一系列"快照"(snapshot)。

  最后,信息用于浏览、分析和报告。有许多有助于分析的工具(从简单的用于写报表的程序到高级的用于数据挖掘的程序)。最后,分析程序使数据仓库过程的最终结果和数据仓库设计的修改都能适应新的要求,并提高系统性能或允许进行其它新类型的分析。由于这些变化,处理过程会重新开始,并延伸到数据仓库的整个生命周期。 1

你可能感兴趣的:(数据库)