数据仓库生命周期的一些疑惑

 

       最近在学习 数据仓库相关知识,看了一些书籍,但是对关于数据仓库生命周期的一些描述好像有比较大的差别,也不知道是不是没有理解透彻。

数据仓库生命周期与操作型系统不同这个都是一致的。

在《数据仓库》一书中,“传统的S D L C是需求驱动的。为建立系统,你必须首先理解需求,然后进入到设计和开发阶段。C L D S几乎刚好相反。C L D S由数据开始,一旦数据到手就集成数据。然后,如果数据有偏差,就检验看看数据存在什么偏差。再针对数据写程序,分析程序执行结果。最后,系统需求才得到了理解。”;“C L D S是典型的数据驱动开发生命周期,而S D L C是典型的需求驱动开发生命周期。”

 

在《数据仓库基础》一书中,“在数据仓库中,用户的商业需求成为了唯一的也是最重要的驱动力。数据仓库开发过程中每一个阶段的每一项任务都是由需求决定的。在设计阶段进行的每一个决策,无论是数据设计、体系结构设计、基本结构的配置,或者是信息传递方法的安排,都完全受到需求的影响”;“因为需求是开发过程中每一个阶段基本驱动力,你需要确保你的需求定义包括了支持每个阶段的所有细节信息。”

 

从另外一书《数据仓库与数据挖掘》(清华大学),”数据仓库应用系统不同于事务处理业务系统,其数据分析需求刚开始时并不十分明确,而数据仓库的数据来源往往来自各操作型业务数据库的历史数据和当前数据,因此,项目需求收集与分析需要从历史数据与用户需求两个方面同时着手,采用‘数据驱动+用户驱动’的设计理念”;“数据驱动是根据当前业务数据的基础和质量情况,以数据源的分析为 出发点构建数据仓库。另一方面,用户驱动则是根据用户业务的方向性需求,从业务需要解决的具体问题出发,确定系统范围和需求框架,也叫需求驱动。”

 

 

这个不同的书有不同的观点,人都搞晕了。

 

个人觉得“‘数据驱动+用户(需求)驱动’的设计理念”是正确的,其中的的用户需求只是一个方向性需求,不是具体的需求。具体的用户业务分析需求必须等到数据仓库已经建设完成装载了数据后才能明确提出。也就是“我需要知道你能给我什么,然后我才知道我需要什么”。

 

不知道是否正确???那位大大请提点一下。

你可能感兴趣的:(数据仓库生命周期的一些疑惑)