The Data Warehouse ETL Toolkit-需求

业务方面的需求始终是更基础的和更重要的部分。

   (一)业务需求

业务需求是数据仓库最终用户的信息需求。

业务需求直接决定了数据源的选择。

ETL小组的核心工作就是不断地理解和检验业务需求。

业务需求和数据源的内容都是不断变化的,需要不断地进行检验和讨论。

(二)合规需求(Compliance requirements)

法律、法规相关要求。

(三)数据评估

数据评估是设计任何数据使用系统的前提。

Jack Olson:“数据评估使用分析方法来检查数据,充分了解数据的内容、结构和质量。好的数据评估能够处理海量数据,使用分析方法找到需要解决的全部问题。”

(四)安全需求

最终用户的安全授权不是在数据仓库的物理表一级,各应用系统的用户安全定义都在各自的应用系统中进行授权。

(五)数据集成

“360度的业务视图”就是对数据集成的业务解释。(The360 degree view of the businessis the business name for data integration.)

数据集成采用规格化的维表和事实表,规格化的维表是指在分离的数据库中建设立公共维度实体,以便于构建横向钻取型报表;规格化的事实表意味着在分离的数据库中建立公共业务度量,以便于通过差值和比率对这些数值进行比较。

数据集成在ETL系统中是数据流程中的一个独立步骤,叫做规格化步骤。

(六)数据延迟

数据延迟需求用于描述数据提交到最终用户的速度。

数据延迟对系统的实施和架构有巨大的影响。

面向批处理架构与面向流的架构。

你可能感兴趣的:(The Data Warehouse ETL Toolkit-需求)