大数据内容摘要

1、数据仓库始于20世纪80年代中期。由数据仓库之父 W.H Inmon在1991年出版的“Building the Data Warehouse”(《数据仓库》)一书中提出了准确而又广泛被大家接受的定义。数仓是面向主题的、集成的、相对稳定的、随时间变化的用于支持管理决策的数据集合。
维度建模的一些基础知识,主要包括事实表、维度表、切片、钻取等
事实表是指其中保存了大量业务度量数据的表,是数仓最核心的表。
维度表是用户来分析数据的窗口,比如时间、地区、用户等。
粒度是指数据仓库的数据单位中,保存数据的细化程度的级别。
切片:从多维数组中选定一个二维子集,切出一个“平面” 。
切块:从多维数组中选定一个三维子集,切出一个“立方体” 。
旋转:改变一个报告(页面)显示的维方向。
根据维层次,改变数据分析的粒度,就是钻取分析,主要包括上钻(也叫上卷)和下钻。其实Excel中的数据透视就是各种上卷和下钻。

你可能感兴趣的:(大数据)