大数据面试通关手册|数据仓库面试题(四)

⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339
⭐⭐欢迎点赞  收藏 ⭐留言  ,欢迎留言交流!
⭐⭐本文由【王知无】原创,首发于 CSDN博客!
⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!

数据仓库的定义?

首先,用于支持决策,面向分析型数据处理;其次,对多个异构的数据源有效集成,集成后按照主题进行重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。

数据仓库(Data Warehouse)是一个面向主题的(subject oriented)、集成的(integrated)、相对稳定的(non-volatile)、反应历史变化(time variant)的数据集合,用于支持管理决策(decision making support)。

数据仓库和数据库的区别?

从目标、用途、设计来说

  • 数据库是面向事物处理的,数据是由日常的业务产生的,常更新;数据仓库是面向主题的,数据来源多样,经过一定的规则转换得到,用来分析。

  • 数据库一般用来存储当前事务性数据,如交易数据;数据仓库一般存储的历史数据。

  • 数据库的设计一般是符合三范式的,有最大的精确度和最小的冗余度,有利于数据的插入;数据仓库的设计一般不符合三范式,有利于查询

如何构建数据仓库?

你可能感兴趣的:(大数据面试通关手册,数据仓库,大数据,数据库,数据分析,java)