Hadoop权威指南第1章笔记

1.1 数据

  • 我们生活在数据大爆炸时代.

1.2 数据的存储与分析

  • 硬盘存储容量多年来不断提升的同时, 访问速度却没有与时俱进(读完整个硬盘的数据需要更长时间).
  • 减少读取时间的办法: 同时从多个硬盘上读取数据.
  • 需要解决问题:
    1. 硬件故障问题
    2. 数据结合问题
  • Hadoop提供了一个可靠地共享存储和分析系统:
    1. HDFS实现数据的存储.
    2. MapReduce实现数据的分析和处理.

你可能感兴趣的:(Hadoop权威指南第1章笔记)