第一章 大数据Hadoop学习笔记(一)

一、存储单位

按顺序给出数据存储单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
一般TB、PB、EB为单位的数据为大数据。

1Byte=8bit 1K=1024Byte 1MB=1024K 1G=1024M 1T=1024G 1P=1024T

二、大数据主要解决

海量数据的采集、存储和分析计算 问题。

三、大数据特点(4V)

Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)

四、大数据部门组织结构

第一章 大数据Hadoop学习笔记(一)_第1张图片

五、Hadoop(分布式系统基础架构)

主要解决海量数据的存储和海量数据的分析计算问题。

六、Hadoop优势

  • 高可靠性:Hadoop底层维护多个数据副本,及时某个计算元素或存储出现故障,也不会导致数据的丢失。
  • 高扩展性:在集群间分配数据任务,可方便的扩展数以千计的节点。 高效性:并行工作,以加快任务处理速度。

你可能感兴趣的:(hadoop,学习,大数据)