初始Hadoop

一、大数据的定义

        大数据=5V+1C

        5V:variety(多样化),volume(海量),velocity(快速),vitality(灵活),value(价值)

        1C:complexity(复杂性)


二、hadoop的定义

       广义:以hadoop为主的生态圈,包括hadoop,flume......

       狭义:hadoop=Apache hadoop——网址:hadoop.apache.org


三、hadoop的三大组件

       三大组件:存储、计算、资源和作业调度

       hadoop的三个版本:hadoop1.x,hadoop2.x,hadoop3.x

       hadoop1.x:HDFS(存储)+MapReduce(计算、资源和作业调度)

       hadoop2.x:HDFS(存储)+MapReduce(计算)+YARN(资源和作业调度平台)

注:目前企业多用hadoop2.x,HDFS和MapReduce都是跑在YARN平台上。


你可能感兴趣的:(初始Hadoop)