什么是hadoop?

 

一 Hadoop是一个开源的框架;

二 Hadoop能够进行大规模数据集地分布式处理;

三 Hadoop能够用计算机集群存储海量数据;

四 Hadoop可以从单一服务器扩展到成千上万的服务器,这些服务都能够提供本地化的存储和计算;

五 Hadoop具有能够检测和处理应用层错误的能力;六是Hadoop包括Hadoop common/HDFS/Hadoop YARN/Hadoop MapReduce四个模块,每个模块负责各自的事务。

建立hadoop运行环境   Apache 组织的顶级项目
JDK  Linux  硬件
安装hadoop            
经典案例 WordCount

 

什么是hadoop?_第1张图片

什么是hadoop?_第2张图片

 

 

 

 

 

 

 

什么是hadoop?_第3张图片

 

什么是hadoop?_第4张图片

 

运行hadoop环境

1.格式化分布式文件系统

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

转载于:https://my.oschina.net/u/3253987/blog/877397

你可能感兴趣的:(什么是hadoop?)