HADOOP学习笔记总结一:HDFS

一、Hadoop的来源

HADOOP学习笔记总结一:HDFS_第1张图片

二、hadoop的子项目

HADOOP学习笔记总结一:HDFS_第2张图片

三、Hadoop的安装与版本

HADOOP学习笔记总结一:HDFS_第3张图片

Hadoop 的有三条线并行演化,各个版本的功能是不一样的。所以2.7并不一定比0.23的要新。

比如说,0.23这个版本增加了用户认证的功能,但其他的版本确没有此功能。

官方地址:https://hadoop.apache.org,官方文档完整,较清晰,不过是英语,其实也是容易读懂的

四、HDFS基本知识

HADOOP学习笔记总结一:HDFS_第4张图片

HADOOP学习笔记总结一:HDFS_第5张图片

可以做到故障检测:通过心跳包来检测datanode是否死机,datanode报告 block,进行数据完整性检测

也可以通过空间回收机制提高空间利用

五、可以通过shell 命令来操作

HADOOP学习笔记总结一:HDFS_第6张图片

六、HDFS优点

HADOOP学习笔记总结一:HDFS_第7张图片

七:HDFS缺点

HADOOP学习笔记总结一:HDFS_第8张图片

 

八:HADF架构

HADOOP学习笔记总结一:HDFS_第9张图片

 

HDFS的数据存储单元BLOCK

HADOOP学习笔记总结一:HDFS_第10张图片

HDFS的设计思想

HADOOP学习笔记总结一:HDFS_第11张图片

 

九:NAMENODE与secondaryNameNode、datanode的功能

HADOOP学习笔记总结一:HDFS_第12张图片

metadata存储在内存中,如果HDFS小文件太多的话,可会导致METAdata文件过大,造成错误。

secondaryNameNode根据edits.log日志文件合并fsimage

HADOOP学习笔记总结一:HDFS_第13张图片

HADOOP学习笔记总结一:HDFS_第14张图片

HADOOP学习笔记总结一:HDFS_第15张图片

HADOOP学习笔记总结一:HDFS_第16张图片十、HDFS的读写流程

HADOOP学习笔记总结一:HDFS_第17张图片

HADOOP学习笔记总结一:HDFS_第18张图片

写流程中的是先把block写到一个datanode,之后根据配置的副本机制,datanode之间自动复制。

十一、HDFS的文件权限

HADOOP学习笔记总结一:HDFS_第19张图片

十二、安全模式:类似初始化

HADOOP学习笔记总结一:HDFS_第20张图片

十三、配置文件

core-site.xml

配置namenode 


        fs.defaultFS
        hdfs://hadoop-maste:9000/
   

配置secondnamenode在master配置文件中

配置hdfs-site.xml


        dfs.namenode.name.dir
        file:/usr/local/hadoop2.7/dfs/name
   

   
        dfs.datanode.data.dir
        file:/usr/local/hadoop2.7/dfs/data
   

       
        dfs.webhdfs.enabled
        true
   

   
        dfs.replication
        2
   

       
            dfs.permissions.enabled
                false
       

 

你可能感兴趣的:(HADOOP)