HDFS

HDFS的可靠性体现在:创建多份数据块的副本,并放置在服务器群的计算节点中


HDFS的三个节点:NameNode,DataNode,Secondary NameNode

NameNode:用于存储元数据、元数据保存在内存中,用于保存文件、block、datanode之间的映射关系    元数据是出文件内容外的数据,文件越多,元数据越多

DataNode:用于存储文件内容,文件内容保存早磁盘中,维护block id到datanode本地文件的映射关系       datanode存储的内容多

         所以HDFS中,有一个NameNode和多个DataNode

Secondary NameNode:


HDFS Client请求NameNode,请求文件的读写操作。一个文件可以被分成多个block,每个block有多个副本,存储在不同的DataNode上


NameNode(NN):处理客户端的读写服务


HDFS_第1张图片



HDFS_第2张图片


core-site.xml文件配置NameNode所在主机和端口号

HDFS_第3张图片


配置DataNode



配置secondNameNode



HDFS_第4张图片


拷贝配置文件,保证两台电脑配置文件相同


格式化

HDFS_第5张图片


把公钥文件拷贝到第二个电脑

第二台电脑上,把文件内容放到authorized_keys里


ssh成功后,往其他节点拷贝文件


在第二个节点中,解压tar.gz文件、创建连接


为了保证每台机器的配置文件完全相同,要拷贝所有的配置文件


格式化,在bin目录中敲命令

HDFS_第6张图片


格式化成功后,start-dfs.sh

HDFS_第7张图片

HDFS_第8张图片


HDFS_第9张图片



HDFS_第10张图片





为什么

HDFS_第11张图片



视频中在登陆网址之前,在win7系统里system32\drivers\etc\hosts中配置的是什么????????????

HDFS_第12张图片


又配了一天,只把ssh搞起来了,还是不行。。。。

HDFS_第13张图片



配置slaves的时候!!!!!!写错ip地址了!!!!!!!!!!!!!靠


终于!!!!!

HDFS_第14张图片



你可能感兴趣的:(HDFS)