Hadoop配置伪分布式

Hadoop配置伪分布式

 

Hadoop海量数据存储,需要分布式存储,

Namenode:名称节点(NN),存放文件目录和路径,重要节点。有备份辅助节点

DataNode:数据节点(DN),存放数据,有副本

Hadoop配置伪分布式_第1张图片

 

HDFS:分布式文件系统。

MapReduce:在分布式文件系统之上进行运算,海量数据并发运算,yarn他就是一个框架

Hadoop配置伪分布式_第2张图片

 

1处是独立模式

2处是伪分布式模式

3处是完全分布式模式

 

①、如何配置伪分布式模式

首先进入找到hadoop文件,复制一份:

 

然后进入到备份后的hadoop-pseudo文件夹里,编辑后卫-site.xml的文件:

※  编辑这三个

Core-site.xml核心文件:

 

 

fs.defaultFS

hdfs://localhost/

 

Hadoop配置伪分布式_第3张图片

Hdfs-site.xml:文件系统

 

dfs.replication

1

 

Hadoop配置伪分布式_第4张图片

Yarn-site.xml:框架

yarn.resourcemanager.hostname

localhost

yarn.nodemanager.aux-services

mapreduce_shuffle

Hadoop配置伪分布式_第5张图片

第四个文件,mapred-site.xml

复制mapred-site.xml.template复制后改名为mapred-site.xml,然后再gedit编辑,保存关闭:

Hadoop配置伪分布式_第6张图片

然后查看是否有ssh(安全访问技术),由图可看出已经存在有了:

这个ssh完全不行的,我们还是要安装服务器版

查询一下,然后再进行安装:

Hadoop配置伪分布式_第7张图片

安装后查看会生成一个ssh-keygen文件密钥分为公钥public key和私钥private key

Hadoop配置伪分布式_第8张图片

然后我们可以自己生成一个密钥:

Hadoop配置伪分布式_第9张图片

然后我们可以查看有一个隐藏的.shh文件,然后cd进入.shh

Hadoop配置伪分布式_第10张图片

然后把公钥放入授权认证的文件里:

Hadoop配置伪分布式_第11张图片

可以ssh试着登陆:

Hadoop配置伪分布式_第12张图片

可查看感知到了一个主机known_hosts

可以退出:

如果再登陆的话就不提示要密码了:

Hadoop配置伪分布式_第13张图片

然后我们可以对文件系统进行格式化,namenode就是放目录的节点:

然后我们可以启动文件系统:

Hadoop配置伪分布式_第14张图片

再启动yarn(Hadoop资源管理器):

然后我们可以看一下进程jps:

Hadoop配置伪分布式_第15张图片

可以-l查看详细信息:

Hadoop配置伪分布式_第16张图片

然后我们可以打开火狐浏览器输入localhost:50070或localhost:9870查看名称节点:

Hadoop配置伪分布式_第17张图片

或者输入localhost:8088查看资源管理器:

Hadoop配置伪分布式_第18张图片

不用可以停止yarn和dfs:

关闭后为了方便创建目录和显示目录

还要重新启动起来

有一个指令统一启动dfs和yarn,就是all

为hadoop设置统一配置环境变量指定配置目录:

没设置之前,都是显示其他用户的:

Hadoop配置伪分布式_第19张图片

然后可以在hadoop下创建文件夹了:

设置之后就可查看只有自己创建的了:

Hadoop配置伪分布式_第20张图片

 

 

 

 

你可能感兴趣的:(Hadoop配置伪分布式)