Linux 部署Hadoop伪分布式集群教程

 首先:我们需要下载一些关于Hadoop伪分布式集群需要的工具与tar包

链接:

https://pan.baidu.com/s/1oUw1jDCxfghWsnaWauSHKg

 提取码:6s5a

接下来打开虚拟机终端,先创建一个文件夹用来解压Hadoop的tar包

Linux 部署Hadoop伪分布式集群教程_第1张图片

 接着使用xshell远程连接到虚拟机传输Hadoop的tar包(不会使用xshell可以参考这篇文章)http://t.csdn.cn/2fJ9m

Linux 部署Hadoop伪分布式集群教程_第2张图片输入命令:tar -zvxf hadoop-3.3.0 tar.gz开始解压tar包 

Linux 部署Hadoop伪分布式集群教程_第3张图片 

接下来输入命令:ll就可以查看我们解压好的文件hadoop-3.3.0 

Linux 部署Hadoop伪分布式集群教程_第4张图片 

接下来我们需要创建一个空文件夹hadooptmp用来装hadoop格式化hdfs时产生文件 

Linux 部署Hadoop伪分布式集群教程_第5张图片 

 紧接着我们需要进入hadoop文件下编辑hadoop-env.sh配置jdk的路径(黑色背景的图片为在xhell中操作的命令直接在虚拟机的终端中输入命令也可以) 

Linux 部署Hadoop伪分布式集群教程_第6张图片在hadoop-env.sh中加入export  JAVA_HOME=/.../..(这里的自己安装的jdk的路径) 

Linux 部署Hadoop伪分布式集群教程_第7张图片 接下来我们需要配置四个文件,第一个是 core-site.xml,输入命令: vim core-site.xml

Linux 部署Hadoop伪分布式集群教程_第8张图片 

进入 core-site.xml之后配置以下内容



fs.defaultFS
hdfs://hadooptest:9000


hadoop.tmp.dir
/home/hadoop/software/hadooptmp

Linux 部署Hadoop伪分布式集群教程_第9张图片 

第二个需要配置的文件是hdfs-site.xml,输入命令 vim hdfs-site.xml

Linux 部署Hadoop伪分布式集群教程_第10张图片 进入后输入配置内容:



dfs.replication
1

Linux 部署Hadoop伪分布式集群教程_第11张图片第三个需要配置的文件为mapred-site.xml输入命令:vim  mapred-site.xml进行配置

Linux 部署Hadoop伪分布式集群教程_第12张图片进入文件后输入配置内容



mapreduce.framework.name
yarn

 

Linux 部署Hadoop伪分布式集群教程_第13张图片第四个文件是yarn-site.xml输入命令 :vim yarn-site.xml进行配置

Linux 部署Hadoop伪分布式集群教程_第14张图片配置内容为:

 

yarn.nodemanager.aux-services
mapreduce_shuffle

Linux 部署Hadoop伪分布式集群教程_第15张图片 

接下来我们需要编辑workers中的内容,输入命令:vim workers进入编辑 

Linux 部署Hadoop伪分布式集群教程_第16张图片 把localhost注释掉(前面加入#),然后加入自己的主机名(hadooptest是我的主机名)

Linux 部署Hadoop伪分布式集群教程_第17张图片 

 紧接着我们开始配置环境变量,输入命令:vim ~/.bash_profile

Linux 部署Hadoop伪分布式集群教程_第18张图片 

进入后输入内容

expoet JAVA_HOME=.....(自己的jdk的安装路径) 

export PATH=$JAVA_HOME/bin:$PATH

export HADOOP_HOME=.....(自己的hadoop安装路径)

export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

Linux 部署Hadoop伪分布式集群教程_第19张图片 

配置好环境变量之后记得输入命令:source ~/.bash_profile 加载环境变量使环境变量生效

Linux 部署Hadoop伪分布式集群教程_第20张图片接下来我们需要格式化hdfs输入命令:hadoop namenode -format 

Linux 部署Hadoop伪分布式集群教程_第21张图片 

 格式化完成之后输入命令:start-all.sh启动hadoop

Linux 部署Hadoop伪分布式集群教程_第22张图片启动完成之后输入命令:jps查看启动正在进行的进程(除jps之外中共有五个进程)

Linux 部署Hadoop伪分布式集群教程_第23张图片 

接着进入浏览器中输入192.168.0.107:9870进行访问(192.168.0.107为自己虚拟机配置的IP地址) 

Linux 部署Hadoop伪分布式集群教程_第24张图片 再把9870改为8088就会出现访问如图所示网页

Linux 部署Hadoop伪分布式集群教程_第25张图片 这样Hadoop部署伪分布式集群就部署完成了!!!

 

 

你可能感兴趣的:(hadoop,分布式,linux)