HDFS 环境搭建(伪分布式)

1 java环境配置


宿主机环境 windows10

虚拟机 VMware Workstation Pro12

linux镜像 CentOS-6.5-x86_64-bin-DVD1


在当前用户的家目录通过mkdir命令创建software目录 ,通过Xfpt将jdk-8u111-linux-x64.tar.gz 上传到software目录上(当前登录用户为admin)


通过 cd ~/software/ 命令进入家目录下的software目录,通过tar -zxvf ./jdk-8u111-linux-x64.tar.gz命令解压到当前目录。 解压成功如下所示


配置JAVA_HOME环境变量,通过vim ~/.bash_profile 编辑当前用户家目录下的.bash_profile文件(用户登录会加载/etc/profile和自己家目录下的.bash_porfile文件)


按i进入编辑模式 ,在最后添加JAVA_HOME变量 ,指向刚刚解压好的jdk,并将jdk目录下的bin文件夹添加到PATH中


按esc键,按shift+:进入命令模式,输入wq ,回车,保存退出


使用 source ~/.bash_profile 重新加载配置文件 , java -version 检测jdk是否安装成功


2 hadoop配置


通过Xfpt将hadoop-2.7.3.tar.gz 上传到当前用户家目录下的software目录上(当前登录用户为admin)

通过cd ~/software/命令进入当前用户家目录下的software目录,通过tar -zxvf ./hadoop-2.7.3.tar.gz 命令解压tar -zxvf ./hadoop-2.7.3.tar.gz 到当前目录

通过  vim ~/.bash_profile 编辑配置文件,添加HADOOP_HOME指向解压的hadoop-2.7.3,并将该目录下的bin目录和sbin目录添加到PATH中,保存退出。

通过 source ~/.bash_profile 命令重新加载配置文件,输入start-a ,按tab建 ,可以补全 ,说明配置成功。

进入当前用户家目录下的/software/hadoop-2.7.3/etc/hadoop文件夹 ,通过 vim ./hadoop-env.sh 编辑hadoop-env.sh 文件 ,将JAVA_HOME修改为安装好的jdk目录,保存退出。

vim ./hdfs-site.xml(在当前用户家目录下的/software/hadoop-2.7.3/etc/hadoop下),设置副本数和 dfs.namenode.secondary.http-address 地址(node01 为虚拟机名称,需要root用户在/etc/hosts配置)

在当前用户家目录建立hadoop目录 ,用于存储hadoop中namenode和datanode数据。

vim ./core-site.xml(在当前用户家目录下的/software/hadoop-2.7.3/etc/hadoop下),设置集群入口和数据存放位置,保存退出(数据存放在当前用户家目录下的hadoop目录,node01 为虚拟机名称,需要root用户在/etc/hosts配置)

在当前用户家目录下的/software/hadoop-2.7.3/etc/hadoop下,执行mv mapred-site.xml.template mapred-site.xml ,将mapred-site.xml.template重命名为mapred-site.xml 文件。
 vim ./mapred-site.xml ,编辑mapred-site.xml 文件,指定 mapreduce 编程模型运行在 yarn 上,保存退出

 vim ./yarn-site.xml ,编辑yarn-site.xml 文件,指定数据获取方式和resourcemanager地址,保存退出。(node01 为虚拟机名称,需要root用户在/etc/hosts配置)

vim ./slaves 编辑从节点文件,设置从节点为本机。

3 系统配置

切换root用户,在终端中执行 service iptables stop,关闭防火墙服务,执行chkconfig iptables off命令,禁止防火墙开机自启,执行service iptables status 查看防火墙状态。

配置免密钥登录,cd~/.ssh 进入当前用户的家目录下的.ssh目录,执行 ssh-keygen -t rsa(若ssh未安装,用root用户登录执行 yum install openssh-clients yum install openssh-server 安装)

cat id_rsa.pub >> authorized_keys 将公钥信息保存到授权信息中

chmod 600./authorized_keys 修改文件权限 ssh localhost 登录测试,免密钥配置成功。

切换root用户 ,vim /etc/sysconfig/network 文件,修改主机名字为node01,保存退出。

用root 用户修改/etc/hosts文件 ,vim /etc/hosts ,添加主机名称和对应的ip地址,保存退出。

重启虚拟机,hostname 命令测试 ,修改成功。

4 格式化集群

执行 hdfs namenode-format 格式化集群,status为0 ,代表格式化成功。

执行 start-all.sh启动集群 ,启动成功 ,执行jps命令,查看进程,集群启动成功(以普通用户start-all.sh和stop-all.sh)

虚拟机访问 node01:50070/ ,访问成功

虚拟机访问 node01:18088/  ,访问成功,集群搭建成功。

你可能感兴趣的:(HDFS 环境搭建(伪分布式))