Ubuntu16.04如何安装Hadoop2.6.0(单机伪分布方式)

一、首先安装JDK,安装方法请查看本人之前的博客。

二、然后是设置SSH无密码登陆

第一步 安装SSH

执行命令:

sudo apt-get install ssh

过程中需要输入“Y”。

第二步 安装rsync

执行命令:

sudo apt-get install rsync

第三步 产生SSH Key

执行命令:

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

第四步 查看产生的SSH Key

执行命令:

ll ~/.ssh

Ubuntu16.04如何安装Hadoop2.6.0(单机伪分布方式)_第1张图片

第五步 将产生的Key放置到许可证文件中

执行命令:

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

三、安装Hadoop

第一步 在官网上下载hadoop2.6.0

第二步 解压压缩包

执行命令:

sudo tar -zxvf hadoop-2.6.0.tar.gz

并移动解压后的文件

执行命令:

sudo mv hadoop-2.6.0 /usr/local/hadoop

第三步 设置hadoop环境变量

执行命令:

sudo gedit ~/.bashrc

在打开的文档最后加上以下内容:

export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 
export HADOOP_HOME=/usr/local/hadoop 
export PATH=$PATH:$HADOOP_HOME/bin 
export PATH=$PATH:$HADOOP_HOME/sbin 
export HADOOP_MAPRED_HOME=$HADOOP_HOME 
export HADOOP_COMMON_HOME=$HADOOP_HOME 
export HADOOP_HDFS_HOME=$HADOOP_HOME 
export YARN_HOME=$HADOOP_HOME 
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native 
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib" 
export JAVA_LIBRARY_PATH=$HADOOP_HOME/lib/native:$JAVA_LIBRARY_PATH

保存后退出

执行命令:

source ~/.bashrc

使修改生效。

第四步 修改hadoop配置设置文件

1、修改hadoop-env.sh

执行命令:

sudo gedit /usr/local/hadoop/etc/hadoop/hadoop-env.sh

输入下列内容:


2、修改core-site.xml

执行命令:

sudo gedit /usr/local/hadoop/etc/hadoop/core-site.xml

输入下列内容:


  fs.default.name
  hdfs://localhost:9000

3、修改yarn-site.xml

执行命令:

sudo gedit /usr/local/hadoop/etc/hadoop/yarn-site.xml

输入下列内容:


  yarn.nodemanager.aux-services
  mapreduce_shuffle


  yarn.nodemanager.aux-services.mapreduce.shuffle.class
  org.apache.hadoop.mapred.ShuffleHandler

4、修改mapred-site.xml

执行命令:

sudo cp /usr/local/hadoop/etc/hadoop/mapred-site.xml.template /usr/local/hadoop/etc/hadoop/mapred-site.xml
sudo gedit /usr/local/hadoop/etc/hadoop/mapred-site.xml

输入下列内容:


  mapreduce.framework.name
  yarn

5、修改hdfs-site.xml

执行命令:

sudo gedit /usr/local/hadoop/etc/hadoop/hdfs-site.xml

输入下列内容:


  dfs.replication
  3


  dfs.namenode.name.dir
  file:/usr/local/hadoop/hadoop_data/hdfs/namenode


  dfs.datanode.data.dir
  file:/usr/local/hadoop/hadoop_data/hdfs/datanode

第五步 建立与格式化HDFS 目录

创建namenode和datanode数据存储目录

执行命令:

sudo mkdir -p /usr/local/hadoop/hadoop_data/hdfs/namenode
sudo mkdir -p /usr/local/hadoop/hadoop_data/hdfs/datanode
sudo chown hduser:hduser -R /usr/local/hadoop

格式化namenode

执行命令:

hadoop namenode -format

Ubuntu16.04如何安装Hadoop2.6.0(单机伪分布方式)_第2张图片

第六步 启动hadoop

执行命令:

start-all.sh

第一次运行时中间需要输入两次“yes”

第七步 查看结果

执行命令:jps

Ubuntu16.04如何安装Hadoop2.6.0(单机伪分布方式)_第3张图片

PS:另外,可通过ubuntu系统的浏览器

开启Hadoop Resource­Manager Web接口

http://localhost:8088/

可用于查看当前Hadoop的状态:Node节点、应用程序、进程运行状态

NameNode HDFS Web接口

http://localhost:50070/

可用于检查当前HDFS与DataNode的运行情况

你可能感兴趣的:(Ubuntu16.04如何安装Hadoop2.6.0(单机伪分布方式))