虚拟机中搭建伪分布式Hadoop,步骤详解

本人安装的版本试Hadoop2.4.1版本。首先上传hadoop的安装包到服务器上去/home/hadoop/
1.解压Hadoop到指定的文件下,我解压的目录在主目录下新建的app文件内
$ tar -zxvf hadoop2.4.1.tar.gz -C app/

2、配置Hadoop的环境变量


vi /etc/profile
//在文件末尾添加
export JAVA_HOME=/home/hadoop/app/hadoop2.4.1export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin


3、配置hadoop, 伪分布式需要修改5个配置文件
首先进入hadoop的安装目录下以便修改其中的配置文件
 
  

第一个:hadoop-env.sh

  vim hadoop-env.sh
  #第27行
  export JAVA_HOME=/usr/java/jdk1.7.0_65
  
 第二个:core-site.xml
  
  
   fs.defaultFS
   hdfs://weekend110                     ---我的hadoop主机名为weekend110
  

  
  
   hadoop.tmp.dir
   /home/hadoop/hadoop-2.4.1/tmp
   

  
 第三个:hdfs-site.xml   hdfs-default.xml  
  
  
   dfs.replication
   1                                                     ---副本数量
   

  
 第四个:mapred-site.xml
首先需要更改一下文件名
  mv mapred-site.xml.template mapred-site.xml
  vim mapred-site.xml
  
  
   mapreduce.framework.name
   yarn
   

  
 第五个:yarn-site.xml
  
  
   yarn.resourcemanager.hostname
   weekend110
   

  
   
   yarn.nodemanager.aux-services
   mapreduce_shuffle
    

3.3格式化namenode(是对namenode进行初始化)
  hdfs namenode -format (hadoop namenode -format)
  
 3.4启动hadoop
  先启动HDFS
  sbin/start-dfs.sh
  
  再启动YARN
  sbin/start-yarn.sh
  
 3.5验证是否启动成功
  使用jps命令验证
  27408 NameNode
  28218 Jps
  27643 SecondaryNameNode
  28066 NodeManager
  27803 ResourceManager
  27512 DataNode

你可能感兴趣的:(Hadoop)