Windows平台安装配置Hadoop

      Windows平台安装配置Hadoop

步骤: 
1. JDK安装
2. 下载hadoop2.5.2.tar.gz,自行去百度下载。 
3. 下载hadooponwindows-master.zip【**能支持在windows运行hadoop的工具】https://github.com/steveloughran/winutils


一、 安装hadoop2.5.2

下载hadoop2.5.2.tar.gz ,并解压到你想要的目录下,我放在D:\dev\hadoop-2.5.2 
这里写图片描述

二、配置hadoop环境变量

1.windows环境变量配置

右键单击我的电脑 –>属性 –>高级环境变量配置 –>高级选项卡 –>环境变量 –> 单击新建HADOOP_HOME,如下图 
Windows平台安装配置Hadoop_第1张图片

2.接着编辑环境变量path,将hadoop的bin目录加入到后面;

三、修改hadoop配置文件

  1. 编辑“D:\dev\hadoop-2.5.2\etc\hadoop”下的core-site.xml文件,将下列文本粘贴进去,并保存;
<configuration> <property> <name>hadoop.tmp.dirname> <value>/D:/dev/hadoop-2.5.2/workplace/tmpvalue> property> <property> <name>dfs.name.dirname> <value>/D:/dev/hadoop-2.5.2/workplace/namevalue> property> <property> <name>fs.default.namename> <value>hdfs://localhost:9000value> property> configuration>

 

2.编辑“D:\dev\hadoop-2.5.2\etc\hadoop”目录下的mapred-site.xml(没有就将mapred-site.xml.template重命名为mapred-site.xml)文件,粘贴一下内容并保存;

<configuration> <property> <name>mapreduce.framework.namename> <value>yarnvalue> property> <property> <name>mapred.job.trackername> <value>hdfs://localhost:9001value> property> configuration>

3.编辑“D:\dev\hadoop-2.5.2\etc\hadoop”目录下的hdfs-site.xml文件,粘贴以下内容并保存。请自行创建data目录,在这里我是在HADOOP_HOME目录下创建了workplace/data目录;

<configuration>  <property> <name>dfs.replicationname> <value>1value> property> <property> <name>dfs.data.dirname> <value>/D:/dev/hadoop-2.5.2/workplace/datavalue> property> configuration>

4.编辑“D:\dev\hadoop-2.5.2\etc\hadoop”目录下的yarn-site.xml文件,粘贴以下内容并保存;

<configuration> <property> <name>yarn.nodemanager.aux-servicesname> <value>mapreduce_shufflevalue> property> <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.classname> <value>org.apache.hadoop.mapred.ShuffleHandlervalue> property> configuration>

5.编辑“D:\dev\hadoop-2.5.2\etc\hadoop”目录下的hadoop-env.cmd文件,将JAVA_HOME用 @rem注释掉,编辑为JAVA_HOME的路径,然后保存;

@rem set JAVA_HOME=%JAVA_HOME%

set JAVA_HOME=D:\java\jdk --jdk安装路径
错误信息:

Error: JAVA_HOME is incorrectly set.
Please update D:\work\hadoop-2.4.1\conf\hadoop-env.cmd
'-Xmx512m' 不是内部或外部命令,也不是可运行的程序
或批处理文件。
原因:java默认安装在C:\Program Files\Java,路径存在空格,所以启动会报错。

解决办法:修改etc/hadoop/hadoop-env.cmd中的JAVA_HOME配置。将C:\Program Files\Java\jdk1.7.0_79修改为C:\Progra~1\Java\jdk1.7.0_79。

Progra~1 = 'Program Files'
Progra~2 = 'Program Files(x86)'

 

 

四、替换文件

下载到的hadooponwindows-master.zip,解压,将bin目录(包含以下.dll和.exe文件)文件替换原来hadoop目录下的bin目录;

五、运行环境

1.运行cmd窗口,执行“hdfs namenode -format”; 
2.运行cmd窗口,切换到hadoop的sbin目录,执行“start-all.cmd”,它将会启动以下进程。

成功后,如图: 
Windows平台安装配置Hadoop_第2张图片


至此,hadoop服务已经搭建完毕。

接下来上传测试,操作HDFS

根据你core-site.xml的配置,接下来你就可以通过:hdfs://localhost:9000来对hdfs进行操作了。

1.创建输入目录

C:\WINDOWS\system32>hadoop fs -mkdir hdfs://localhost:9000/user/ C:\WINDOWS\system32>hadoop fs -mkdir hdfs://localhost:9000/user/wcinput

2.上传数据到目录

C:\WINDOWS\system32>hadoop fs -put D:\file1.txt hdfs://localhost:9000/user/wcinput C:\WINDOWS\system32>hadoop fs -put D:\file2.txt hdfs://localhost:9000/user/wcinput

3.查看文件 
Windows平台安装配置Hadoop_第3张图片

大功告成。


附录:hadoop自带的web控制台GUI

1.资源管理GUI:http://localhost:8088/; 
Windows平台安装配置Hadoop_第4张图片

2.节点管理GUI:http://localhost:50070/; 
Windows平台安装配置Hadoop_第5张图片

 
 

 

你可能感兴趣的:(Windows平台安装配置Hadoop)