hadoop windows setup

准备步骤:
1.eclipse安装程序(我的是3.7).

2.eclipse和hadoop的插件安装包:hadoop-0.20.3-dev-eclipse-plugin.jar.

3.hadoop 的安装包我用的是:hadoop-0.20.2 版本.

4.cygwin 虚拟linux环境. http://www.cygwin.com/setup.exe


eclipse下配置hadoop步骤:
1.将 hadoop-0.20.3-dev-eclipse-plugin.jar放到到 eclipse安装目录/plugins/ 下。

2.重启eclipse,配置hadoop installation directory。

如果安装插件成功,打开Window-->Preferens,你会发现Hadoop Map/Reduce选项,在这个选项里你需要配置Hadoop installation directory。配置完成后退出。

3.配置Map/Reduce Locations。
在Window-->Show View中打开Map/Reduce Locations。
在Map/Reduce Locations中新建一个Hadoop Location。在这个View中,右键-->New Hadoop Location。在弹出的对话框中你需要配置Location name,如myubuntu,还有Map/Reduce Master和DFS Master。这里面的Host、Port分别为mapred-site.xml、core-site.xml中配置的地址及端口。

4.新建项目。
File-->New-->Other-->Map/Reduce Project
项目名可以随便取,如hadoop-test。
复制 hadoop安装目录/src/example/org/apache/hadoop/example/的demo到刚才新建的项目下面。

5.上传模拟数据文件夹。
为了运行程序,我们需要一个输入的文件夹,和输出的文件夹。输出文件夹,在程序运行完成后会自动生成。我们需要给程序一个输入文件夹。
在当前目录(如hadoop安装目录)下新建文件夹input,并在文件夹下新建两个文件file,内容如下:
file:Hello Hadoop Goodbye Hadoop
6.运行项目。
a..在新建的项目hadoop-test,点击WordCount.java,右键-->Run As-->Run Configurations
b..在弹出的Run Configurations对话框中,点Java Application,右键-->New,这时会新建一个application名为WordCount
c..配置运行参数,点Arguments,在Program arguments中输入“你要传给程序的输入文件夹和你要求程序将计算结果保存的文件夹”,如
  1. hdfs://localhost:9000/user/Administrator/input01 hdfs://localhost:9000/user/Administrator/output01  
[plain] view plain copy
  1. hdfs://localhost:9000/user/Administrator/input01 hdfs://localhost:9000/user/Administrator/output01  

7.点击Run on hadoop,运行程序。
8.等运行结束后,可以在终端中用命令 bin/hadoop fs -cat output01/*  查看生成的文件内容。


注意点:
1.如果插件安装完成之后,无法正常使用,总是报错。建议使用新的eclipse或者是新的插件

2.在配置hadoop的时候,注意其中文件的描述要正确,主机和端口。


如果不想麻烦:可以使用hadoop4win来尝试。

你可能感兴趣的:(hadoop,安装)