Hadoop与eclipse连接

上一篇在win7虚拟机下搭建了hadoop2.6.0伪分布式环境。为了开发调试方便,本文介绍在eclipse下搭建开发环境,连接和提交任务到hadoop集群。

1. 环境

Eclipse版本Luna 4.4.1Hadoop与eclipse连接_第1张图片

Hadoop与eclipse连接_第2张图片Hadoop与eclipse连接_第3张图片











安装插件hadoop-eclipse-plugin-2.6.0.jar,下载后放到eclipse/plugins目录即可。

2. 配置插件

2.1 配置hadoop主目录

解压缩hadoop-2.6.0.tar.gzC:\Downloads\hadoop-2.6.0,在eclipseWindows->PreferencesHadoop Map/Reduce中设置安装目录。

Hadoop与eclipse连接_第4张图片

2.2 配置插件

打开Windows->Open Perspective中的Map/Reduce,在此perspective下进行hadoop程序开发。

Hadoop与eclipse连接_第5张图片 Hadoop与eclipse连接_第6张图片

打开Windows->Show View中的Map/Reduce Locations,如下图右键选择New Hadoop location…新建hadoop连接。

Hadoop与eclipse连接_第7张图片




Hadoop与eclipse连接_第8张图片

确认完成以后如下,eclipse会连接hadoop集群。

Hadoop与eclipse连接_第9张图片

3. 开发hadoop程序

3.1 程序开发

开发一个Sort示例,对输入整数进行排序。输入文件格式是每行一个整数。

View Code


3.2 配置文件

log4j.propertieshadoop集群中的core-site.xml加入到classpath中。我的示例工程是maven组织,因此放到src/main/resources目录。

Hadoop与eclipse连接_第10张图片

程序执行时会从core-site.xml中获取hdfs地址。

3.3 程序执行

右键选择Run As -> Run Configurations…,在参数中填好输入输出目录,执行Run即可。

Hadoop与eclipse连接_第11张图片

执行日志:

 View Code


4. 可能出现的问题

4.1 权限问题,无法访问HDFS

修改集群hdfs-site.xml配置,关闭hadoop集群的权限校验。

dfs.permissions

false

4.2 出现NullPointerException异常

在环境变量中配置%HADOOP_HOME%C:\Download\hadoop-2.6.0\

下载winutils.exehadoop.dllC:\Download\hadoop-2.6.0\bin

注意:网上很多资料说的是下载hadoop-common-2.2.0-bin-master.zip,但很多不支持hadoop2.6.0版本。需要下载支持hadoop2.6.0版本的程序。

4.3 程序执行失败

需要执行Run on Hadoop,而不是Java Application



9000是HDFS的namenode的端口号



Hadoop与eclipse连接_第12张图片

你可能感兴趣的:(Hadoop)