使用Eclipse连接远程Hadoop集群并运行实例

  1. 首先将Hadoop解压到本地

使用Eclipse连接远程Hadoop集群并运行实例_第1张图片

  1. 在bin中添加两个文件hadoop.dll和winutils.exe

使用Eclipse连接远程Hadoop集群并运行实例_第2张图片

不自带,需要从网上下载(过段时间发上来)

1.x版本的不适用

  1. 添加Eclipse-Hadoop-plugins插件放到Eclipse安装目录的plugins文件夹中

使用Eclipse连接远程Hadoop集群并运行实例_第3张图片

  1. 添加环境

使用Eclipse连接远程Hadoop集群并运行实例_第4张图片

使用Eclipse连接远程Hadoop集群并运行实例_第5张图片

Path末加D:\softWare\hadoop\hadoop-2.6.5\bin

  1. 启动Eclipse

使用Eclipse连接远程Hadoop集群并运行实例_第6张图片

使用Eclipse连接远程Hadoop集群并运行实例_第7张图片

使用Eclipse连接远程Hadoop集群并运行实例_第8张图片

  1. 新建连接

使用Eclipse连接远程Hadoop集群并运行实例_第9张图片

使用Eclipse连接远程Hadoop集群并运行实例_第10张图片

  1. 1

使用Eclipse连接远程Hadoop集群并运行实例_第11张图片

与这里的一致

使用Eclipse连接远程Hadoop集群并运行实例_第12张图片

  1. 运行wordCount程序

使用Eclipse连接远程Hadoop集群并运行实例_第13张图片

使用Eclipse连接远程Hadoop集群并运行实例_第14张图片

使用Eclipse连接远程Hadoop集群并运行实例_第15张图片

复制过来

  1. 新建文件夹,以及一个文件

使用Eclipse连接远程Hadoop集群并运行实例_第16张图片

使用Eclipse连接远程Hadoop集群并运行实例_第17张图片

将这个文件上传到dfs

使用Eclipse连接远程Hadoop集群并运行实例_第18张图片

  1. 进行运行前的配置

使用Eclipse连接远程Hadoop集群并运行实例_第19张图片

使用Eclipse连接远程Hadoop集群并运行实例_第20张图片

  1. 运行查看结果

初次运行只打印了这些

使用Eclipse连接远程Hadoop集群并运行实例_第21张图片

这种情况一般是由于log4j这个日志信息打印模块的配置信息没有给出造成的,可以在项目的src目录下,新建一个文件new->other->general->file,命名为“log4j.properties”,填入以下信息:

log4j.rootLogger=INFO, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=target/spring.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

保存后重新运行即可成功。

成功:

使用Eclipse连接远程Hadoop集群并运行实例_第22张图片

使用Eclipse连接远程Hadoop集群并运行实例_第23张图片

使用Eclipse连接远程Hadoop集群并运行实例_第24张图片

 

 

如果没有指定输入输出路径控制台只打印这个

Usage: wordcount [...]

你可能感兴趣的:(使用Eclipse连接远程Hadoop集群并运行实例)