使用Hadoop运行WorldCount示例

使用Hadoop运行WorldCount示例

上一节中我们搭建好了Hadoop的运行环境,虽然还没开始学习Hadoop各个组件的框架原理,但是我先来通过hadoop运行自带的worldcount示例来熟悉一下它的操作流程。
1.首先找到hadoop自带worldcount jar包示例的路径:
使用Hadoop运行WorldCount示例_第1张图片
2.准备工作,需要创建输入输出路径以及上传的文件:
(1)创建目录

 hadoop fs -mkdir -p /data/wordcount 

使用Hadoop运行WorldCount示例_第2张图片

hadoop fs -mkdir -p /output/

使用Hadoop运行WorldCount示例_第3张图片
(2)新建输入文件inputWord:

vim /usr/inputWord

使用Hadoop运行WorldCount示例_第4张图片
将本地准备的输入文件上传到hdfs中:

hadoop fs -put /usr/inputWord /data/wordcount

上传成功后可以通过命令查看hdfs里的文件

hadoop fs -ls /data/wordcount
hadoop fs -text /data/wordcount/inputWord

使用Hadoop运行WorldCount示例_第5张图片
3.准备工作做完之后就可以运行实例了,执行命令

hadoop jar hadoop-mapreduce-examples-2.8.0.jar wordcount /data/wordcount /output/wordcountresult

可以看到控制台输出信息如下:
使用Hadoop运行WorldCount示例_第6张图片

4.查看执行结果

 hadoop fs -text /output/wordcountresult/part-r-00000

使用Hadoop运行WorldCount示例_第7张图片
以上hadoop自带的wordcount实例运行结束

你可能感兴趣的:(hadoop)