大数据学习笔记(二)-官方案例-Grep/WordCount

1、官方Grep案例

1.首先,在hadoop-2.7.2文件夹下创建一个input目录
然后,将etc/hadoop/*.xml复制到input目录中

cp etc/hadoop/*.xml input/

2.然后启动hadoop中的examples包中的grep案例,知道input路径和output路径,
注意:此时若output文件夹存在,则会报output已存在错误

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input/ output 'dfs[a-z]+'


执行完之后,output目录下将多两个文件
大数据学习笔记(二)-官方案例-Grep/WordCount_第1张图片
_success是一个标识,结果在part-r-00000文件中
打开看看:说明运行成功,有一处满足规定的正则表达式‘dfs[a-z]+’
大数据学习笔记(二)-官方案例-Grep/WordCount_第2张图片

2.hadoop只经典WordCount案例

  1. 在hadoop2.7.2目录下创建wcinput文件夹,在该文件夹中创建wc.input文件,vi编辑器写入几个单词,内容如下
    大数据学习笔记(二)-官方案例-Grep/WordCount_第3张图片
  2. 执行wordcount案例
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput wcoutput

大数据学习笔记(二)-官方案例-Grep/WordCount_第4张图片

  1. 查看结果
    大数据学习笔记(二)-官方案例-Grep/WordCount_第5张图片
    可以看到,刚刚在文件中输入的单词被统计出数量了。
    WordCount案例完成

你可能感兴趣的:(大数据学习笔记,hadoop,mapreduce,大数据)