【Hadoop学习】本地模式下的官方grep和wordcount案例

1.grep案例
1)在hadoop-2.7.2文件下新建一个input文件夹

mkdir input

【Hadoop学习】本地模式下的官方grep和wordcount案例_第1张图片
2)将/etc/hadoop目录下所有的配置文件拷贝到input文件夹下面
cp etc/hadoop/*.xml input/
在这里插入图片描述
3)运行grep命令筛选出符合规则的结果
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input/ output 'dfs[a-z.]+'
将input文件夹内容作为输入,根据examples里面的程序将结果以dfs开头存到output文件夹中
【Hadoop学习】本地模式下的官方grep和wordcount案例_第2张图片
4)查看结果
cd output/
此时文件夹中多了两个文件
在这里插入图片描述
cat part-r-00000
查看第一个文件,答案在里面
在这里插入图片描述

  • attention
    • output文件夹一开始不存在,如果存在了会出错
    • 多使用tab键

2.wordcount案例
1)在hadoop-2.7.2文件下新建一个wcinput文件夹,在wcinput文件下新建wcinput文件
mkdir wcinput
在这里插入图片描述
touch wcinput.input
在这里插入图片描述
2)在wc.input文件中写一些数据用来统计
vi wcinput.input
【Hadoop学习】本地模式下的官方grep和wordcount案例_第3张图片
3)运行例子wordcout,结果输出到wcoutput
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput/ wcoutput
【Hadoop学习】本地模式下的官方grep和wordcount案例_第4张图片
4)查看运行结果
cat part-r-00000
【Hadoop学习】本地模式下的官方grep和wordcount案例_第5张图片

你可能感兴趣的:(Hadoop学习)