Hadoop自带WordCount进行词频统计(mapreduce)

Hadoop自带WordCount进行词频统计

准备:

  • 安装好的Hadoop
  • 需要统计词频txt文件(用jieba分过词的
    链接: pycharm 分词 jieba 结巴分词输出txt.

step1


启动Hadoop

cd /usr/local/hadoop
./sbin/start-all.sh

Hadoop自带WordCount进行词频统计(mapreduce)_第1张图片
用jps命令查看是否开启成功
Hadoop自带WordCount进行词频统计(mapreduce)_第2张图片
准备好需要统计词频的txt文件(也可以用filezilla传入Ubuntu)
链接: 如何用filezilla连接Ubuntu.

  • 找到Hadoop文件所在位置

你可能感兴趣的:(wordcount,词频,hadoop,mapreduce)