CMD命令行模式下使用Scala进行词频统计

1.首先创建一个数组

2.对这个数组进行flatMap操作(等于先 map操作后进行 flatten 操作)

3.要进行统计就需要进行分组

 可以看出分组之后变为了Map集合,其中都是key-value对

4.将value取出来并统计其长度

5.将结果转换为List集合

6.进行排序

sortBy(x=>-x._2)为降序

你可能感兴趣的:(大数据,Scala)