java读取一篇英语文章并且统计出单词出现的频率并从高到低输出

package com.amt.crm.controller;

import java.io.BufferedReader;
import java.io.FileReader;
import java.util.*;


public class test2 {
    public static void main(String [] args) throws Exception {

        BufferedReader br = new BufferedReader(new FileReader("C:\\test1\\b.txt"));

        StringBuffer sb = new StringBuffer();
        String text =null;
        while ((text=br.readLine())!= null){
            sb.append(text);// 将读取出的字符追加到stringbuffer中
        }
        br.close();  // 关闭读入流

        String str = sb.toString().toLowerCase(); // 将stringBuffer转为字符并转换为小写
        String[] words = str.split("[^(a-zA-Z)]+");  // 非单词的字符来分割,得到所有单词
        Map map = new HashMap() ;

        for(String word :words){
            if(map.get(word)==null){  // 若不存在说明是第一次,则加入到map,出现次数为1
                map.put(word,1);
            }else{
                map.put(word,map.get(word)+1);  // 若存在,次数累加1
            }
        }

        // 排序
        List> list = new ArrayList>(map.entrySet());

        Comparator> comparator = new Comparator>() {
            public int compare(Map.Entry left, Map.Entry right) {
                return (left.getValue().compareTo(right.getValue()));
            }
        };
        // 集合默认升序升序
        Collections.sort(list,comparator);

        for(int i=0;i// 由高到低输出
            System.out.println(list.get(list.size()-i-1).getKey() +":"+list.get(list.size()-i-1).getValue());
        }

    }
}

你可能感兴趣的:(面试题)