做一个词频统计程序,该程序具有以下功能 基本要求: (1)可导入任意英文文本文件 (2)统计该英文文件中单词数和各单词出现的频率(次数),并能将单词按字典顺序输出。 (3)将单词及频率写入文件。

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.util.Map;
import java.util.Set;
import java.util.TreeMap;

public class Test44 {

    public static void main(String[] args) throws IOException {
        BufferedReader bufferedReader = new BufferedReader(new FileReader("E:/程序设计方法学/第二次上机任务/in.txt"));
        BufferedWriter bufferedWriter = new BufferedWriter(new FileWriter("E:/程序设计方法学/第二次上机任务/out.txt"));
        String s;
        while ((s = bufferedReader.readLine()) != null) {
            Map map = new TreeMap();
            //创建一个words数组,分割字符串,来统计单词出现的次数
            String[] words = s.split("[【】、.。,\"!--;:?\'\\] ]");
            for (int i = 0; i < words.length; i++) {
                String key = words[i].toLowerCase();
                if (key.length() > 0) {
                    if (!map.containsKey(key)) {
                        map.put(key, 1);
                    } else {// 如果不是第一次出现,就把value值++,那么value值是多少就是出现了几次
                        int value = map.get(key);
                        value++;
                        map.put(key, value);
                    }
                }
            }
            Set> entrySet = map.entrySet();
            for (Map.Entry entry : entrySet) {
                //System.out.println(entry.getKey() + "---" + entry.getValue());
                bufferedWriter.write(entry.getKey() +"---"+ entry.getValue()+"\r\n");
            }
            bufferedWriter.newLine();
        }
        // 关闭输入输出流
        bufferedReader.close();
        bufferedWriter.close();
    }
}
 

你可能感兴趣的:(做一个词频统计程序,该程序具有以下功能 基本要求: (1)可导入任意英文文本文件 (2)统计该英文文件中单词数和各单词出现的频率(次数),并能将单词按字典顺序输出。 (3)将单词及频率写入文件。)