Java 进行词频统计,并按单词顺序顺序排序

本文针对以前一篇的博客 java进行文本单词的词频统计 进行补充,在统计文本词频之后,又对map按key值进行排序,即按单词顺序排序。

package com.cute.test;

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Comparator;
import java.util.List;
import java.util.Map;
import java.util.Map.Entry;
import java.util.TreeMap;

public class SortMapTest {

	public static void main(String[] args) throws IOException {

		BufferedReader br = new BufferedReader(new FileReader("F:/test/source.txt"));
		List lists = new ArrayList(); // 存储过滤后单词的列表
		String readLine = null;
		while ((readLine = br.readLine()) != null) {
			String[] wordsArr1 = readLine.split("[^a-zA-Z]"); // 过滤出只含有字母的
			for (String word : wordsArr1) {
				if (word.length() != 0) { // 去除长度为0的行
					lists.add(word);
				}
			}
		}

		br.close();

		Map wordsCount = new TreeMap(); // 存储单词计数信息,key值为单词,value为单词数

		// 单词的词频统计
		for (String li : lists) {
			if (wordsCount.get(li) != null) {
				wordsCount.put(li, wordsCount.get(li) + 1);
			} else {
				wordsCount.put(li, 1);
			}

		}

		// 对map利用key排序
		Map resMap = sortMapByKey(wordsCount);

		for (Entry entry : resMap.entrySet()) {
			System.out.println(entry.getKey() + " " + entry.getValue());
		}
	}

	/**
	 * 让 Map按key进行排序
	 */
	public static Map sortMapByKey(Map map) {
		if (map == null || map.isEmpty()) {
			return null;
		}
		Map sortMap = new TreeMap(new MapKeyComparator());
		sortMap.putAll(map);
		return sortMap;
	}
}

// 实现一个比较器类

class MapKeyComparator implements Comparator {

	@Override
	public int compare(String s1, String s2) {
		return s1.compareTo(s2); // 从小到大排序
	}
}

输出结果:

Java 进行词频统计,并按单词顺序顺序排序_第1张图片

基咯咯  767696856


你可能感兴趣的:(Java)