Java简单实现汉语词频统计

需求需要一个词频统计,先写了一个简单的demo,就是先用ArrayList保存词语,然后用遍历用HashMap去存储数量和词语。

import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

import org.junit.Test;

public class TestWordCount {
    @Test
    public void testWordCount(){
        List<String> wordList=new ArrayList<String>();
        wordList.add("我");
        wordList.add("你");
        wordList.add("我");
        wordList.add("他");
        wordList.add("他");
        wordList.add("那个");
        wordList.add("哪个");
        wordList.add("谁");
        System.out.println(wordList);
        Map<String,Integer> amountWord=new HashMap<String,Integer>();
        for (String string : wordList) {
            if(!amountWord.containsKey(string)){
                amountWord.put(string,1);
            }else{
                amountWord.put(string, amountWord.get(string).intValue()+1);
            }
        }
        System.out.println(amountWord);
    }
}

Java简单实现汉语词频统计_第1张图片

你可能感兴趣的:(java,源码)