ictclas4j bug总结

1.漏字

Eg: 林心如主演的倾世王妃

分词结果为:林如/nr 主演/v 的/u 倾/v 世/ng 王妃/n

漏掉了“心”字

解决办法:将PosTagger.java中personRecognize方法里的如下if语句直接注释掉

if (sn.getPos() < 4
        && unknownDict.getFreq(sn.getWord(), sn.getPos())
        < Utility.LITTLE_FREQUENCY)

 

2.Dictionary.java中getMaxMatch方法

for (int j = 0; j < wis.size(); j++) 这一行出现NullPointerException

解决办法:在for之前加上如下判断语句

if (wis == null) {
      return null;
}

 

3.Dictionary.java中addItem,save不能完成新词的添加

 

 

http://wenku.baidu.com/view/6c16deed6294dd88d0d26bce.html

http://tinypig.iteye.com/blog/250926

http://emily2ly.iteye.com/blog/742870

你可能感兴趣的:(Tcl)