IKAnalyzer中文分词快速入门

IK Analyzer是一个基于Java的中文分词工具包。起初是基于Apache的Lucene项目,目前已经成为一个独立的分词组件。下文仅实现利用IK Analyzer分词(采用的包为IKAnalyzer2012_u5)。

String text = "在中国进入全面建成小康社会决定性阶段,胡锦涛同志所作的十八大报告,浓缩了改革开放以来特别是最近十年来党领导中国发展建设的经验与启示,勾画出中国未来发展的蓝图。报告中的新表述、新思想、新论断,引发了与会代表和各界干部群众的广泛关注。"; 
		
//独立Lucene实现
StringReader re = new StringReader(text);
IKSegmenter ik = new IKSegmenter(re,true);
Lexeme lex = null;
try {
    while((lex=ik.next())!=null){
    System.out.print(lex.getLexemeText()+"|");
}

分词结果:

在|中国|进入|全面|建成|小康社会|决定性|阶段|胡锦涛|同志|所作|的|十八|大|报告|浓缩|了|改革开放|以来|特别是|最近|十|年来|党领导|中国|发展|建设|的|经验|与|启示|勾画出|中国|未来|发展|的|蓝图|报告|中|的|新|表述|新思想|新论断|引|发了|与会代表|和|各界|干部群众|的|广泛|关注|


你可能感兴趣的:(IKAnalyzer,教程,中文分词)