Java开源分词系统IKAnalyzer学习(一) 大致简介

 

首先申明,我这里只用到IKAnalyzer独立于Luncene的分词组件,所以会跟作者原本的使用手册信息略不同

1.IKAnalyzer 3.X介绍

    IK Analyzer 是一个开源的,基于java 语言开发的轻量级的中文分词工具包。从2006年12 月推出1.0 版开始, IKAnalyzer 已经推出了3 个大版本。最初,它是以开源项目Luence 为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer 3.X 则发展为面向Java 的公用分词组件,独立于Lucene 项目,同时提供了对Lucene 的默认优化实现。

 

作者:

 

Blog : linliangyi2007.javaeye.com

Email : [email protected]

 

下载地址:http://code.google.com/p/ik-analyzer/downloads/list  

当中的 IKAnalyzer3.2.5Stable_bin.zip 含有它的使用手册,但它的使用手册是需要用到lucene的,所以可以参考,但我这是重新改动一下,为了自己和大家能更好地理解

 

 

 

 

1.1 IK Analyzer 3.X结构设计

Java开源分词系统IKAnalyzer学习(一) 大致简介_第1张图片

 

 

 

1.2 IK Analyzer 3.X特性

你可能感兴趣的:(java,算法,优化,Blog,Lucene,语言)