[置顶] 本博客中中文分词索引页

中文分词系统
基础理论:
搜索引擎技术揭密:中文分词技术  这篇文章概念讲得比较清晰
搜索引擎之中文分词(Chinese Word Segmentation)简介
中文自动分词 ——摘自《搜索引擎 ——原理技术与系统》   摘自一本书,算法思想讲得不错
话说搜索引擎分词
浙大一位同学的中文分词算法
一种规则与统计相结合的汉语分词方法
常用分词方法:
正向最大匹配
逆向最大匹配
【转】基于统计的词网格分词
更多: 中文分词和搜索引擎
Lucene介绍:
本博客中有关Lucene的讲解
分词模型:
基于统计:
基于CRF的中文分词
隐马尔科夫模型HMM
隐马尔科夫模型HMM自学(一)
隐马尔科夫模型HMM自学(二)
隐马尔科夫模型HMM自学 (三)
现有搜索引擎的分析:
百度的分词算法
现有的一些技术:
几个免费的中文分词模块
【转】开源中文分词软件分析
java语言的开源工具: http://open-open.com/74.htm
IKAnalyzer中文分词的学习:
IKAnalyzer中文分词分析内容目录
 ICTCLAS  计算所汉语词法分析系统
主页: http://www.ictclas.org/
深入学习资料: http://www.cnblogs.com/zhenyulu/category/85598.html
fenci,Java 的 ICTCLAS
下载地址:
安装使用: ICTCLAS分词系统Java调用接口在Eclipse中的安装- Java编程

你可能感兴趣的:(java,eclipse,算法,搜索引擎,Lucene,网格)