Apache: Lucene Project
http://jakarta.apache.org/lucene/
Lucene开发/用户邮件列表归档
[email protected]
[email protected]
The Lucene search engine: Powerful, flexible, and free
http://www.javaworld.com/javaworld/jw-09-2000/jw-0915-Lucene_p.html
Lucene Tutorial
http://www.darksleep.com/puff/lucene/lucene.html
Notes on distributed searching with Lucene
http://home.clara.net/markharwood/lucene/
中文语言的切分词
http://www.google.com/search?sourceid=navclient&hl=zh-CN&q=chinese+word+segment
搜索引擎工具介绍
http://searchtools.com/
Lucene作者Cutting的几篇论文和专利
http://lucene.sourceforge.net/publications.html
Lucene的.NET实现:dotLucene
http://sourceforge.net/projects/dotlucene/
Lucene作者Cutting的另外一个项目:基于Java的搜索引擎Nutch
http://www.nutch.org/ http://sourceforge.net/projects/nutch/
关于基于词表和N-Gram的切分词比较
http://china.nikkeibp.co.jp/cgi-bin/china/news/int/int200302100112.html
[1]胡盈盈.单汉字标引与检索技术综析[M].南京大学信息管理系,..
[2]张政保.全文数据库研究[M].中山大学,1995..
[3]杨沛.全文数据库索引机制的比较研究[M].中国科技信息研究所,1995..
[4]Lucene 1.2-RC4 API.http://jakarta.apache.org/lucene/docs/api/index.html, 2002.
[5]java offical web site.http://java.sun.com/,2002.
* “用 Lucene 加速 Web 搜索应用程序的开发”(Deng Peng Zhou,developerWorks,2006 年 8 月):了解关于 Lucene 搜索库的更多信息,该库用作 Solr 的基础库。
* “Parsing, indexing, and searching XML with Digester and Lucene”(Otis Gospodneti,developerWorks,2003 年 6 月):Lucene 初探。
* Solr 主页:学习教程、浏览 Javadocs 并随时关注 Solr 社区。
* Solr Wiki:查看 Wiki 获取关于 Solr 运作的众多文档。
* Solr 分析:了解关于 Solr 的分析器、断词工具和标记筛选器工作原理的更多信息。
* Lucene QueryParser Syntax:了解关于 Solr 和 Lucene 的查询解析器语法的更多信息。
* The Porter Stemming Algorithm:了解关于 Solr 使用的词干提取算法的更多信息。
* Public Websites using Solr:使用 Solr 功能的 Web 站点的清单。
* Lucene Java 主页:探索 Solr 的起源。
* Lucene In Action (Otis Gospodneti and Erik Hatcher;Manning,2004 年):对 Lucene 有兴趣的人的必读之作。
* developerWorks Java 技术专区:关于 Java 编程各个方面的数百篇文章。
*
*
Introduction to Text Indexing with Apache Jakarta Lucene
http://www.onjava.com/pub/a/onjava/2003/01/15/lucene.html
Advanced Text Indexing with Lucene
http://www.onjava.com/pub/a/onjava/2003/03/05/lucene.html
关于Chedong的blog(非常著名,汉语)
http://www.chedong.com/tech/lucene.html
Lucene全文检索实践
http://www.infor96.com/~nio/comments.php?id=84_0_1_0_C
关于Lucene的基本概念
http://www.cnblogs.com/lucene/archive/2004/12/20/79804.html
Lucene使用者沙龙(为Chedong和一些朋友的沙龙,有ppt和http://blog.cnblog.org/archives/2005/07/luceneaecee.html
Lucene研究之一——起源、现状及初步应用http://jalorsoft.com/holen/holen_lucene_01.html
Lucene研究之二——系统结构分析初步(已阅)
http://jalorsoft.com/holen/holen_lucene_02.html
系统讲了Lucene架构(英文)
http://www-igm.univ-mlv.fr/~dr/XPOSE2003/lucene/node1.html
Doug Cutting(Lucene作者)做的关于Lucene的架构解说
http://lucene.sourceforge.net/talks/pisa/
English StopWords列表
http://www.onjava.com/onjava/2003/01/15/examples/EnglishStopWords.txt