Solr/Lucene分布式搜索,Solr Integrate katta step1

katta项目主页:http://katta.sourceforge.net/

Katta的介绍:http://blog.sina.com.cn/s/blog_43b8e6dd0100ne4b.html

关于Solr整合Katta的讨论https://issues.apache.org/jira/browse/SOLR-1395

1.下载

katta:http://sourceforge.net/projects/katta/files/katta/

solr:http://lucene.apache.org/solr/

在上面的讨论中似乎是使用的Lucene4.0,Katta0.6.2

我直接使用

katta:0.6.3

solr:3.6.1

2.分布式搜索是一个好的解决方案,自己动手开发是有很大难度的.我相信使用Lucene的人很多,并且也很多是直接使用Solr的.能把Lucene的索引文件放到Hadoop HDFS文件系统上我想是一个终极解决方案,但是最终要的是能做索引分片,并且能提供分布式搜索.Lucene的创始人Doug Cutting 也是建议katta这个解决方案的.见: http://wiki.apache.org/hadoop/DistributedLucene

因为涉及的技术比较多,而且技术门槛也较高,鲜有人整合成功.其中涉及的技术包括:Lucene,Solr,Katta,ZooKeeper,Hadoop RPC.最主要的整合Lucene和Solr必须有较深的实战经验.


3.整合

下载Solr3.6.1源码,solr-core,solrj两个,下载Katta-0.6.3源码,katta.zip解压后在src目录下已经存在.把这三个导入到Eclipse.如

Solr/Lucene分布式搜索,Solr Integrate katta step1_第1张图片

整理好上面三个项目,并且使其能通过编译.

再创建一个java项目:如solr-katta-plugin,这个项目依赖于katta,solr-core,solrj.如:Solr/Lucene分布式搜索,Solr Integrate katta step1_第2张图片

在https://issues.apache.org/jira/browse/SOLR-1395上下载几个文件,Solr/Lucene分布式搜索,Solr Integrate katta step1_第3张图片从提交的时间上来看,应该下载我用线条标记了的.在Linux 终端中执行patch -p 0 -i *.patch,[*换成你下载的],当有询问是输入enter,或者输入y等.把源码解压出来.这里我已经OK,需要的读者可以发信给我我可以提供.

所有源码copy到solr-katta-plugin项目下的src目录,正常的话会出现很错误的.

第一步完成.

你可能感兴趣的:(Lucene,Solr,Distributed,integrate,Katta)