要用到全站搜索就自己搭建了个solr 这是比lunce更优化一些的搜索方式,搭建在java环境上面,可以和数据库绑定,增量的导入数据,可以架在tomcat resin等servlet容器中,我选择了tomcat。
一,搭建jdk环境
下载jkd1.6 http://harmony.apache.org/download.cgi解压后安装到自己制定的目录下面我装在D:\Program Files\Java\jdk1.6.0_23
配置环境变量 java_home指到装jdk的根目录,path(jdk运行时要找的bin目录)D:\Program Files\Java\jdk1.6.0_23\bin classpath (jdk运行时要加载的类库)D:\Program Files\Java\jdk1.6.0_23\lib
配置完后在命令行中 输入javac 看到基本信息就说明安装jdk成功了,
二,安装servlet容器tomcat
下载tomcat6.0 有两种版本一种是安装版的,另一种是直接解压缩文件的,装完之后要配置tomcat_home就是tomcat的安装路径。建议使用安装版他会自动寻找jdk并加载到容器中,
安装完后在浏览器中输入localhost:8080(8080是默认端口,可以在tomcat下的config->web.xml文件中配置)页面出现it works说明安装成了,
三,安装solr
下载1.4或1.3的版本,http://www.apache.org/dyn/closer.cgi/lucene/solr/下载完后把他解压到文件夹中,在dist文件夹下有一个apache-solr-1.4.1.war文件,把他拷贝到tomcat的webapps下面,改名为solr.war重启tomcat,他会自动解压成目录solr的。让后再本地磁盘上见一个solr_tomcat文件夹用来存放slor的基本信息在下面建一个solr文件夹把刚解压的包里面的expamle->solr下面的内容全部拷贝到里面,并在环境变量中配置路径,路径名字为solr.solr.home
配置完后还要去tomcat中刚解压完的solr目录中修改配置文件,让他可以找到刚建的目录,在solr->web_Inf下的web.xml文件中,加入 <env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>E:/solr-tomcat/solr</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>只需要改路径为你建的路径就可以了,
重启tomcat在浏览器中输入localhost:8080/solr/admin就会看到一个solr的欢迎界面。
四,配置分词信息及中文分词
在刚建的solr目录中E:\solr-tomcat\solr\conf 有一个schems.xml里面是分词的详细配置,包括字段的定义,分词器的选择,搜索的基本信息等,默认的是空格分词,要用中文的话自带的有一个,但最好用庖丁解牛这个分词包,这个包要自己下载并加载到环境变量中,并建立词典。
五,增量导入数据
增量导入是定期把数据生成文本文件给solr可以让他搜索。
六,遇到的问题及解决
待续