solr4.0环境搭建

因近期想搞个知识库,所以选择solr,现在最新的solr是4.0,所以用solr4.0。

服务器:tomcat6

  JDK   :1.6

 SOLR :4.0

中文分词器 :ik-analyzer,mmseg4j


安装:目前mmseg4j的版本是mmseg4j-1.9.0.v20120712-SNAPSHOT,经过测试,发现这个版本有bug:

	java.lang.RuntimeException: java.lang.NoSuchMethodError: org.apache.l
	ucene.analysis.Tokenizer.reset(Ljava/io/Reader;)V
	由于solr4.0对其中的有些类与方法做了调整,所以还是等待mmseg4j新版本修复吧。果断使用了ik-analyzer。
    一、将apache-solr-4.0.0\example\webapps\solr.war放在tomcat的webapps下启动服务器解压该war包,另外还需要增加几个jar包:
	apache-solr-dataimporthandler-4.0.0.jar
	apache-solr-dataimporthandler-extras-4.0.0.jar
	这两个jar包可以在solr的dist中可以找到
	另外还需要相应数据库的驱动包,比如
	mysql-connector-java-5.1.13-bin.jar
    二、将apache-solr-4.0.0\example下的solr拷贝至apache-tomcat-6.0.29-solr\bin下
    三、在apache-tomcat-6.0.29-solr\bin\solr\collection1\conf下的solrconfig.xml增加以下数据库配置
	
       
               
               data-config.xml     
               
   

    四、将apache-tomcat-6.0.29-solr\bin\solr\collection1\conf下增加data-config.xml文件,内容如下:
	
  
      
      
          
              
              
              
            
          
      
 
    五、增加中文分词器,ik-analyzer的配置如下:
	它的安装部署十分简单,将IKAnalyzer2012.jar部署亍项目的lib目录中;IKAnalyzer.cfg.xml不stopword.dic文件放置在class根目录对于web项目,通常是WEB-I	NF/classes目彔,同hibernate、log4j等配置文件相同)下即可
	solr4.0中schema.xml配置解析器:
	
 
	…… 
	 
		 
	
	…… 
六、schema.xml完整配置:
 
  
  
  
        

    

  
       
  
      
     	 
     
   
  
  
  
   
    
     
     
     
   
   
  
 id  
 content  
   
  


  
  

解析: multiValued:是否包含多个值,如果要使用后面的copyField将其他字段放入默认搜索中就必须允许多指,否则会报:multiple values encountered for non multiValued copy field content
			   defaultSearchField配置默认搜索索引,copyField可以将 title、author字段添加至content默认搜索中
	七、登录管理页面:
	中文分词器分词的示例:
	
	query示例:
	
 
  


你可能感兴趣的:(solr)