Solr-之文件索引

阅读更多

*、准备工作

#一个容纳solr的Tomcat容器
tomcat放solr4.*的solr.war包
#一个任一的文件目录solr_home
solr_home下放solr4.*中的collection1文件夹
#一个core1文件夹来源可以是solr4.*的example的muti里面的core1
core1也放于solr_home根目录下
#放于core1/conf下的stopwords.txt和synonyms.txt两个文件
#放于core1下的extract即jar的集合
注意路径,详见教程

 

*、执行流程

#solr4.10.3部署tomcat7
https://blog.csdn.net/u010623907/article/details/45056039
另外:其实copy的solr文件夹只需要collection1即可
#solr4.*新建一个core
https://blog.csdn.net/clj198606061111/article/details/21288499
#solr4.*索引pdf.txt.word等文件javademo程序
https://blog.csdn.net/u011439289/article/details/41721937
另外:注意extract文件夹的位置解释
#solr4.*索引pdf.txt.word等文件-补充1
https://blog.csdn.net/clj198606061111/article/details/21492457
另外:urlstring注意没有#直接/solr/core_name即可
#solr4.*索引pdf.txt.word等文件-补充2
https://blog.csdn.net/lipingping951462/article/details/52711495
另外:该链接对代码有注释更易理解
还有ContentStreamUpdateRequest的参数一定要和solrconfig.xml配置requestHandler的一样
不然你可能会遇到下面的异常:
solr.client.solrj.impl.HttpSolrServer$RemoteSolrException: Expected mime type
曾参考过以下案例,才检查出粗心造成的问题即core或handler的配置路径有误
https://www.cnblogs.com/flybird2014/p/4093150.html

 

*、运行java程序后可以查看到具体索引后的信息

单机单core版本:
new HttpSolrServer(指定core路径的请求)-->server
server.request(...)即可
集群多core版本:
CloudSolrServer获取连接-->server
server.request(...)即可

 

*、为何文本内容自动进入text属性了?没找到,无语ing

 

你可能感兴趣的:(solr文件索引,solr非结构化文件索引,solr索引java实例)