lucien_zzy

系统全面的认识Solr

系统全面的认识Solr
文章包括：组件关系，简单搭建，solr目录结构，solr源码分析，Solr性能参数，

链接数据库导数据，Solrj操作索引，自动补齐，解析核心配置文件solrconfig.xml，schema.xml等。
其中还包含来自其他博客的优秀资源。

Solr 是什么？

Solr 是一个开源的企业级搜索服务器，底层使用易于扩展和修改的 Java 来实现。服务器通信使用标准的 HTTP 和 XML ，所以如果使用Solr 了解 Java 技术会有用却不是必须的要求。

Solr主要特性有：强大的全文检索功能，高亮显示检索结果，动态集群，数据库接口和电子文档（Word ，PDF 等）的处理。而且 Solr具有高度的可扩展，支持分布搜索和索引的复制。

Solr资源

solr wiki：
http://wiki.apache.org/solr
https://cwiki.apache.org/confluence/display/solr/Apache+Solr+Reference+Guide
solr自动补齐，树结构：
http://www.cnblogs.com/rush/archive/2012/12/30/2839996.html
其他文章：
http://www.aidansu.com/blog/1361.html

Solr各个组件关系图

solr程序包的目录结构

➔ contrib ：存放爱好者贡献的代码。
➔ dist ：存放Solr 构建完成的 JAR 文件、WAR 文件和 Solr 依赖的 JAR 文件。
➔ example ：是一个安装好的Jetty 中间件，其中包括一些样本数据和 Solr 的配置信息。
➔ example/etc ：Jetty 的配置文件。
➔ example/multicore ：当安装Slor multicore 时，用来放置多个 Solr 主目录。
➔ example/example-DIH ：可以作为solr的主目录，里面包含多个索引库，以及hsqldb的数据，里面有连接数据库的配置示例，以及邮件、rss的配置示例。
➔ example/solr ：默认安装时一个Solr 的主目录。
➔ example/webapps ：Solr 的 WAR 文件部署在这里。
➔ docs：Solr 的文档。

一个运行的 Solr 服务其主目录包含了 Solr 的配置文件和数据（Lucene 的索引文件） Solr 的主目录展开后为如下结构：
➔ bin ：建议将集群复制脚本放在这个目录下。
➔ collection1 ：solr的example默认的一个索引库
➔ collection1/conf ：放置配置文件。
➔ collection1/conf/schema.xml ：建立索引的 schema 包含了字段类型定义和其相关的分析器。
➔ collection1/conf/solrconfig.xml ：这个是Solr 主要的配置文件。
➔ collection1/conf/xslt ：包含了很多xslt 文件，这些文件能将 Solr 的 XML 的查询结果转换为特定的格式，比如：Atom/RSS 。
➔ data ：放置 Lucene 产生的索引数据。

solr简易安装

1）把下载下来的solr解压
2）打开命令提示符（开始–>运行–>cmd–>回车），cd到apache-solr-4.0.0文件夹下的example文件夹
3）输入命令：java -jar start.jar
4）打开浏览器输入网址：http://localhost:8983/solr/ 就可以浏览到solr的主页了

5）往solr添加数据：打开一个新的命令提示符，cd到apache-solr-4.0.0文件夹下的example文件夹下的exampledocs文件夹，输入命令：java -jar post.jar -h（帮助命令，可以查看post.jar的执行参数）执行完毕后再输入：java -jar post.jar *.xml
这时查看solr默认的索引库collection1就能看到增加了新的索引文档

6）尝试查询数据：打开浏览器输入网址：http://localhost:8983/solr/collection1/browse 在Find：输入窗口输入：apple 按提交按钮即可搜索到有关apple的信息。

solr+Tomcat部署

1）将E:\tools\solr-4.1.0\dist\solr-4.1.0.war拷贝到Tomcat的webapp目录下
2）solr.solr.home的配置：主要有两种
基于环境变量solr.solr.home
在当前用户的环境变量中（.bash_profile）或在/opt/tomcat/catalina.bat中添加如下环境变量
export JAVA_OPTS="$JAVA_OPTS -Dsolr.solr.home=/opt/solr-tomcat/solr"
评价：此种方法侵入性太大，需要直接修改TOMCAT启动脚本，因此不建议使用

基于JNDI配置
在tomcat的文件夹下增加solr.xml文件，位置如下tomcat/conf/Catalina/localhost/solr.xml ，内容如下:

<?xml version="1.0" encoding="UTF-8"?>
<Context docBase="E:\tools\tomcat\webapps\solr.war" debug="0" crossContext="true" >    
     <Environment name="solr/home" type="java.lang.String" value="E:\tools\tomcat\webapps\solr" override="true" />    
</Context>

评价：此种方法侵入性小，无需修改启动脚本，只需在TOMCAT程序目录的conf/Catalina/localhost下新建一个solr.xml文件即可
3）配置好solr.solr.home之后，直接启动即可。

solr+IKAnalyzer分词
1）下载IK文件包地址：http://code.google.com/p/ik-analyzer/
2）解压，将其中的jar文件放到之前部署的Tomcat的solr 文件夹下位置如下：\tomcat\webapps\solr\WEB-INF\lib
3）修改配置文件solr/collection1/conf/中的schema.xml

<fieldType name="text" class="solr.TextField">
	<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

solr分词器配置http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters

solr使用log4j (或见专题文章)
1）将WEB_INF\lib下的slf相关的jar包删除即将slf4j-jdk-1.7.2.jar删除，增加log4j的jar
2）在src文件夹下增加log4j.properties
增加相应配置即可。但是log4j没有实现logWatch，是的solr主页面logging面板无法设置。

solr+eclipse调试环境搭建
源码编译导入
1)在官网下载对应源码，解压
2)使用ant进行编译为eclipse工程，耗时比较长（ant要求ant1.8.2+ 地址：http://ant.apache.org/）
3)导入eclipse就可以调试了
4)在源码中新建一个WebContent文件夹，复制 solr-4.1.0-src\solr\webapp\web 下的内容至 WebContent；复制 solr-4.1.0-src \solr\example中的solr文件夹复制到 WebContent中，作为solr/home
5)jetty中新建 jetty webapp，设置参数如下

在Arguments面板中的VM arguments中增加 -Dsolr.solr.home=WebContent/solr

6)启动jetty即可。

solr+jetty嵌入式部署启动
1）找到StartSolrJetty类，修改配置如：

2）直接RUN AS--》JAVA Application即可。

新建空白工程
1)在eclipse中新建一个空白的web 工程
2)将WebContent中的内容全部删除，将solr-4.1.0.war解压，解压出来的文件全部复制到WebContent文件夹中；复制 solr-4.1.0-src\solr\example下的solr 文件夹复制到WebContent中，作为solr/home
3)同上小节中的5）设置，启动jetty即可。

连接数据库导入数据
1）在默认主目录的solrconfig.xml中没有配置DataImportHandler，增加这个配置就可以直接连接数据库导入数据。具体参考：http://wiki.apache.org/solr/DataImportHandler
配置如下：

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
    <lst name="defaults">
      <str name="config">data-config.xml</str>
    </lst>
  </requestHandler>

2）conf文件夹下新建data-config.xml文件，配置dataSource，配置如下：

<dataConfig>
<dataSource name="jdbc" driver="oracle.jdbc.driver.OracleDriver" url="jdbc:oracle:thin:@//172.18.83.56:1521/orcl" user="boco2" password="boco2"/>
    <document name="books">
        <entity name="book" query="select * from T_TYBOOK_BEFORE_EBOOKDATABASE">
            <field column="CODE" name="code" />
            <field column="NAME" name="title" />
            <field column="ALTERNATIVETITLE" name="alternativeTitle" />
            <field column="CREATOR" name="creator" />
            <field column="PRICE" name="price" />
            <field column="PUBLISH_DATE" name="publishDate" />
            <field column="ISBN" name="isbn" />
            <field column="TYPE" name="type" />
            <field column="PUBLISH_NAME" name="publishName" />
            <field column="PAGE" name="page" />
            <field column="ABSTRACT" name="abstract" />
            <field column="SALEONDATE" name="saleOnDate" />
            <field column="SALEOFFDATE" name="saleOffDate" />
            <field column="BOOKSTATE" name="bookState" />
            <field column="BOOK_SOURCE" name="bookSource" />
            <field column="IMAGE" name="image" />
        </entity>
    </document>
</dataConfig>

3）修改相应schema.xml，字段与data-config.xml中的字段配置一致，fields块配置如下：

<schema name="example" version="1.5">
 <fields>
   <field name="code" type="string" indexed="true" stored="true" required="true" multiValued="false" />
   <field name="title" type="text_general" indexed="true" stored="true" multiValued="false"/>
   <field name="alternativeTitle" type="text_general" indexed="true" stored="true" multiValued="false"/>
   <field name="creator" type="text_general" indexed="true" stored="true" multiValued="false"/>
   <field name="price" type="float" indexed="true" stored="true"/>
   <field name="publishDate" type="date" indexed="true" stored="true"/>
   <field name="isbn" type="string" indexed="true" stored="true" multiValued="false" />
   <field name="type" type="string" indexed="true" stored="true" multiValued="false"/>
   <field name="publishName" type="text_general" indexed="true" stored="true" multiValued="false"/>
   <field name="page" type="int" indexed="true" stored="true"/>
   <field name="abstract" type="text_ik" indexed="true" stored="true" multiValued="false"/>
   <field name="saleOnDate" type="date" indexed="true" stored="true"/>
   <field name="saleOffDate" type="date" indexed="true" stored="true"/>
   <field name="bookState" type="int" indexed="true" stored="true"/>
   <field name="bookSource" type="int" indexed="true" stored="true"/>
   <field name="image" type="string" indexed="false" stored="true"/>
   <field name="text" type="text_general" indexed="true" stored="false"/>
   <field name="_version_" type="long" indexed="true" stored="true"/>
 </fields>

4）启动jetty这是collection1就能够出现dataImport面板。勾选commit，execute执行即可。

solr配置文件
solr.xml
solr中文wiki地址：http://wiki.chenlb.com/solr/doku.php 不过只翻译了部分文档
主要是配置solr主目录中的索引库即SolrCore
一个solr服务可以配置多个SolrCore，即可以管理多个索引库。

solr MultiCore
个人理解就是多个索引库，索引库的索引数据可以相互切换。
具体参考：http://wiki.apache.org/solr/CoreAdmin

solrconfig.xml

solr系统相关配置
<luceneMatchVersion>声明使用的lucene的版本。
<lib>配置solr用到的jar包，具体语法示例中基本都有了。
<dataDir>如果不用 “Solr home”/data 目录，可以指定其它别的目录来存放所有索引数据。如果使用了 replication，它可以匹配 replication 配置。如果这个目录不是绝对的，那会是当前 servlet 容器工作目录下的相对目录。
<directoryFactory>索引文件的类型，默认solr.NRTCachingDirectoryFactory
这个文件类型包装了solr.StandardDirectoryFactory和小文件内存缓存的类型，来提供NRT搜索性能。NRT--》near-real-time近实时。
<indexConfig>主要索引相关配置
<writeLockTimeout>IndexWriter写锁过时的时间，默认1000
<maxIndexingThreads>最大索引的线程数，默认8
<useCompoundFile>是否使用混合文件，Lucene默认是“true”，solr默认是“false”
<ramBufferSizeMB>使用的内存的大小，默认100，这个实际用的时候应该修改大一点。
<ramBufferdDocs>内存中最大的文档数，默认1000
<mergePolicy>索引合并的策略。默认TiereMergePolicy，合并大小相似的段，与LogByteSizeMergePolicy相似。这个可以合并不相邻的段，能够设置一次合并多少个段，maxMergeAtOnce以及每层能合并多少个段segmentsPerTier。
<mergeFactor>每次合并索引的时候获取多少个段，默认10。等同于同时设置了maxMergeAtOnce和segmentsPerTier两个参数。
<mergeScheduler>段合并器，背后有一个线程负责合并，默认ConcurrentMergeScheduler。
<lockType>文件锁的类型，默认native，使用NativeFSLockFactory。
<unlockOnStartup>默认false
<termIndexInterval>Lucene每次加载到内存的terms数，默认128
<reopenReaders>如果是true时，IndexReaders能够被reopened，而不是先关闭再打开，默认true
<deletionPolicy>删除策略，用户可以自己定制，solr默认的是SolrDeletionPolicy，是solr标准的删除策略，允许在一定时间内保存索引提交点，来支持索引复制，以及快照等特性。可以设置“maxCommitsToKeep”保存提交的数量、“maxOptimizedCommitsToKeep”保存的优化条件的数量、“maxCommitAge”删除所有commit points的时间。
<infoStream>为了调试，Lucene提供了这个参数，如果是true的话，IndexWriter会像设置的文件中写入debug信息。
<jmx>一般不需要设置具体可以查看wiki文档http://wiki.apache.org/solr/SolrJmx
<updateHandler>更新的Handler，默认DirectUpdateHandler2
<updateLog><str name="dir">配置更新日志的存放位置
<autoCommit>硬自动提交，可以配置maxDocs即从上次提交后达到多少文档后会触发自动提交；maxTime时间限制；openSearcher，如果设为false，导致索引变化的最新提交，不需要重新打开searcher就能看到这些变化，默认false。
<autoSoftCommit>如自动提交，与前面的<autuCommit>相似，但是它只是让这些变化能够看到，并不保证这些变化会同步到磁盘上。这种方法比硬提交要快，而且更接近实时更友好。
<listerner event>update时间监听器配置，postCommit每一次提交或优化命令后触发，poatOptimize每次优化命令后触发。RunExecutableListener每次调用后执行一些其他操作。配置项：

<indexReaderFactory>这个配置项用户可以自己扩展IndexReaderFactory，可以自己实现自己的IndexReader。如果要明确声明使用的Factory则可以如下配置：

<query>配置检索词相关参数以及缓存配置参数。
   <maxBooleanClauses>每个BooleanQuery中最大Boolean Clauses的数目，默认1024。
   <filterCache>为IndexSearcher使用，当一个IndexSearcher Open时，可以被重新赋于原来的值，或者使用旧的IndexSearcher的值，例如使用LRUCache时，最近被访问的Items将被赋予IndexSearcher。solr默认是FastLRUCache 。
cache介绍：http://blog.csdn.net/phinecos/article/details/7876385
   filterCache
filterCache存储了无序的lucene documentid集合，该cache有3种用途：
1）filterCache存储了filterqueries(“fq”参数)得到的document id集合结果。Solr中的query参数有两种，即q和fq。如果fq存在，Solr是先查询fq（因为fq可以多个，所以多个fq查询是个取结果交集的过程），之后将fq结果和q结果取并。在这一过程中，filterCache就是key为单个fq（类型为Query），value为document id集合（类型为DocSet）的cache。对于fq为range query来说，filterCache表现出其有价值的一面。
2）filterCache还可用于facet查询（http://wiki.apache.org/solr/SolrFacetingOverview），facet查询中各facet的计数是通过对满足query条件的documentid集合（可涉及到filterCache）的处理得到的。因为统计各facet计数可能会涉及到所有的doc id，所以filterCache的大小需要能容下索引的文档数。
3）如果solfconfig.xml中配置了<useFilterForSortedQuery/>，那么如果查询有filter（此filter是一需要过滤的DocSet，而不是fq，我未见得它有什么用），则使用filterCache。
   <queryResultCache> 缓存查询的结果集的docs的id。
   <documentCache> 缓存document对象，因为document中的内部id是transient,所以autowarmed为0，不能被autowarmed。
   <fieldValueCache>字段缓存
   <cache name="">用户自定义一个cache，用来缓存指定的内容，可以用来缓存常用的数据，或者系统级的数据，可以通过SolrIndexSearcher.getCache(),cacheLookup(), and cacheInsert().等方法来操作。
   <enableLazyFieldLoading>保存的字段，如果不需要的话就懒加载，默认true。
   <useFilterForSortedQuery>一般来讲用不到，只有当你频繁的重复同一个搜索，并且使用不同的排序，而且它们都不用“score”
   <queryResultWindowSize>queryResultCache的一个参数。
   <queryResultMaxDocsCached> queryResultCache的一个参数。
   <listener event"newSearcher" class="solr.QuerySenderListener">query的事件监听器。
   <useColdSearcher>当一个检索请求到达时，如果现在没有注册的searcher，那么直接注册正在预热的searcher并使用它。如果设为false则所有请求都要block，直到有searcher完成预热。
   <maxWarmingSearchers>后台同步预热的searchers数量。
<requestDispatcher handleSelect="false">solr接受请求后如何处理，推荐新手使用false
   <requestParsers enableRemoteStreaming="true" multipartUploadLimitInKB="2048000" formdataUploadLimitInKB="2048" />使系统能够接收远程流
   <httpCaching never304="true">http cache参数，solr不输出任何HTTP Caching相关的头信息。
<requestHandler>接收请求，根据名称分发到不同的handler。
   "/select"检索SearchHandler
   "/query"检索SearchHandler
   "/get" RealTimeGetHandler
   "/browse" SearcherHandler
   "/update" UpdateRequestHandler
   "/update/json" JsonUpdateRequestHandler
   "/update/csv" CSVRequestHandler
   "/update/extract" ExtractingRequestHandler
   "/analysis/field" FieldAnalysisRequestHandler
   "/analysis/document" DocumentAnalysisRequestHandler
   "/admin/" AdminHandlers
   "/replication" 复制，要有主，有从
<searchComponent>注册searchComponent。
   spellcheck 拼写检查
<queryResponseWriter>返回数据

<admin><defaultQuery>默认的搜索词

schema.xml
solr索引相关配置
<fields>块
声明一系列的<field>字段
<field name="" type="" indexde="" stored="" required="" multiValued="" omitNorms="" termVectors="" termPositions="" termOffsets="">
name：名称
type：类型从<types> 的fieldType中取
indexed：是否索引
stored：是否保存
required：是否必须
multiValuer：在同一篇文档中可以有多个值
omitNorms：true的话忽略norms
termVectors：默认false，如果是true的话，要保存字段的term vector
termPositions：保存term vector的位置信息
termOffects：保存term vector的偏移信息
default：字段的默认值
<dynamicField>动态字段，当不确定字段名称时采用这种配置

<types>块
<types> 块内，声明一系列的 <fieldtype>，以 Solr fieldtype类为基础，如同默认选项一样来配置自己的类型。
任何 FieldType 的子类都可以作为 field type 来使用，使用时可以用完整的包名，如果field type 类在 solr 里，那可以用 “solr”代替包名。提供多种不同实现的普通数据类型（integer, float等）。想知道怎么样被 Solr 正确地加载自定义的数据类型，请看：SolrPlugins
通用的选项有：
name：类型名称
class：对应于solr fieldtype类
sortMissingLast=true|false 如果设置为true，那么对这个字段排序的时候，包含该字段的文档就排到不包含该字段的文档前面。
sortMissingFirst=true|false 如果设置为true，那么对这个字段排序的时候，没有该字段的文档排在包含该字段的文档前面
precisionStep 如何理解precisionStep呢？需要一步一步来：参考文档：http://blog.csdn.net/fancyerii/article/details/7256379
1， precisionStep是在做range search的起作用的，默认值是4
2，数值类型（int float double）在Lucene里都是以string形式存储的，当然这个string是经过编码的
3，经过编码后的string保证是顺序的，也就是说num1>num2，那么strNum1>strNum2
4，precisionStep用来分解编码后的string，例如有一个precisionStep，默认是4，也就是隔4位索引一个前缀，比如0100,0011,0001,1010会被分成下列的二进制位“0100,0011,0001,1010“，”0100,0011,0001“，0100,0011“，”0100“。这个值越大，那么索引就越小，那么范围查询的性能（尤其是细粒度的范围查询）也越差；这个值越小，索引就越大，那么性能越差。
positionIncrementGap和multiValued一起使用,设置多个值之间的虚拟空白的数量。字段有多个值时使用，如果一篇文档有两个title
> title1: ab cd
> title2: xy zz
如果positionIncrementGap=0，那么这四个term的位置为0,1,2,3。如果检索"cd xy"那么能够找到，如果你不想让它找到，那么就需要调整positionIncrementGap值。如100，那么这是位置为0,1,100,101。这样就不能匹配了。
<fieldType name="random" class="solr.RandomSortField" indexed="true" />这个字段类型可以实现伪随机排序。
analyzer配置

包括tokenizer和filter，可以配置多个filter

其他配置
<uniqueKey>唯一字段，除非这个字段标记了“required=false”，否则默认为required字段
<copyField>一个源字段一个目的字段，将源字段的内容拷贝到目的字段，可以将多个字段合并，也可以对同一个字段，不同索引方式。
<defaultSearchField>默认的搜索字段
<solrQueryParser defaultOperator="OR"/>默认的检索词间的关系

solr源码
SolrDispatchFilter--过滤器
系统启动时首先运行SolrDispatchFilter.init()方法，该方法要加载CoreContainer的Initializer类，配置文件默认solr.xml
所有的请求都要经过的Filter

SolrResourceLoader--加载配置文件

CoreContainer--管理SolrCore

SolrCore--可以理解为索引库

SolrConfig--解析solrconfig.xml

IndexSchema--解析schema.xml文件

检索参数
CommonParams.java通用检索参数
qt：指定那个类型来处理查询请求，一般不用指定，默认是standard
q：是检索短语
fq：过滤条件如果设置bookState:0的话，检索结果中就会将bookState不是0的结果过滤掉。
wt：返回类型，有json、xml等
sort：分类，publishDate desc，如果多个字段用逗号分隔
start：开始位置
rows：返回条数
fl：返回字段列表，可以返回score查看分数
df：默认检索字段 default field
indent：返回的结果是否缩进，默认关闭，用 indent=true|on 开启，一般调试json,php,phps,ruby输出才有必要用这个参数。
Raw Query Parameters：直接输入检索语句如：facet=true&facet.query=price:[0 TO 10]&facet.query=price:[10 TO *] 它自动识别这里面的参数，做一个分组统计。
debugQuery：这个勾选之后可以看到文档的分的explain信息。

solr debug
<lst name="prepare">准备时间
<lst name="process">执行时间

HighlightParams高亮检索参数
hl=true：高亮显示
hl.fl：需要高亮的字段
hl.simple.pre/hl.simple.post设置高亮的格式默认<em></em>
下面文档中详细介绍了高亮的参数：
http://ronxin999.blog.163.com/blog/static/42217920201292951457295/?suggestedreading

FacetParams分组统计检索参数
facet=true：表示需要分组统计
facet.field：分组的字段如果有多个字段facet.field=cat& facet.field=type
facet.quert：范围统计如facet.query=price:[0 TO 10]&facet.query=price:[10 TO *]
facet.range：我们系统中可以使用publishDate的按时间段统计：facet.range=publishDate&facet.range.start=NOW/YEAR-10YEARS&facet.range.end=NOW&facet.range.gap=+1YEAR没成功

dismax与edismax参数
参考：
http://wiki.apache.org/solr/DisMaxRequestHandler?highlight=%28dismax%29
http://wiki.apache.org/solr/DisMaxQParserPlugin
http://wiki.apache.org/solr/ExtendedDisMax?highlight=%28edismax%29

solr 的edismax与dismax比较与分析：
http://blog.csdn.net/duck_genuine/article/details/8060026
dismax是solr的一个比较受欢迎的检索模型 edismax是对dismax的扩展
q.alt：当字段q为空时使用这个作为默认检索
qf：设置字段的权重 creator^15 title^5空格隔开
mm：Minimum 'Should' Match q.op=AND => mm=100%; q.op=OR => mm=0%
qs：Query Phrase Slop 步长
pf：Phrase Fields To specify both a slop and a boost, usefield~slop^boost
如：title~2^10.0 will use the title field with a phrase slop of 2 and a boost of 10.0。 A phrase slop specified here overrides the default specified in "ps"
pf：Default amount of slop on phrase queries built with "pf", "pf2" and/or "pf3" fields (affects boosting).
bq：A raw query string，直接给出权重公式

根据我们的需求定义的检索条件：
http://localhost:8983/solr/collection1/select/?facet=true&indent=true&q=%E4%B8%89%E5%9B%BD&qf=title^15&hl.simple.pre=%3Cem%3E&hl.simple.post=%3C/em%3E&facet.field=bookState&wt=xml&hl=true&fq=type:ZZ&defType=edismax
bf：可以通过函数设置文档权重。例子：
q=foo&bf="ord(popularity)^0.5 recip(rord(price),1,1000,1000)^0.3"
参考：
http://wiki.apache.org/solr/FunctionQuery

自动补齐
使用SpellCheckComponent
http://wiki.apache.org/solr/Suggester
http://www.colorfuldays.org/category/program/solr/
solrconfig.xml中增加如下配置：

<searchComponent class="solr.SpellCheckComponent" name="suggest">
  	<str name="queryAnalyzerFieldType">text_ik</str>
    <lst name="spellchecker">
      <str name="name">suggest</str>
      <str name="classname">org.apache.solr.spelling.suggest.Suggester</str>
      <str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookupFactory</str>
      <!-- Alternatives to lookupImpl: 
           org.apache.solr.spelling.suggest.fst.FSTLookup   [finite state automaton]
           org.apache.solr.spelling.suggest.fst.WFSTLookupFactory [weighted finite state automaton]
           org.apache.solr.spelling.suggest.jaspell.JaspellLookup [default, jaspell-based]
           org.apache.solr.spelling.suggest.tst.TSTLookup   [ternary trees]
      -->
      <str name="field">text_sug</str>  <!-- the indexed field to derive suggestions from -->
      <float name="threshold">0.005</float>
      <str name="buildOnCommit">true</str>
      <str name="spellcheckIndexDir">spellchecker</str>
      
    </lst>
  </searchComponent>
  <requestHandler class="org.apache.solr.handler.component.SearchHandler" name="/suggest">
    <lst name="defaults">
      	<str name="spellcheck">true</str>
        <str name="spellcheck.dictionary">suggest</str>
        <str name="spellcheck.onlyMorePopular">true</str>
        <str name="spellcheck.count">10</str>
        <str name="spellcheck.collate">false</str>
    </lst>
    <arr name="components">
      <str>suggest</str>
    </arr>
  </requestHandler>

在sechma.xml中增加字段

<field name="text_sug" type="text_ik" indexed="true" stored="true" multiValued="true" />

将title,creator,publishName字段拷贝到text_sug

 <copyField source="title" dest="text_sug" />
 <copyField source="creator" dest="text_sug" />
 <copyField source="publishName" dest="text_sug"/>

http://localhost:8983/solr/suggest?q=中&spellcheck.build=true
就可以看到效果

在solrj中拼接请求

// http://localhost:8983/solr/suggest?q=中&spellcheck.build=true
   ModifiableSolrParams params = new ModifiableSolrParams();
   params.set("qt", "/suggest");
   params.set("q", prefix);
   params.set("spellcheck.build", "true");

   QueryResponse response;
	try {
	    response = server.query(params);
	    System.out.println("response = " + response);
	} catch (SolrServerException e) {
	    e.printStackTrace();
	}

第二种方式使用Facet

//prefix为前缀
    public static void autoComplete(SolrServer server, String prefix) {
       StringBuffer sb = new StringBuffer("");
       SolrQuery query = new SolrQuery("*.*");
       QueryResponse rsp= new QueryResponse();
       //Facet为solr中的层次分类查询
       try {
          query.setFacet(true);
          query.setFacetMinCount(1);
          query.setQuery("*:*");
          query.setFacetPrefix(prefix);
          query.addFacetField("title_auto");
          query.add("fl", "title");
          rsp = server.query(query);
          System.out.println(query.toString());
          System.out.println(rsp.toString());
       } catch (Exception e) {
          // TODO: handle exception
          e.printStackTrace();
       }
    }

结果为：

Solrj使用
需要使用的jar包

//新建SolrServer
String url = "http://localhost:8983/solr";
SolrServer server = new HttpSolrServer(url);

//定义Document,添加到Server中
SolrInputDocument doc1 = new SolrInputDocument();
doc1.addField( "code", "id1 this", 1.0f );
doc1.addField( "title", "你好", 1.0f );
doc1.addField( "price", 10 );
	    
SolrInputDocument doc2 = new SolrInputDocument();
doc2.addField( "code", "id1 this2", 1.0f );
doc2.addField( "title", "你", 1.0f );
doc2.addField( "price", 20 );
	    
Collection<SolrInputDocument> docs = new ArrayList<SolrInputDocument>();
docs.add( doc1 );
docs.add( doc2 );

//更新索引
	try {
		server.add( docs );
		server.commit();
	} catch (SolrServerException e) {
		log.error(e.getMessage());
	} catch (IOException e) {
		e.printStackTrace();
	}
//或者
UpdateRequest req = new UpdateRequest();
	    req.setAction( UpdateRequest.ACTION.COMMIT, false, false );
	    req.add( docs );
	    try {
			UpdateResponse rsp = req.process( server );
		} catch (SolrServerException e1) {
			e1.printStackTrace();
		} catch (IOException e1) {
			e1.printStackTrace();
		}

//也可以定义Bean,来更新索引
import org.apache.solr.client.solrj.beans.Field;
public class Books {
	@Field
	String code;
   @Field
   String title;
   @Field
   String publishName;
}

Books books = new Books();
		books.code = "45678";
		books.title = "nihaoaaaa";
		books.publishName = "出版社";
		
		try {
			server.addBean(books);
			server.commit();
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (SolrServerException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
//查询数据
SolrQuery query = new SolrQuery();
	    query.setQuery( "code:45678" );
	    query.addSortField( "price", SolrQuery.ORDER.asc );
	    
	    QueryResponse rsp;
		try {
			rsp = server.query( query );
//		    SolrDocumentList docs = rsp.getResults();
//		    System.out.println(docs.get(0).getFieldValue("title"));
			
			List<Books> books = rsp.getBeans(Books.class);
			System.out.println(books.get(0).publishName);
		} catch (SolrServerException e) {
			e.printStackTrace();
		}
//删除数据
try {
			server.deleteByQuery("code:45678");
			server.optimize();
			server.commit();
		} catch (SolrServerException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}

具体参考 http://wiki.apache.org/solr/Solrj
solr 的客户端调用solrj 建索引+分页查询：
http://www.blogjava.net/conans/articles/379556.html

solr更新文件格式
索引更新
http://wiki.apache.org/solr/UpdateXmlMessages
http://wiki.apache.org/solr/UpdateJSON
更新可以支持原子更新
update = "add" | "set" | "inc" — for atomic updating and adding of fields
注意：为了实现原子更新，需要在solrconfig.xml中增加updateLog的配置如下：

<updateHandler class="solr.DirectUpdateHandler2">
  <!-- ... -->
    <updateLog>
      <str name="dir">${solr.data.dir:}</str>
    </updateLog>
  </updateHandler>

查看索引文件luke
http://wiki.apache.org/solr/LukeRequestHandler
在solrconfig.xml中增加如下配置：

<requestHandler name="/admin/luke" class="org.apache.solr.handler.admin.LukeRequestHandler" />

solr性能参数
http://wiki.apache.org/solr/SolrPerformanceFactors
1. mergeFactor Tradeoffs
高的值（如25）
好处：建索引速度快缺点：少了合并，会导致比较多的索引文件，降低检索速度。
低的值（如2）
好处：索引文件数量少，检索速度快缺点：建索引速度慢
2. Cache autoWarm Count 考虑
增加filterCache、 queryResultCache和DocumentCache的大小
3. 提交和更新频率的考虑

solr扩展
扩展自己的SearchComponent
实现自己的SearchComponent类
在solrconfig.xml中增加相应配置

<searchComponent name="query" class="my.app.MyQueryComponent" />

扩展自己的updateRequestProcessor
实现自己的类UpdateProcessorFactory然后在solrconfig.xml中如下配置：

<updateRequestProcessorChain name="mychain" >
   <processor class="solr.LogUpdateProcessorFactory" />
   <processor class="my.app.MyPocessorFactory" />
   <processor class="solr.RunUpdateProcessorFactory" />
 </updateRequestProcessorChain>
 
  <requestHandler name="/update" class="solr.UpdateRequestHandler">
    <!-- See below for information on defining
         updateRequestProcessorChains that can be used by name
         on each Update Request
      -->
    <lst name="defaults">
      <str name="update.chain">tyreadchain</str>
    </lst>
</requestHandler>

转载请注明:

http://lucien-zzy.iteye.com/blog/2089674

你可能感兴趣的:(Solr,solrj,solr源码,solrconfig.xml,Solr目录)

统信V20 1070e X86系统编译安装PostgreSQL-13.11版本以及主从构建树下一少年数据库统信UOS 1070e 信创 postgresql13.11 编译安装
设备信息操作系统版本架构CPU内存备注统信UOSV201070eX864C8G此配置仅做编译安装验证，持续运行或数据量增长大请自行评估资源配置。统信UOSV201070eX864C8G资源包该包包含postgresql-13.11源码包、统信编译postgresql-13.11安装包通过网盘分享的文件：统信postgresql-13.11-x86.zip链接:https://pan.baidu.c
tar命令详解：解压与压缩的技巧 wx_tangjinjinwx tar linux
tar命令详解：解压与压缩的技巧大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！在日常的系统管理和文件处理过程中，tar命令是一个非常重要的工具。它不仅用于压缩文件，还可以用于解压缩。本文将详细介绍tar命令的用法，包括压缩和解压缩的技巧。一、tar命令概述tar（tapearchive）是一个用于打包和压缩文件的命令行工具。它可以将多个文件和目录打包成一个文件，也可
SD ComfyUI工作流平面模型房屋3D渲染 Mr数据杨 Stable Diffusion AI绘画 ComfyUI AI绘画
文章目录平面模型房屋3D渲染SD模型Node节点工作流程开发与应用效果展示平面模型房屋3D渲染此工作流是为将平面模型房屋图转换为3D渲染而设计，利用先进的模型和节点处理图像，增加细节和色彩，以及通过超分辨率技术增强最终图像的清晰度。流程从加载图像开始，经过一系列的处理步骤，包括图像缩放、条件编码、模型加载，最终通过高级放大技术提高图像分辨率，以达到高清的视觉效果。SD模型模型名称说明majicMI
基于Damo-YOLO和DyHead检测头的YOLOv8优化：多尺度目标检测的创新方案【YOLOv8】步入烟尘 YOLO系列创新涨点超专栏 YOLO 目标检测人工智能 YOLOv8
本专栏专为AI视觉领域的爱好者和从业者打造。涵盖分类、检测、分割、追踪等多项技术，带你从入门到精通！后续更有实战项目，助你轻松应对面试挑战！立即订阅，开启你的YOLOv8之旅！专栏订阅地址：https://blog.csdn.net/mrdeam/category_12804295.html文章目录基于Damo-YOLO和DyHead检测头的YOLOv8优化：多尺度目标检测的创新方案【YOLOv8
提升YOLOv8性能：用Swin Transformer替换Backbone的详细实现与分析【YOLOv8】步入烟尘 YOLO系列创新涨点超专栏 YOLOv8 YOLO 目标跟踪
本专栏专为AI视觉领域的爱好者和从业者打造。涵盖分类、检测、分割、追踪等多项技术，带你从入门到精通！后续更有实战项目，助你轻松应对面试挑战！立即订阅，开启你的YOLOv8之旅！专栏订阅地址：https://blog.csdn.net/mrdeam/category_12804295.html文章目录YOLOv8改进|主干篇|SwinTransformer替换Backbone（附代码+详细修改步骤+
前后端分离实践（一）—— 基础理论篇 _云卷云舒_ 前后端分离前后端分离前后端分离
前后端分离实践系列文章总目录目录一、什么是前后端分离？二、为什么需要前后端分离？1、前后端职责不清2、开发效率不高三、前后端分离究竟分离了什么？1、开发职责的分离2、交互方式的分离3、代码组织方式的分离4、应用部署的分离四、为什么要加入Node中间层来实现前后端分离？1、反思前后端的定义2、加入Node中间层之后的系统架构图3、加入Node中间层之后的前后端职责划分4、加入Node中间层的优缺点一
PAT (Basic Level) Practice 乙级1001-1020 今天_也很困算法数据结构 c++
制作不易，大家的点赞和关注就是我更新的动力！由于这些题全是大一寒假刷的，部分还是c语言，部分的解题方法比较复杂，希望大家体谅。有问题欢迎大家在评论区讨论，有不足也请大家指出，谢谢大家！温馨提示：可以点目录跳转到相应题目哦。1001害死人不偿命的(3n+1)猜想分数15作者CHEN,Yue单位浙江大学卡拉兹(Callatz)猜想：对任何一个正整数n，如果它是偶数，那么把它砍掉一半；如果它是奇数，那么
python微博关键词爬虫嵌入式开发项目 2025年爬虫精通专栏 python 爬虫开发语言媒体
目录记一次阿里云盾滑块验证分析并通过操作环境数据接口proxy配置根据关键词获取userid根据userid获取信息数据保存数据：记一次阿里云盾滑块验证分析并通过操作环境win10、macPython3.9数据接口搜索https://**********?containerid=100103type%3D{chanenl}%26q%3D{quote(self.words)}&page_type=s
【强化学习】PyTorch-RL框架大雨淅淅人工智能 pytorch 人工智能 python 深度学习机器学习
目录一、框架简介二、核心功能三、学习环境配置四、学习资源五、实践与应用六、常见问题与解决方案七、深入理解强化学习概念八、构建自己的强化学习环境九、调试与优化十、参与社区与持续学习一、框架简介PyTorch-RL是一个基于PyTorch框架的深度强化学习项目。它充分利用了PyTorch的强大功能，提供了易于使用且高效的深度强化学习算法实现。该项目的主要编程语言是Python，旨在帮助开发者快速实现和
运行.py文件战斗的大熊 python python
运行.py文件一、使用命令行‌打开命令行终端‌在Windows上，你可以按下Win+R键，然后输入cmd并回车，或者通过开始菜单搜索“命令提示符”并打开。在Mac或Linux上，你可以在应用程序或搜索中找到并打开Terminal。‌导航到.py文件所在的目录‌使用cd命令来切换目录。（注意cd命令跳转目录，如果是和当前不同的磁盘，需要增加/d命令，例如cd/dD:\目标目录）例如，如果你的.py文
基于Spring Boot和Vue的人脸识别项目（源码） AI人H哥会Java JAVA大作业项目实战 spring boot vue.js java 人工智能计算机视觉后端 sql
背景随着人工智能技术的迅猛发展，生物识别技术的迅猛发展，人脸识别已经成为最具潜力的人工智能应用之一。它不仅在安全监控、金融支付、智能家居等多个领域得到了广泛应用，也逐渐进入日常生活场景。人脸识别作为一种生物特征识别技术，能够通过分析人脸图像中的特征点，实现对个体的身份识别。利用计算机视觉技术，系统能够快速从大量图片中定位并识别特定人脸，实现身份验证和信息检索。这一技术的应用，不仅提高了安全性，还提
商城项目测试用例设计实战 shengnan_wsn 测试测试用例
文章目录项目介绍模块测试用例实现步骤1注册模块1需求分析2提取测试点项目介绍注册模块登录模块搜索模块购物车模块订单模块模块测试用例实现步骤需求分析测试点提取用例编写用例执行缺陷管理1注册模块1需求分析查看查看需求文档原型图2提取测试点可以从ui布局和功能考虑
【python基础】python GIL(全局解释器锁) 和多线程锁 shengnan_wsn python python 开发语言后端
文章目录什么是GIL？有了GIL还需要线程锁吗？参考资料1：[终于有人把GIL全局解释器说清楚了](https://zhuanlan.zhihu.com/p/311877485)2：[浅谈Python多线程之GIL描述](https://blog.csdn.net/qq_34359754/article/details/115209158)3：[多线程锁机制](https://www.cnblog
软件工程——第9章面向对象方法学引论知识点整理顾老师不懂代码软件工程导论第6版软件工程面向对象方法学引论对象模型动态模型功能模型
本专栏是博主个人笔记，主要目的是利用碎片化的时间来记忆软工知识点，特此声明！文章目录1.当前最好的软件开发技术是？2.面向对象的原则是什么？3.人们把客观世界中的实体抽象为什么？4.软件系统本质上是？5.面向对象方法学的优点？6.对象的定义是什么？7.对象的特点有哪些？8.类的定义是什么？9.实例是什么？10.属性是什么？11.封装是什么？12.继承是什么？13.重载和重写的区别有哪些？14.使用
【WRF模拟】WRF运行时进程数限制的原因及报错解决方案 WW、forever WRF模型原理及应用 WRF
目录WRF运行时进程数限制的原因网格块的最小尺寸要求嵌套域的尺寸和分辨率进程数与网格划分的关系案例1：四层嵌套错误：ERROR:ReducetheMPIrankcount,orredistributethetasks解决方法参考WRF运行时进程数限制的原因在进行wrf模拟时，若内层网格分辨率较高，模拟时间较久，可适当增加运行内核数，但如何确定合适的内核数呢？太高会导致模型报错，太低又会增加模型运行
软件工程专业毕业设计选题：常新课题创新思路 HaiLang_IT 软件工程毕业设计人工智能
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了软件工程专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇
使用 electron-builder 构建一个 Electron 应用程序常见问题以及解决办法涔溪 Electron electron javascript 前端
构建Electron应用程序时，使用electron-builder可能会遇到一些常见问题。以下是一些问题及其解决办法：1.构建输出目录冲突问题：如果你的项目中已经存在与构建输出目录同名的文件夹，可能会导致构建失败。解决方法：确保package.json中build.directories.output指定的输出目录在构建开始前不存在或为空。你可以手动删除该文件夹，或者配置构建工具在每次构建前自动
使用conda升级到python 3.8 Babayacy python jupyter notebook python conda 开发语言
Python3.8.0已经发布，但我找不到关于如何使用conda更新到python3.8的任何文章-也许他们会等待正式发布？有什么建议么？Answers:打开Anaconda提示（基本）：合理的创建标题，有助于目录的生成1、更新conda：condaupdate-nbase-cdefaultsconda2、使用Python3.8创建新环境：condacreate-npython38python=3
冲刺蓝桥杯之速通vector！！！！！爱吃生蚝的于勒备战蓝桥杯蓝桥杯算法数据结构开发语言 c语言 c++柔性数组
文章目录知识点创建增删查改习题1习题2习题3习题4：习题5：知识点C++的STL提供已经封装好的容器vector，也可叫做可变长的数组，vector底层就是自动扩容的顺序表，其中的增删查改已经封装好创建constintN=30;vectora1;//创建叫a1的空的可变长的数组vectora2(N);//创建大小为30的可变长的数组，里面每个元素为0vectora3(N,2);//创建大小30的可
Python-基础-字典（dict） All_Test_Pass Python-基础 python 开发语言
目录1、字典2、字典常用操作3、字典的方法1、字典字典（Dictionary）是一种用于存储键值对（key-valuepairs）数据的可变容器类型。每个字典都包含一组键（key）和值（value），通过键可以快速访问对应的值。字典是无序的，也就是说，它们不保证元素的顺序，直到Python3.7之后，字典会保留插入的顺序my_dict={key1:value1,key2:value2,key3:v
华为OD机试E卷 --热点网站统计--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c++c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述企业路由器的统计页面，有一个功能需要动态统计公司访问最多的网页URLtopN。请设计一个算法，可以高效动态统计TopN的页面。输入描述每一行都是一个URL或一个数字•如果是URL，代表一段时间内的网页访问•如果是一个数字N，代表本次需要输出的TopN个URL输入约束：总访问网
配置vue2项目中组件命名忽略大小写上趣工作室 vue2.x vue.js 前端
vue2中如果我们想通过目录名称下创建index.vue的方式，创建组件，有时候可能会有错误提示“componentnameindexshouldalwaysbemulti-word”，在这里我介绍一下，我亲测能使用的方法：如果项目根目录下没有.eslintrc.js文件，则创建一个该文件，如果有，则参考下方代码直接添加，代码如下//.eslintrc.jsmodule.exports={//其他
Rust实现内网穿透工具：从原理到实现余识- Rust从入门到精通 rust 开发语言
目录1.前言2.内网穿透原理3.丐版实现3.1share3.2server3.3client3.4测试4.项目优化4.1工作空间4.2代码合并4.3无锁优化4.4数据分离4.5错误处理4.6测试代码4.7参数解析本篇原文为：Rust实现内网穿透工具：从原理到实现更多C++进阶、rust、python、逆向等等教程，可点击此链接查看：酷程网1.前言rust是一门非常适合写命令行工具的语言，本文将结合
QT 使用OpenGL显示并查看点云图 _DJ Qt-demo qt 开发语言
文章目录效果图概述功能点代码分析读取点云文件着色器图形绘制图形变换最小包围盒伪颜色效果图概述OpenglWidget继承自QOpenGLWidget，QOpenGLFunctions，它具有OpenGL的功能，并且可以绘制OpenGL图形MinimumBoundBox类用于计算点云的最小包围盒（轴对齐包围盒，AABB）,可以帮助确定视图的缩放级别，或者在用户进行平移和旋转操作时保持点云在视图内这两
音视频开发——FFmpeg 实现MP4转FLV文件 C语言实现 Trump. yang 音视频开发音视频 ffmpeg c语言
文章目录转换步骤关键代码完整代码转换步骤初始化FFmpeg库打开输入文件找到输入文件的流信息打开输出文件并设置输出格式创建输出文件的流初始化解码器和编码器读取输入文件的帧并写入输出文件释放资源关键代码1初始化FFmpeg库：av_register_all();打开输入文件：if((ret=avformat_open_input(&input_format_ctx,input_filename,NU
python读取文件路径中有中文_转 python 读取中文文件名/中文路径 weixin_39845406
原博文2015-03-1322:22−python直接读取中文路径的文件时失败，可做如下处理：inpath='D:/work/yuanxx/在线导航/驾车导航/walk_log/20130619_172355.txt'uipath=unicode(ipath,"utf8")然后用"uipath"经...相关推荐2015-12-1421:45−前言：需要对某目录下的文件进行分类，目录是中文名字就会报
python传参是什么意思_如何最简单、通俗地理解Python的传入参数？ weixin_39857876 python传参是什么意思
目录：一、笔记二、我的自学路线三、笔记目录一、笔记①传入参数分为形参和实参两种，形参是形式参数(变量)，实参是实际参数(值)。②传入参数，一个星号*表示传入一个元组，两个星号表示传入一个字典。③加了星号*的变量会存放所有未命名的变量参数。④加了星号**的变量会存放所有命名的变量参数。⑤*号的使用使得传入的参数不定长。⑥传入参数中，默认值参数都是放在后面。#coding=utf-8#形参是定义函数后
Python爬虫项目 | 二、每日天气预报聪明的墨菲特i Python爬虫项目 python 爬虫开发语言
文章目录1.文章概要1.1实现方法1.2实现代码1.3最终效果1.3.1编辑器内打印显示效果实际应用效果2.具体讲解2.1使用的Python库2.2代码说明2.2.1获取天气预报信息2.2.2获取当天日期信息，格式化输出2.2.3调用函数，输出结果2.3过程展示3总结1.文章概要继续学习Python爬虫知识，实现简单的案例，发送每日天气预报1.1实现方法本文使用Python中常用的requests
Java 中可作为 GC Roots 的对象有哪几种？码炫课堂-码哥 java面试题 jvm 面试
作者简介：大家好，我是码炫码哥，前中兴通讯、美团架构师，现任某互联网公司CTO，兼职码炫课堂主讲源码系列专题代表作：《jdk源码&多线程&高并发》，《深入tomcat源码解析》，《深入netty源码解析》，《深入dubbo源码解析》，《深入springboot源码解析》，《深入spring源码解析》，《深入redis源码解析》等联系qq：184480602，加我进群，大家一起学习，一起进步，一起对
python中的读取文件的方法总结——路径念一不念二 python python 开发语言
在windows系统下的路径一般是“/”，在读取路径下的文件的时候，一般采用两种方式：read_csv(r"D:\dataset\data")read_csv("D:\\dataset\\data")在linux系统下的路径一般是“\”。（1）./data#对本目录下的数据集进行导入如果数据集data放在和.py文件下，可以使用.py文件对如下路径进行导入a=pd.read_csv("./cora
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l