Solr solrconfig.xml 中文说明

solrconfig.xml文件包含了大部分的参数用来配置Solr本身的。 

Solrconfig.xml代码 
  1. dataDir parameter:/var/data/solr   
  2. 用来指定一个替换原先在Solr目录下默认存放所有的索引数据,可以在Solr目录以外的任意目录中。如果复制使用后应该符合该参数。如果这个目录不是绝对路径的话,那么应该以当前的容器为相对路径。   
  3. mainIndex :   
  4. 这个参数的值用来控制合并多个索引段。   
  5. :通过将很多 Lucene 内部文件整合到单一一个文件来减少使用中的文件的数量。这可有助于减少 Solr 使用的文件句柄数目,代价是降低了性能。除非是应用程序用完了文件句柄,否则 false 的默认值应该就已经足够。   
  6. mergeFactor:   
  7. 决定低水平的 Lucene 段被合并的频率。较小的值(最小为 2)使用的内存较少但导致的索引时间也更慢。较大的值可使索引时间变快但会牺牲较多的内存。   
  8. maxBufferedDocs:   
  9. 在合并内存中文档和创建新段之前,定义所需索引的最小文档数。段 是用来存储索引信息的 Lucene 文件。较大的值可使索引时间变快但会牺牲较多的内存。   
  10. maxMergeDocs:   
  11. 控制可由 Solr ,000) 最适合于具有合并的 Document 的最大数。较小的值 (< 10大量更新的应用程序。该参数不允许lucene在任何索引段里包含比这个值更多的文档,但是,多余的文档可以创建一个新的索引段进行替换。   
  12. maxFieldLength:   
  13. 对于给定的 Document,控制可添加到 Field 的最大条目数,进而截断该文档。如果文档可能会很大,就需要增加这个数值。然而,若将这个值设置得过高会导致内存不足错误。   
  14. unlockOnStartup:   
  15. unlockOnStartup 告知 Solr 忽略在多线程环境中用来保护索引的锁定机制。在某些情况下,索引可能会由于不正确的关机或其他错误而一直处于锁定,这就妨碍了添加和更新。将其设置为 true 可以禁用启动锁定,进而允许进行添加和更新。   
  16.    
  17.        
  18.     false   
  19.     10   
  20.     1000   
  21.     2147483647   
  22.     10000   
  23.      
  24.   
  25. updateHandler:   
  26. 这个更新处理器主要涉及底层的关于如何更新处理内部的信息。(此参数不能跟高层次的配置参数Request Handlers对处理发自客户端的更新相混淆)。   
  27. "solr.DirectUpdateHandler2">   
  28.   
  29.        
  30. 缓冲更新这么多的数目,设置如下比较低的值,可以约束索引时候所用的内存   
  31.     100000   
  32. 等待文档满足一定的标准后将自动提交,未来版本可以扩展现有的标准   
  33.        
  34.         
  35.       10000    
  36. 触发自动提交前最多可以等待提交的文档数量   
  37.       86000    
  38. 在添加了一个文档之后,触发自动提交之前所最大的等待时间   
  39.        
  40.   
  41. 这个参数用来配置执行外部的命令。   
  42. 一个postCommit的事件被触发当每一个提交之后   
  43. "postCommit" class="solr.RunExecutableListener">   
  44.       "exe">snapshooter   
  45.       "dir">solr/bin   
  46.       "wait">true   
  47.          
  48.        
  49. exe--可执行的文件类型   
  50. dir--可以用该目录做为当前的工作目录。默认为"."   
  51. wait--调用线程要等到可执行的返回值   
  52. args--传递给程序的参数 默认nothing   
  53. env--环境变量的设置 默认nothing   
  54.   
  55.    
  56.        
  57.     1024   
  58.   
  59. :   
  60. 控制跟查询相关的一切东东。   
  61.   
  62. Caching:修改这个参数可以做为索引的增长和变化。   
  63.   
  64.    
  65.     
  66.       class="solr.LRUCache"   
  67.       size="512"   
  68.       initialSize="512"   
  69.       autowarmCount="256"/>   
  70.   
  71.       
  72. 查询结果缓存   
  73.     
  74.       class="solr.LRUCache"   
  75.       size="512"   
  76.       initialSize="512"   
  77.       autowarmCount="256"/>   
  78.   
  79.      
  80. 由于Lucene的内部文档ID标识(文档名称)是短暂的,所以这种缓存不会被自动warmed。   
  81.     
  82.       class="solr.LRUCache"   
  83.       size="512"   
  84.       initialSize="512"   
  85.       autowarmCount="0"/>   
  86.   
  87.        
  88. 这么做的的关键就是应该明确规定实现solr.search.CacheRegenerator接口如果autowarming是比较理想化的设置。   
  89.        
  90.   
  91.        
  92.     true   
  93.   
  94.        
  95.   
  96. 一种优化用于queryResultCache,当一个搜索被请求,也会收集一定数量的文档ID做为一个超集。举个例子,一个特定的查询请求匹配的文档是1019,此时,queryWindowSize是50,这样,文档从050都会被收集并缓存。这样,任何更多的在这个范围内的请求都会通过缓存来满足查询。   
  97.     50   
  98.   
  99.        
  100.     "3000" loadFactor="0.75"/>   
  101.   
  102.   
  103.        
  104.     "true" cacheSize="32" threshold=".05"/>   
  105.   
  106.        
  107.     false   
 
另一Xml代码 
  1. xml version="1.0" encoding="UTF-8" ?>  
  2.   
  3.     <fieldType name="boolean" class="solr.BoolField" sortMissingLast="true" omitNorms="true"/>  
  4.   
  5.       
  6.     <fieldType name="text_ws" class="solr.TextField" positionIncrementGap="100">  
  7.       <analyzer>  
  8.         <tokenizer class="solr.WhitespaceTokenizerFactory"/>  
  9.       analyzer>  
  10.     fieldType>  
  11.   
  12.       
  13.     <fieldType name="title" class="solr.TextField" positionIncrementGap="100" >  
  14.       <analyzer>  
  15.         <tokenizer class="solr.WhitespaceTokenizerFactory"/>  
  16.           
  17.         <filter class="solr.WordDelimiterFilterFactory" generateWordParts="0" generateNumberParts="0" catenateWords="1" catenateNumbers="1" catenateAll="0"/>  
  18.         <filter class="solr.LowerCaseFilterFactory"/>  
  19.           
  20.         <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>  
  21.       analyzer>  
  22.     fieldType>  
  23.   
  24.       
  25.     <fieldType name="textSpellPhrase" class="solr.TextField" positionIncrementGap="100" stored="false" multiValued="true">  
  26.       <analyzer>  
  27.         <tokenizer class="solr.KeywordTokenizerFactory"/>  
  28.         <filter class="solr.LowerCaseFilterFactory"/>  
  29.       analyzer>  
  30.     fieldType>  
  31.       
  32.       
  33.         <filter class="solr.TrimFilterFactory" />  
  34.           
  35.   
  36.    <field name="type" type="string" required="true" />  
  37.   
  38.   
  39.   
  40.    <field name="a_name" type="title" />  
  41.    <field name="a_name_sort" type="string" stored="false" />  
  42.    <field name="a_alias" type="title" stored="false" multiValued="true" />     
  43.    <field name="a_type" type="string" />  
  44.    <field name="a_begin_date" type="date" />  
  45.    <field name="a_end_date" type="date" />  
  46.    <field name="a_member_name" type="title" multiValued="true" />  
  47.    <field name="a_member_id" type="title" multiValued="true" />  
  48.    <field name="a_release_date_latest" type="date" />  
  49.       
  50.      
  51.    <field name="a_spell" type="textSpell" />  
  52.     <field name="a_spellPhrase" type="textSpellPhrase" />  
  53.      
  54.   
  55.   
  56.    <field name="r_name" type="title" />  
  57.    <field name="r_name_sort" type="alphaOnlySort" stored="false"/>  
  58.    <field name="r_name_facetLetter" type="bucketFirstLetter" stored="false" />  
  59.      
  60.    <field name="r_a_name" type="title" />  
  61.    <field name="r_a_id" type="string" />  
  62.      
  63.      
  64.    <field name="r_attributes" type="integer" multiValued="true" indexed="false" />  
  65.    <field name="r_type" type="rType" multiValued="true" stored="false"/>  
  66.    <field name="r_official" type="rOfficial" multiValued="true" stored="false"/>  
  67.            
  68.    <field name="r_lang" type="string" indexed="false" />   
  69.    <field name="r_tracks" type="sint" indexed="false" />  
  70.    <field name="r_event_country" type="string" multiValued="true" />  
  71.    <field name="r_event_date" type="date" multiValued="true" />  
  72.     <field name="r_event_date_earliest" type="date" multiValued="false" />  
  73.      
  74.   
  75.   
  76.    <field name="l_name" type="title" />  
  77.    <field name="l_name_sort" type="string" stored="false" />  
  78.    <field name="l_type" type="string" />  
  79.    <field name="l_begin_date" type="date" />  
  80.    <field name="l_end_date" type="date" />  
  81.      
  82.   
  83.   
  84.    <field name="t_name" type="title" />  
  85.    <field name="t_duration" type="sint"/>  
  86.    <field name="t_a_id" type="string" />  
  87.    <field name="t_a_name" type="title" />  
  88.    <field name="t_num" type="integer" indexed="false" />  
  89.    <field name="t_r_id" type="string" />  
  90.    <field name="t_r_name" type="title" />  
  91.    <field name="t_r_attributes"  multiValued="true" type="integer" />  
  92.    <field name="t_r_tracks" type="sint" />  
  93.    <field name="t_trm_lookups" type="sint" />  
  94.      
  95.      
  96.    <field name="word" type="ignored" />  
  97.    <field name="includes" type="ignored" />  
  98.      
  99.  fields>  
  100.   
  101.    
  102.       
  103.   
  104.        
  105.     

你可能感兴趣的:(Solr)