Truong

Solr笔记（2）_Schema.xml和solrconfig.xml分析

现在我们开始研究载入的数据部分（importing data）

在正式开始前，我们先介绍一个存储了大量音乐媒体的网站http://musicbrainz.org ，

这里的数据都是免费的，一个大型开放社区提供。

MusicBrainz每天都提供一个数据快照（snapshot）的SQL文件，这些数据可以被导入PostgreSQL数据库中。

一、字段配置（schema）

schema.xml位于solr/conf/目录下，类似于数据表配置文件，

定义了加入索引的数据的数据类型，主要包括type、fields和其他的一些缺省设置。

1、先来看下type节点，这里面定义FieldType子节点，包括name,class,positionIncrementGap等一些参数。

name：就是这个FieldType的名称。
class：指向org.apache.solr.analysis包里面对应的class名称，用来定义这个类型的行为。

[xhtml]  view plain copy 
     
    
 <schema name="example" version="1.2">  
   <types>  
     <fieldType name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true"/>  
     <fieldType name="boolean" class="solr.BoolField" sortMissingLast="true" omitNorms="true"/>  
     <fieldtype name="binary" class="solr.BinaryField"/>  
     <fieldType name="int" class="solr.TrieIntField" precisionStep="0" omitNorms="true"   
                                                                 positionIncrementGap="0"/>  
     <fieldType name="float" class="solr.TrieFloatField" precisionStep="0" omitNorms="true"   
                                                                 positionIncrementGap="0"/>  
     <fieldType name="long" class="solr.TrieLongField" precisionStep="0" omitNorms="true"   
                                                                 positionIncrementGap="0"/>  
     <fieldType name="double" class="solr.TrieDoubleField" precisionStep="0" omitNorms="true"   
                                                                 positionIncrementGap="0"/>  
   ...  
   </types>  
   ...  
 </schema>  

必要的时候fieldType还需要自己定义这个类型的数据在建立索引和进行查询的时候要使用的分析器analyzer，包括分词和过滤，如下：

[xhtml]  view plain copy 
     
    
 <fieldType name="text_ws" class="solr.TextField" positionIncrementGap="100">  
   <analyzer>  
     <tokenizer class="solr.WhitespaceTokenizerFactory"/>  
   </analyzer>  
 </fieldType>  
 <fieldType name="text" class="solr.TextField" positionIncrementGap="100">  
   <analyzer type="index">  
     <!--这个分词包是空格分词，在向索引库添加text类型的索引时，Solr会首先用空格进行分词  
          然后把分词结果依次使用指定的过滤器进行过滤，最后剩下的结果，才会加入到索引库中以备查询。  
       注意:Solr的analysis包并没有带支持中文的包，需要自己添加中文分词器，google下。    
      -->  
     <tokenizer class="solr.WhitespaceTokenizerFactory"/>  
         <!-- in this example, we will only use synonyms at query time  
         <filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt"   
                                                   ignoreCase="true" expand="false"/>  
         -->  
         <!-- Case insensitive stop word removal.  
           add enablePositionIncrements=true in both the index and query  
           analyzers to leave a 'gap' for more accurate phrase queries.  
         -->  
       <filter class="solr.StopFilterFactory"  
                 ignoreCase="true"  
                 words="stopwords.txt"  
                 enablePositionIncrements="true"  
                 />  
       <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1"   
               generateNumberParts="1" catenateWords="1" catenateNumbers="1"   
               catenateAll="0" splitOnCaseChange="1"/>  
       <filter class="solr.LowerCaseFilterFactory"/>  
       <filter class="solr.SnowballPorterFilterFactory" language="English"   
                                                        protected="protwords.txt"/>  
     </analyzer>  
     <analyzer type="query">  
       <tokenizer class="solr.WhitespaceTokenizerFactory"/>  
         <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true"   
                                                                           expand="true"/>  
         <filter class="solr.StopFilterFactory"  
                 ignoreCase="true"  
                 words="stopwords.txt"  
                 enablePositionIncrements="true"  
                 />  
         <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1"   
                 generateNumberParts="1" catenateWords="0" catenateNumbers="0"   
                                         catenateAll="0" splitOnCaseChange="1"/>  
         <filter class="solr.LowerCaseFilterFactory"/>  
         <filter class="solr.SnowballPorterFilterFactory" language="English"   
                                                          protected="protwords.txt"/>  
       </analyzer>  
 </fieldType>  

2、再来看下fields节点内定义具体的字段（类似数据库的字段），含有以下属性：

name：字段名
type：之前定义过的各种FieldType
indexed：是否被索引
stored：是否被存储（如果不需要存储相应字段值，尽量设为false）
multiValued：是否有多个值（对可能存在多值的字段尽量设置为true，避免建索引时抛出错误）

[xhtml]  view plain copy 
     
    
 <fields>  
     <field name="id" type="integer" indexed="true" stored="true" required="true" />  
     <field name="name" type="text" indexed="true" stored="true" />  
     <field name="summary" type="text" indexed="true" stored="true" />  
     <field name="author" type="string" indexed="true" stored="true" />  
     <field name="date" type="date" indexed="false" stored="true" />  
     <field name="content" type="text" indexed="true" stored="false" />  
     <field name="keywords" type="keyword_text" indexed="true" stored="false" multiValued="true" />  
     <!--拷贝字段-->  
     <field name="all" type="text" indexed="true" stored="false" multiValued="true"/>  
 </fields>  

3、建议建立一个拷贝字段，将所有的全文本字段复制到一个字段中，以便进行统一的检索：

以下是拷贝设置：

[xhtml]  view plain copy 
     
    
 <copyField source="name" dest="all"/>  
 <copyField source="summary" dest="all"/>  

4、动态字段，没有具体名称的字段，用dynamicField字段

如：name为*_i，定义它的type为int，那么在使用这个字段的时候，任务以_i结果的字段都被认为符合这个定义。如name_i, school_i

[xhtml]  view plain copy 
     
    
 <dynamicField name="*_i"  type="int"    indexed="true"  stored="true"/>  
 <dynamicField name="*_s"  type="string"  indexed="true"  stored="true"/>  
 <dynamicField name="*_l"  type="long"   indexed="true"  stored="true"/>  
 <dynamicField name="*_t"  type="text"    indexed="true"  stored="true"/>  
 <dynamicField name="*_b"  type="boolean" indexed="true"  stored="true"/>  
 <dynamicField name="*_f"  type="float"  indexed="true"  stored="true"/>  
 <dynamicField name="*_d"  type="double" indexed="true"  stored="true"/>  
 <dynamicField name="*_dt" type="date"    indexed="true"  stored="true"/>  

schema.xml文档注释中的信息：

1、为了改进性能，可以采取以下几种措施：

将所有只用于搜索的，而不需要作为结果的field（特别是一些比较大的field）的stored设置为false
将不需要被用于搜索的，而只是作为结果返回的field的indexed设置为false
删除所有不必要的copyField声明
为了索引字段的最小化和搜索的效率，将所有的 text fields的index都设置成field，然后使用copyField将他们都复制到一个总的 text field上，然后对他进行搜索。
为了最大化搜索效率，使用java编写的客户端与solr交互（使用流通信）
在服务器端运行JVM（省去网络通信），使用尽可能高的Log输出等级，减少日志量。

2、<schema name="example" version="1.2">

name：标识这个schema的名字
version：现在版本是1.2

3、filedType

name：标识而已。
class和其他属性决定了这个fieldType的实际行为。（class以solr开始的，都是在org.appache.solr.analysis包下）

可选的属性：

sortMissingLast和sortMissingFirst两个属性是用在可以内在使用String排序的类型上（包括：string,boolean,sint,slong,sfloat,sdouble,pdate）。
sortMissingLast="true"，没有该field的数据排在有该field的数据之后，而不管请求时的排序规则。
sortMissingFirst="true"，跟上面倒过来呗。
2个值默认是设置成false

StrField类型不被分析，而是被逐字地索引/存储。

StrField和TextField都有一个可选的属性“compressThreshold”，保证压缩到不小于一个大小（单位：char）

solr.TextField 允许用户通过分析器来定制索引和查询，分析器包括一个分词器（tokenizer）和多个过滤器（filter）

positionIncrementGap：可选属性，定义在同一个文档中此类型数据的空白间隔，避免短语匹配错误。

空格分词，精确匹配。

在分词和匹配时，考虑 "-"连字符，字母数字的界限，非字母数字字符，这样 "wifi"或"wi fi"都能匹配"Wi-Fi"。

同义词

在禁用字（stopword）删除后，在短语间增加间隔

stopword：即在建立索引过程中（建立索引和搜索）被忽略的词，比如is this等常用词。在conf/stopwords.txt维护。

4、fields

name：标识而已。
type：先前定义的类型。
indexed：是否被用来建立索引（关系到搜索和排序）
stored：是否储存
compressed：[false]，是否使用gzip压缩（只有TextField和StrField可以压缩）
mutiValued：是否包含多个值
omitNorms：是否忽略掉Norm，可以节省内存空间，只有全文本field和need an index-time boost的field需要norm。（具体没看懂，注释里有矛盾）
termVectors：[false]，当设置true，会存储 term vector。当使用MoreLikeThis，用来作为相似词的field应该存储起来。
termPositions：存储 term vector中的地址信息，会消耗存储开销。
termOffsets：存储 term vector 的偏移量，会消耗存储开销。
default：如果没有属性需要修改，就可以用这个标识下。

包罗万象（有点夸张）的field，包含所有可搜索的text fields，通过copyField实现。

< copyField source =" name " dest =" text " />

< copyField source =" manu " dest =" text " />

< copyField source =" features " dest =" text " />

< copyField source =" includes " dest =" text " />

在添加索引时，将所有被拷贝field（如cat）中的数据拷贝到text field中

作用：

将多个field的数据放在一起同时搜索，提供速度
将一个field的数据拷贝到另一个，可以用2种不同的方式来建立索引。

如果一个field的名字没有匹配到，那么就会用动态field试图匹配定义的各种模式。

"*"只能出现在模式的最前和最后
较长的模式会被先去做匹配
如果2个模式同时匹配上，最先定义的优先

如果通过上面的匹配都没找到，可以定义这个，然后定义个type，当String处理。（一般不会发生）

但若不定义，找不到匹配会报错。

5、其他一些标签

文档的唯一标识，必须填写这个field（除非该field被标记required="false"），否则solr建立索引报错。

如果搜索参数中没有指定具体的field，那么这是默认的域。

配置搜索参数短语间的逻辑，可以是"AND|OR"。

二、solrconfig.xml

1、索引配置

mainIndex 标记段定义了控制Solr索引处理的一些因素.

useCompoundFile：通过将很多 Lucene 内部文件整合到单一一个文件来减少使用中的文件的数量。这可有助于减少 Solr 使用的文件句柄数目，代价是降低了性能。除非是应用程序用完了文件句柄，否则 false 的默认值应该就已经足够。
useCompoundFile：通过将很多Lucene内部文件整合到一个文件，来减少使用中的文件的数量。这可有助于减少Solr使用的文件句柄的数目，代价是降低了性能。除非是应用程序用完了文件句柄，否则false的默认值应该就已经足够了。
mergeFacor：决定Lucene段被合并的频率。较小的值（最小为2）使用的内存较少但导致的索引时间也更慢。较大的值可使索引时间变快但会牺牲较多的内存。（典型的时间与空间的平衡配置）
maxBufferedDocs：在合并内存中文档和创建新段之前，定义所需索引的最小文档数。段是用来存储索引信息的Lucene文件。较大的值可使索引时间变快但会牺牲较多内存。
maxMergeDocs：控制可由Solr合并的 Document 的最大数。较小的值（<10,000）最适合于具有大量更新的应用程序。
maxFieldLength：对于给定的Document，控制可添加到Field的最大条目数，进而阶段该文档。如果文档可能会很大，就需要增加这个数值。然后，若将这个值设置得过高会导致内存不足错误。
unlockOnStartup：告知Solr忽略在多线程环境中用来保护索引的锁定机制。在某些情况下，索引可能会由于不正确的关机或其他错误而一直处于锁定，这就妨碍了添加和更新。将其设置为true可以禁用启动索引，进而允许进行添加和更新。（锁机制）

2、查询处理配置

query标记段中以下一些与缓存无关的特性：

maxBooleanClauses：定义可组合在一起形成以个查询的字句数量的上限。正常情况1024已经足够。如果应用程序大量使用了通配符或范围查询，增加这个限制将能避免当值超出时，抛出TooMangClausesException。
enableLazyFieldLoading：如果应用程序只会检索Document上少数几个Field，那么可以将这个属性设置为true。懒散加载的一个常见场景大都发生在应用程序返回一些列搜索结果的时候，用户常常会单击其中的一个来查看存储在此索引中的原始文档。初始的现实常常只需要现实很短的一段信息。若是检索大型的Document，除非必需，否则就应该避免加载整个文档。

query部分负责定义与在Solr中发生的时间相关的几个选项：

概念：Solr（实际上是Lucene）使用称为Searcher的Java类来处理Query实例。Searcher将索引内容相关的数据加载到内存中。根据索引、CPU已经可用内存的大小，这个过程可能需要较长的一段时间。要改进这一设计和显著提高性能，Solr引入了一张“温暖”策略，即把这些新的Searcher联机以便为现场用户提供查询服务之前，先对它们进行“热身”。

newSearcher和firstSearcher事件，可以使用这些事件来制定实例化新Searcher或第一个Searcher时，应该执行哪些查询。如果应用程序期望请求某些特定的查询，那么在创建新Searcher或第一个Searcher时就应该反注释这些部分并执行适当的查询。

query中的智能缓存：

filterCache：通过存储一个匹配给定查询的文档 id 的无序集，过滤器让 Solr 能够有效提高查询的性能。缓存这些过滤器意味着对Solr的重复调用可以导致结果集的快速查找。更常见的场景是缓存一个过滤器，然后再发起后续的精炼查询，这种查询能使用过滤器来限制要搜索的文档数。
queryResultCache：为查询、排序条件和所请求文档的数量缓存文档 id 的有序集合。
documentCache：缓存Lucene Document，使用内部Lucene文档id（以便不与Solr唯一id相混淆）。由于Lucene的内部Document id 可以因索引操作而更改，这种缓存不能自热。
Named caches：命名缓存是用户定义的缓存，可被 Solr定制插件所使用。

其中filterCache、queryResultCache、Named caches（如果实现了org.apache.solr.search.CacheRegenerator）可以自热。

每个缓存声明都接受最多四个属性：

class：是缓存实现的Java名
size：是最大的条目数
initialSize：是缓存的初始大小
autoWarmCount：是取自旧缓存以预热新缓存的条目数。如果条目很多，就意味着缓存的hit会更多，只不过需要花更长的预热时间。

对于所有缓存模式而言，在设置缓存参数时，都有必要在内存、cpu和磁盘访问之间进行均衡。统计信息管理页（管理员界面的Statistics）对于分析缓存的 hit-to-miss 比例以及微调缓存大小的统计数据都非常有用。而且，并非所有应用程序都会从缓存受益。实际上，一些应用程序反而会由于需要将某个永远也用不到的条目存储在缓存中这一额外步骤而受到影响。

揭秘Fluss核心功能 - 底层存储和查询大圣数据星球大数据 Flink 设计模式
大家好，我是大圣。Fluss提供了可靠的底层存储设计与灵活的查询更新机制。然而，这一切听起来似乎很复杂，里面有太多看似晦涩的技术名词——比如日志表（LogTablet）、键值表（KvTablet）、Tablet、TabletServer等等。那么，Fluss的存储到底是怎么运作的？本文将从一个具体的数据例子出发，带你逐步了解Fluss的底层存储逻辑，以及查询和更新数据时，系统背后的变化过程。从一个
Fluss 与数据湖的深度解析（二）大圣数据星球大数据 Flink 设计模式
上一篇文章中我们说了Fluss与Paimon数据湖的三个相关问题：如何查询Paimon数据湖中的数据？如何查询Fluss和Paimon数据的“联合视图”？如何只查询Fluss中的数据？大家可以先去看这一篇文章，其中第二点如何查询Fluss和Paimon数据的“联合视图”中还遗留一个问题：在做数据查询的时候Fluss和Paimon数据湖是怎么保证数据一致性的，也就是事务的。还有第三点如何只查询Flu
解决docker: Error response from daemon: Get “https://registry-1.docker.io/v2/“: net/http: request canc 码农甘道夫 docker k8s docker 容器
解决docker:Errorresponsefromdaemon:Get“https://registry-1.docker.io/v2/”:net/http:requestcanceledwhilewaitingforconnection(Client.Timeoutexceededwhileawaitingheaders).首先进入/etc/docker/daemon.json文件然后在里面加
基于人工智能的Python面试题请一直在路上 python 开发语言
基于人工智能的Python面试题1.Python中的元组与列表区别是什么？列表是可变类型，元组不是。列表是引用类型，元组不是。列表使用场景更宽泛，元组更多用于一些数据不可变的场景，例如参数、或者返回值。2.Python中的字典是否有序？python3.6之前字典是无序的，之后是有序的。原因可以参考下这个帖子https://blog.csdn.net/weixin_48629601/article/
电磁兼容学习笔记12-电子设备中的主要骚扰源胡你一脸团团团学习笔记单片机
跟杨老师学习电磁兼容电子设备中的主要骚扰源#第16课典型的骚扰源（找du/dt、di/dt比较大的电路）：骚扰源1：二次电源（几乎所有的电路都需要DC/DC），传导骚扰骚扰源2：数字电路，传导骚扰和辐射骚扰DC/DC模块骚扰产生原理：du/dt：开关导通时，直流电压直接传送到输出端；开关断开时，电流无法传送到输出端，依靠输出端电容进行供电。开关导通时，输出电压为0；断开时电容放电，开关上电压为输入
SD ComfyUI工作流平面模型房屋3D渲染 Mr数据杨 Stable Diffusion AI绘画 ComfyUI AI绘画
文章目录平面模型房屋3D渲染SD模型Node节点工作流程开发与应用效果展示平面模型房屋3D渲染此工作流是为将平面模型房屋图转换为3D渲染而设计，利用先进的模型和节点处理图像，增加细节和色彩，以及通过超分辨率技术增强最终图像的清晰度。流程从加载图像开始，经过一系列的处理步骤，包括图像缩放、条件编码、模型加载，最终通过高级放大技术提高图像分辨率，以达到高清的视觉效果。SD模型模型名称说明majicMI
Autoware平台架构及设计星火(star&fire) autosar 自动驾驶 apollo Apollo 自动驾驶
官网：https://autoware.org/autoware-overview/gitlab仓库：https://github.com/autowarefoundation/autowaregithub仓库：https://github.com/autowarefoundation/autoware.universeAutowareAutoware是一个自动驾驶开发平台，由Apex.AI开发和
Java实战：Spring Boot实现多租户思路拥抱AI java spring boot 开发语言
引言在当今云计算与SaaS服务盛行的时代，多租户架构成为了很多企业级应用的基础设计之一。这种架构允许单一应用程序实例为多个组织（租户）提供服务，同时保持各租户数据和配置的隔离性。SpringBoot作为现代Java开发领域的翘楚框架，其简洁明快的风格与高度灵活性使它成为构建多租户应用的理想选择。本文将带领您走进SpringBoot的世界，详细探讨如何实现多租户架构。一、多租户架构概述多租户模型多租
17-7 向量数据库之野望7 - PostgreSQL 和pgvector 拉达曼迪斯II AIGC学习数据库管理工具 AI创业数据库 postgresql 人工智能机器学习 AIGC 搜索引擎
PostgreSQL是一款功能强大的开源对象关系数据库系统，它已将其功能扩展到传统数据管理之外，通过pgvector扩展支持矢量数据。这一新增功能满足了对高效处理高维矢量数据日益增长的需求，这些数据通常用于机器学习、自然语言处理(NLP)和推荐系统等应用。https://github.com/mazzasaverio/find-your-opensource-project什么是pgvector？
基于Damo-YOLO和DyHead检测头的YOLOv8优化：多尺度目标检测的创新方案【YOLOv8】步入烟尘 YOLO系列创新涨点超专栏 YOLO 目标检测人工智能 YOLOv8
本专栏专为AI视觉领域的爱好者和从业者打造。涵盖分类、检测、分割、追踪等多项技术，带你从入门到精通！后续更有实战项目，助你轻松应对面试挑战！立即订阅，开启你的YOLOv8之旅！专栏订阅地址：https://blog.csdn.net/mrdeam/category_12804295.html文章目录基于Damo-YOLO和DyHead检测头的YOLOv8优化：多尺度目标检测的创新方案【YOLOv8
提升YOLOv8性能：用Swin Transformer替换Backbone的详细实现与分析【YOLOv8】步入烟尘 YOLO系列创新涨点超专栏 YOLOv8 YOLO 目标跟踪
本专栏专为AI视觉领域的爱好者和从业者打造。涵盖分类、检测、分割、追踪等多项技术，带你从入门到精通！后续更有实战项目，助你轻松应对面试挑战！立即订阅，开启你的YOLOv8之旅！专栏订阅地址：https://blog.csdn.net/mrdeam/category_12804295.html文章目录YOLOv8改进|主干篇|SwinTransformer替换Backbone（附代码+详细修改步骤+
matlab实现一个雷达信号处理的程序，涉及到对原始图像的模拟、加权、加噪以及通过迭代算法对图像进行恢复和优化处理 max500600 MATLAB 算法算法 matlab 信号处理
clcclearcloseallloadscene3.mat%加载原始图像，自己设计设计为一个300*400的矩阵300是距离向长度，400是方位向长度Map_ori=scene3;[M,N_K]=size(Map_ori);figureimagesc(scene3)v=100;%机载速度，单位m/sbandwidth=30*1e6;%信号带宽，决定距离分辨率，单位Hzc=3*1e8;%光速R_R
如何学懂C++语言：C++从入门到精通的全面指南（完整C++学习笔记）猿享天开 c++学习笔记
数字人助手猿小美带你一起学编程一、引言作为一名拥有多年开发经验的技术人员，我的职业生涯涵盖了多种编程语言，包括C语言、C++、C#和JavaScript等。在我多年的编程生涯中，这些语言不仅丰富了我的知识储备，还极大地拓展了我的视野和技能。出于对编程的热爱，以及希望帮助更多编程爱好者的目的，我决定利用业余时间整理一套全面的C++语言学习指南。这套指南旨在为C++语言编程爱好者提供一个清晰的学习路线
海外抖音技术深度解析：算法、AI与全球化的挑战神探阿航计算机产业科普与思考算法人工智能机器学习数据挖掘深度学习
引言2025年1月19日，在美国宣布暂停服务，这一事件引发了全球用户的广泛关注。作为全球最受欢迎的短视频平台之一，其成功离不开其强大的技术支撑，尤其是其个性化推荐算法和AI驱动的创作工具。然而，随着全球市场环境的变化，它面临的技术与运营挑战也日益凸显。本文将深入分析其技术核心、全球化运营中的挑战及其未来发展方向。核心：个性化推荐引擎其算法是其成功的关键，其核心在于个性化推荐引擎。该引擎采用深度学习
Fluss安装体验 WYRM_GOLD fluss flink big data zookeeper kafka
1、zookeeper安装笔者下载的是fluss0.5版本，当前fluss0.5版本需要依赖zookeeper服务。1.1下载zk下载地址:https://mirrors.aliyun.com/apache/zookeeper/zookeeper-3.8.4/apache-zookeeper-3.8.4-bin.tar.gz1.1.1zk集群规划node1192.168.40.1node2192.
matlab代码实现了一个基于 SVM（支持向量机）的图像分割系统 go5463158465 MATLAB专栏算法深度学习 matlab 支持向量机开发语言
clear;clc;main();%1.数据加载和预处理function[features,labels]=prepareData(imageFolder)%获取所有图像和JSON文件imgFiles
JAVA 反射(JAVA面试题) geejkse_seff java 开发语言
5.1.2.JAVA反射5.1.2.1.动态语言动态语言，是指程序在运行时可以改变其结构：新的函数可以引进，已有的函数可以被删除等结构上的变化。比如常见的JavaScript就是动态语言，除此之外Ruby,Python等也属于动态语言，而C、C++则不属于动态语言。从反射角度说JAVA属于半动态语言。5.1.2.2.反射机制概念（运行状态中知道类所有的属性和方法）在Java中的反射机制是指在运行状
使用Nginx反向代理将多个服务配置成二级域名访问博远~ Nginx nginx 运维
在一个服务器中运行多个服务时，直接通过IP和端口访问不仅不方便记忆，也不利于管理。通过Nginx反向代理，可以将不同的服务配置成二级域名进行访问，从而简化访问方式。以下是详细的步骤和配置示例。前提条件已安装并配置了Nginx。已有一个域名，并可以添加二级域名解析。各个服务已经在服务器上运行，并可以通过IP和端口访问。步骤1.安装Nginx如果还未安装Nginx，可以通过以下命令进行安装#Ubunt
前后端分离实践（一）—— 基础理论篇 _云卷云舒_ 前后端分离前后端分离前后端分离
前后端分离实践系列文章总目录目录一、什么是前后端分离？二、为什么需要前后端分离？1、前后端职责不清2、开发效率不高三、前后端分离究竟分离了什么？1、开发职责的分离2、交互方式的分离3、代码组织方式的分离4、应用部署的分离四、为什么要加入Node中间层来实现前后端分离？1、反思前后端的定义2、加入Node中间层之后的系统架构图3、加入Node中间层之后的前后端职责划分4、加入Node中间层的优缺点一
《数据关联的艺术：揭开MySQL与图数据库结合的高级可视化探索》墨夶数据库学习资料2 数据库 mysql
在这个信息爆炸的时代，企业和研究者们面临着从海量数据中挖掘有价值信息的巨大挑战。传统的关系型数据库如MySQL虽然擅长处理结构化数据，但在面对复杂的关系网络时显得力不从心。而图数据库以其独特的架构优势，能够高效地表示和查询实体之间的多层关系。当我们将这两种技术结合起来，并辅以强大的可视化工具时，便开启了一扇通往更深层次数据分析的大门。本文将深入探讨如何通过MySQL与图数据库的结合来实现高级可视化
如何运用Python爬虫快速获得1688商品详情数据小爬虫程序猿 API python 爬虫开发语言
在数字化时代，数据的价值日益凸显，尤其是在电商领域。对于企业来说，获取竞争对手的商品信息是分析市场趋势、制定营销策略的重要手段。1688作为中国领先的B2B电商平台，拥有海量的商品数据。本文将介绍如何使用Python编写爬虫程序，以合法合规的方式快速获取1688商品详情，为电商企业提供数据支持。1.环境准备在开始编写代码之前，我们需要准备以下开发环境：Python3.x：确保已安装Python3.
Tomcat 假死原因分析 2401_87378716 tomcat python java
1.tomcatjvm内存溢出分析当时的gc.log7581861.927:[GC7581861.927:[ParNewDesiredsurvivorsize76677120bytes,newthreshold15(max15)-age1:5239168bytes,5239168total:749056K->10477K(898816K),0.0088550secs]1418818K->68023
AI与API的融合：构建智能互联技术世界的基石 IT数据V+I7809804594 人工智能数据分析 python 爬虫大数据
在当今科技飞速发展的时代，人工智能（AI）与应用程序接口（API）的融合正在开启智能应用的新纪元。AI以其强大的数据处理和分析能力，正在改变各行各业的工作方式，而API则作为连接技术与应用的桥梁，为AI技术的普及和应用提供了无限可能。本文将深入探讨AI与API的融合如何推动智能应用的创新和发展，以及其在各个领域的应用和前景。一、AI与API融合的背景随着大数据、云计算、物联网等技术的快速发展，人工
C语言期末必练题目——part 10（编程题） Kylin524 C语言期末 c语言算法开发语言
1.输入2个整数，求两数的平方和并输出。#includeintmain(void){intta,b,s;printf("pleaseinputa,b:\n");scanf("%d%d”,&a,&b);s=a*a+b*b;printf("theresultis%d\n",s);return0;}2.输入一个圆半径r，当r>＝0时，计算并输出圆的面积和周长，否则，输出提示信息。#include#def
C语言期末必练题目——part 2 Kylin524 C语言期末 c语言算法 c++
读程序基本输入输出及流程控制1.#includemain(){inta=1,b=3,c=5;if(c==a+b)printf("yes\n");elseprintf("no\n");}运行结果为：no详见教材p89选择结构详见教材p91关系符号详见附录Dp378符号的优先级==表示判断符号两边的值是否相等；=表示将符号右边的值赋给左边的变量本题考点是选择结构3种基本形式的第二种选择结构三种一般形式
PAT (Basic Level) Practice 乙级1001-1020 今天_也很困算法数据结构 c++
制作不易，大家的点赞和关注就是我更新的动力！由于这些题全是大一寒假刷的，部分还是c语言，部分的解题方法比较复杂，希望大家体谅。有问题欢迎大家在评论区讨论，有不足也请大家指出，谢谢大家！温馨提示：可以点目录跳转到相应题目哦。1001害死人不偿命的(3n+1)猜想分数15作者CHEN,Yue单位浙江大学卡拉兹(Callatz)猜想：对任何一个正整数n，如果它是偶数，那么把它砍掉一半；如果它是奇数，那么
python微博关键词爬虫嵌入式开发项目 2025年爬虫精通专栏 python 爬虫开发语言媒体
目录记一次阿里云盾滑块验证分析并通过操作环境数据接口proxy配置根据关键词获取userid根据userid获取信息数据保存数据：记一次阿里云盾滑块验证分析并通过操作环境win10、macPython3.9数据接口搜索https://**********?containerid=100103type%3D{chanenl}%26q%3D{quote(self.words)}&page_type=s
21天学通C++——11多态（引入多态的目的）不想睡觉_ QT客户端学习路线 c++开发语言
多态：利用不同类似的方法处理不同类似的对象笔记原因：既然继承可以进行基类的方法覆盖，为什么还要引入多态呢？解释原因：继承classBase{public:voidfunc(){std::coutfunc();return0;}结果为Base：：func（）引入多态（Virtual）classBase{public:virtualvoidfunc(){std::coutfunc();return0;
如何在Java服务中实现多租户架构：数据库与代码层的实现策略 wx_tangjinjinwx java 架构数据库
如何在Java服务中实现多租户架构：数据库与代码层的实现策略大家好，我是微赚淘客返利系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！在如今的SaaS应用开发中，多租户架构已经成为了一个常见的需求。多租户架构允许多个租户（客户）共享同一个应用程序，但数据隔离。本文将详细讲解如何在Java服务中实现多租户架构，包括数据库层和代码层的实现策略。我们将以cn.juwatech包为例展示具体的代码
python matplotlib legend()参数详解请一直在路上 python matplotlib 开发语言
在Python的Matplotlib库中，legend函数用于添加图例，帮助解释图表中不同数据系列或数据点的含义。legend函数有很多参数，可以自定义图例的各个方面，从位置到样式，从字体大小到边框。下面是一些常用参数的详细解释：importmatplotlib.pyplotasplt#创建一些数据x=[1,2,3,4]y1=[1,4,9,16]y2=[1,2,3,4]#绘制数据plt.plot(
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

Solr笔记（2）_Schema.xml和solrconfig.xml分析

你可能感兴趣的:(Solr笔记（2）_Schema.xml和solrconfig.xml分析)