Solr Schema.xml和solrconfig.xml分析

现在我们开始研究载入的数据部分（importing data）

在正式开始前，我们先介绍一个存储了大量音乐媒体的网站http://musicbrainz.org/ ，

这里的数据都是免费的，一个大型开放社区提供。

MusicBrainz每天都提供一个数据快照（snapshot）的SQL文件，这些数据可以被导入PostgreSQL数据库中。

一、字段配置（schema）

schema.xml位于solr/conf/目录下，类似于数据表配置文件，

定义了加入索引的数据的数据类型，主要包括type、fields和其他的一些缺省设置。

1、先来看下type节点，这里面定义FieldType子节点，包括name,class,positionIncrementGap等一些参数。

name：就是这个FieldType的名称。
class：指向org.apache.solr.analysis包里面对应的class名称，用来定义这个类型的行为。

 
      view plain  
      copy to clipboard  
      print  
      ? 
     
< schema   name = "example"   version = "1.2" >   
  < types >   
    < fieldType   name = "string"   class = "solr.StrField"   sortMissingLast = "true"   omitNorms = "true" />   
    < fieldType   name = "boolean"   class = "solr.BoolField"   sortMissingLast = "true"   omitNorms = "true" />   
    < fieldtype   name = "binary"   class = "solr.BinaryField" />   
    < fieldType   name = "int"   class = "solr.TrieIntField"   precisionStep = "0"   omitNorms = "true"    
                                                                positionIncrementGap = "0" />   
    < fieldType   name = "float"   class = "solr.TrieFloatField"   precisionStep = "0"   omitNorms = "true"    
                                                                positionIncrementGap = "0" />   
    < fieldType   name = "long"   class = "solr.TrieLongField"   precisionStep = "0"   omitNorms = "true"    
                                                                positionIncrementGap = "0" />   
    < fieldType   name = "double"   class = "solr.TrieDoubleField"   precisionStep = "0"   omitNorms = "true"    
                                                                positionIncrementGap = "0" />   
  ...  
  </ types >   
  ...  
</ schema >   

       Xhtml代码  
       
     
<schema name="example" version="1.2">  
  <types>  
    <fieldType name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true"/>  
    <fieldType name="boolean" class="solr.BoolField" sortMissingLast="true" omitNorms="true"/>  
    <fieldtype name="binary" class="solr.BinaryField"/>  
    <fieldType name="int" class="solr.TrieIntField" precisionStep="0" omitNorms="true"   
                                                                positionIncrementGap="0"/>  
    <fieldType name="float" class="solr.TrieFloatField" precisionStep="0" omitNorms="true"   
                                                                positionIncrementGap="0"/>  
    <fieldType name="long" class="solr.TrieLongField" precisionStep="0" omitNorms="true"   
                                                                positionIncrementGap="0"/>  
    <fieldType name="double" class="solr.TrieDoubleField" precisionStep="0" omitNorms="true"   
                                                                positionIncrementGap="0"/>  
  ...  
  </types>  
  ...  
</schema>  

必要的时候fieldType还需要自己定义这个类型的数据在建立索引和进行查询的时候要使用的分析器analyzer，包括分词和过滤，如下：

 
      view plain  
      copy to clipboard  
      print  
      ? 
     
< fieldType   name = "text_ws"   class = "solr.TextField"   positionIncrementGap = "100" >   
  < analyzer >   
    < tokenizer   class = "solr.WhitespaceTokenizerFactory" />   
  </ analyzer >   
</ fieldType >   
< fieldType   name = "text"   class = "solr.TextField"   positionIncrementGap = "100" >   
  < analyzer   type = "index" >   
    <!--这个分词包是空格分词，在向索引库添加text类型的索引时，Solr会首先用空格进行分词  
         然后把分词结果依次使用指定的过滤器进行过滤，最后剩下的结果，才会加入到索引库中以备查询。  
      注意:Solr的analysis包并没有带支持中文的包，需要自己添加中文分词器，google下。    
     -->   
    < tokenizer   class = "solr.WhitespaceTokenizerFactory" />   
        <!-- in this example, we will only use synonyms at query time  
        < filter   class = "solr.SynonymFilterFactory"   synonyms = "index_synonyms.txt"    
                                                  ignoreCase = "true"   expand = "false" />   
        -->   
        <!-- Case insensitive stop word removal.  
          add enablePositionIncrements = true  in both the index and query  
          analyzers to leave a 'gap' for more accurate phrase queries.  
        -->   
      < filter   class = "solr.StopFilterFactory"   
                ignoreCase = "true"   
                words = "stopwords.txt"   
                enablePositionIncrements = "true"   
                />   
      < filter   class = "solr.WordDelimiterFilterFactory"   generateWordParts = "1"    
              generateNumberParts = "1"   catenateWords = "1"   catenateNumbers = "1"    
              catenateAll = "0"   splitOnCaseChange = "1" />   
      < filter   class = "solr.LowerCaseFilterFactory" />   
      < filter   class = "solr.SnowballPorterFilterFactory"   language = "English"    
                                                       protected = "protwords.txt" />   
    </ analyzer >   
    < analyzer   type = "query" >   
      < tokenizer   class = "solr.WhitespaceTokenizerFactory" />   
        < filter   class = "solr.SynonymFilterFactory"   synonyms = "synonyms.txt"   ignoreCase = "true"    
                                                                          expand = "true"/>   
        < filter   class = "solr.StopFilterFactory"   
                ignoreCase = "true"   
                words = "stopwords.txt"   
                enablePositionIncrements = "true"   
                />   
        < filter   class = "solr.WordDelimiterFilterFactory"   generateWordParts = "1"    
                generateNumberParts = "1"   catenateWords = "0"   catenateNumbers = "0"    
                                        catenateAll = "0"   splitOnCaseChange = "1" />   
        < filter   class = "solr.LowerCaseFilterFactory" />   
        < filter   class = "solr.SnowballPorterFilterFactory"   language = "English"    
                                                         protected = "protwords.txt" />   
      </ analyzer >   
</ fieldType >   

       Xhtml代码  
       
     
<fieldType name="text_ws" class="solr.TextField" positionIncrementGap="100">  
  <analyzer>  
    <tokenizer class="solr.WhitespaceTokenizerFactory"/>  
  </analyzer>  
</fieldType>  
<fieldType name="text" class="solr.TextField" positionIncrementGap="100">  
  <analyzer type="index">  
    <!--这个分词包是空格分词，在向索引库添加text类型的索引时，Solr会首先用空格进行分词  
         然后把分词结果依次使用指定的过滤器进行过滤，最后剩下的结果，才会加入到索引库中以备查询。  
      注意:Solr的analysis包并没有带支持中文的包，需要自己添加中文分词器，google下。    
     -->  
    <tokenizer class="solr.WhitespaceTokenizerFactory"/>  
        <!-- in this example, we will only use synonyms at query time  
        <filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt"   
                                                  ignoreCase="true" expand="false"/>  
        -->  
        <!-- Case insensitive stop word removal.  
          add enablePositionIncrements=true in both the index and query  
          analyzers to leave a 'gap' for more accurate phrase queries.  
        -->  
      <filter class="solr.StopFilterFactory"  
                ignoreCase="true"  
                words="stopwords.txt"  
                enablePositionIncrements="true"  
                />  
      <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1"   
              generateNumberParts="1" catenateWords="1" catenateNumbers="1"   
              catenateAll="0" splitOnCaseChange="1"/>  
      <filter class="solr.LowerCaseFilterFactory"/>  
      <filter class="solr.SnowballPorterFilterFactory" language="English"   
                                                       protected="protwords.txt"/>  
    </analyzer>  
    <analyzer type="query">  
      <tokenizer class="solr.WhitespaceTokenizerFactory"/>  
        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true"   
                                                                          expand="true"/>  
        <filter class="solr.StopFilterFactory"  
                ignoreCase="true"  
                words="stopwords.txt"  
                enablePositionIncrements="true"  
                />  
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1"   
                generateNumberParts="1" catenateWords="0" catenateNumbers="0"   
                                        catenateAll="0" splitOnCaseChange="1"/>  
        <filter class="solr.LowerCaseFilterFactory"/>  
        <filter class="solr.SnowballPorterFilterFactory" language="English"   
                                                         protected="protwords.txt"/>  
      </analyzer>  
</fieldType>  

2、再来看下fields节点内定义具体的字段（类似数据库的字段），含有以下属性：

name：字段名
type：之前定义过的各种FieldType
indexed：是否被索引
stored：是否被存储（如果不需要存储相应字段值，尽量设为false）
multiValued：是否有多个值（对可能存在多值的字段尽量设置为true，避免建索引时抛出错误）

 
      view plain  
      copy to clipboard  
      print  
      ? 
     
< fields >   
    < field   name = "id"   type = "integer"   indexed = "true"   stored = "true"   required = "true"   />   
    < field   name = "name"   type = "text"   indexed = "true"   stored = "true"   />   
    < field   name = "summary"   type = "text"   indexed = "true"   stored = "true"   />   
    < field   name = "author"   type = "string"   indexed = "true"   stored = "true"   />  
    < field   name = "date"   type = "date"   indexed = "false"   stored = "true"   />   
    < field   name = "content"   type = "text"   indexed = "true"   stored = "false"   />  
    < field   name = "keywords"   type = "keyword_text"   indexed = "true"   stored = "false"   multiValued = "true"   />   
    <!--拷贝字段-->   
    < field   name = "all"   type = "text"   indexed = "true"   stored = "false"   multiValued = "true" />   
</ fields >   

       Xhtml代码  
       
     
<fields>  
    <field name="id" type="integer" indexed="true" stored="true" required="true" />  
    <field name="name" type="text" indexed="true" stored="true" />  
    <field name="summary" type="text" indexed="true" stored="true" />  
    <field name="author" type="string" indexed="true" stored="true" />  
    <field name="date" type="date" indexed="false" stored="true" />  
    <field name="content" type="text" indexed="true" stored="false" />  
    <field name="keywords" type="keyword_text" indexed="true" stored="false" multiValued="true" />  
    <!--拷贝字段-->  
    <field name="all" type="text" indexed="true" stored="false" multiValued="true"/>  
</fields>  

3、建议建立一个拷贝字段，将所有的全文本字段复制到一个字段中，以便进行统一的检索：

以下是拷贝设置：

 
      view plain  
      copy to clipboard  
      print  
      ? 
     
< copyField   source = "name"   dest = "all" />   
< copyField   source = "summary"   dest = "all" />   

       Xhtml代码  
       
     
<copyField source="name" dest="all"/>  
<copyField source="summary" dest="all"/>  

4、动态字段，没有具体名称的字段，用dynamicField字段

如：name为*_i，定义它的type为int，那么在使用这个字段的时候，任务以_i结果的字段都被认为符合这个定义。如name_i, school_i

 
     view plain  
     copy to clipboard  
     print  
     ? 
    
< dynamicField   name = "*_i"    type = "int"      indexed = "true"    stored = "true" />  
< dynamicField   name = "*_s"    type = "string"    indexed = "true"    stored = "true" />   
< dynamicField   name = "*_l"    type

schema.xml文档注释中的信息：
1、为了改进性能，可以采取以下几种措施：
将所有只用于搜索的，而不需要作为结果的field（特别是一些比较大的field）的stored设置为false
将不需要被用于搜索的，而只是作为结果返回的field的indexed设置为false
删除所有不必要的copyField声明
为了索引字段的最小化和搜索的效率，将所有的 text fields的index都设置成field，然后使用copyField将他们都复制到一个总的 text field上，然后对他进行搜索。
为了最大化搜索效率，使用java编写的客户端与solr交互（使用流通信）
在服务器端运行JVM（省去网络通信），使用尽可能高的Log输出等级，减少日志量。
2、< schema name =" example " version =" 1.2 " >
name：标识这个schema的名字
version：现在版本是1.2
3、filedType
< fieldType name =" string " class =" solr.StrField " sortMissingLast =" true " omitNorms =" true" />
name：标识而已。
class和其他属性决定了这个fieldType的实际行为。（class以solr开始的，都是在org.appache.solr.analysis包下）
可选的属性：
sortMissingLast和sortMissingFirst两个属性是用在可以内在使用String排序的类型上（包括：string,boolean,sint,slong,sfloat,sdouble,pdate）。
sortMissingLast="true"，没有该field的数据排在有该field的数据之后，而不管请求时的排序规则。
sortMissingFirst="true"，跟上面倒过来呗。
2个值默认是设置成false
StrField类型不被分析，而是被逐字地索引/存储。
StrField和TextField都有一个可选的属性“compressThreshold”，保证压缩到不小于一个大小（单位：char）
< fieldType name =" text " class =" solr.TextField " positionIncrementGap =" 100 " >
solr.TextField 允许用户通过分析器来定制索引和查询，分析器包括 一个分词器（tokenizer）和多个过滤器（filter）
positionIncrementGap：可选属性，定义在同一个文档中此类型数据的空白间隔，避免短语匹配错误。
< tokenizer class =" solr.WhitespaceTokenizerFactory " />
空格分词，精确匹配。
< filter class =" solr.WordDelimiterFilterFactory " generateWordParts =" 1 " generateNumberParts=" 1 " catenateWords =" 1 " catenateNumbers =" 1 " catenateAll =" 0 " splitOnCaseChange =" 1 " />
在分词和匹配时，考虑 "-"连字符，字母数字的界限，非字母数字字符，这样 "wifi"或"wi fi"都能匹配"Wi-Fi"。
< filter class =" solr.SynonymFilterFactory " synonyms =" synonyms.txt " ignoreCase =" true " expand =" true " />
同义词 
< filter class =" solr.StopFilterFactory " ignoreCase =" true " words =" stopwords.txt " enablePositionIncrements =" true " />
在禁用字（stopword）删除后，在短语间增加间隔
stopword：即在建立索引过程中（建立索引和搜索）被忽略的词，比如is this等常用词。在conf/stopwords.txt维护。
4、fields
< field name =" id " type =" string " indexed =" true " stored =" true " required =" true " />
name：标识而已。
type：先前定义的类型。
indexed：是否被用来建立索引（关系到搜索和排序）
stored：是否储存
compressed：[false]，是否使用gzip压缩（只有TextField和StrField可以压缩）
mutiValued：是否包含多个值
omitNorms：是否忽略掉Norm，可以节省内存空间，只有全文本field和need an index-time boost的field需要norm。（具体没看懂，注释里有矛盾）
termVectors：[false]，当设置true，会存储 term vector。当使用MoreLikeThis，用来作为相似词的field应该存储起来。
termPositions：存储 term vector中的地址信息，会消耗存储开销。
termOffsets：存储 term vector 的偏移量，会消耗存储开销。
default：如果没有属性需要修改，就可以用这个标识下。
< field name =" text " type =" text " indexed =" true " stored =" false " multiValued =" true " />
包罗万象（有点夸张）的field，包含所有可搜索的text fields，通过copyField实现。
< copyField source =" cat " dest =" text " />
 
        
     <  
     copyField  
     source  
     ="  
     name  
     "  
     dest  
     ="  
     text  
     " /> 
    
 
        
     <  
     copyField  
     source  
     ="  
     manu  
     "  
     dest  
     ="  
     text  
     " /> 
    
 
        
     <  
     copyField  
     source  
     ="  
     features  
     "  
     dest  
     ="  
     text  
     " /> 
    
 
        
     <  
     copyField  
     source  
     ="  
     includes  
     "  
     dest  
     ="  
     text  
     " /> 
    
在添加索引时，将所有被拷贝field（如cat）中的数据拷贝到text field中
作用：
将多个field的数据放在一起同时搜索，提供速度
将一个field的数据拷贝到另一个，可以用2种不同的方式来建立索引。
< dynamicField name =" *_i " type =" int " indexed =" true " stored =" true " />
如果一个field的名字没有匹配到，那么就会用动态field试图匹配定义的各种模式。
"*"只能出现在模式的最前和最后
较长的模式会被先去做匹配
如果2个模式同时匹配上，最先定义的优先
< dynamicField name =" * " type =" ignored " multiValued=" true " />
如果通过上面的匹配都没找到，可以定义这个，然后定义个type，当String处理。（一般不会发生）
但若不定义，找不到匹配会报错。
5、其他一些标签
< uniqueKey > id </ uniqueKey >
文档的唯一标识， 必须填写这个field（除非该field被标记required="false"），否则solr建立索引报错。
< defaultSearchField > text </ defaultSearchField >
如果搜索参数中没有指定具体的field，那么这是默认的域。
< solrQueryParser defaultOperator =" OR " />
配置搜索参数短语间的逻辑，可以是"AND|OR"。
二、solrconfig.xml
1、索引配置
mainIndex 标记段定义了控制Solr索引处理的一些因素.
useCompoundFile：通过将很多 Lucene 内部文件整合到单一一个文件来减少使用中的文件的数量。这可有助于减少 Solr 使用的文件句柄数目，代价是降低了性能。除非是应用程序用完了文件句柄，否则 false 的默认值应该就已经足够。
useCompoundFile：通过将很多Lucene内部文件整合到一个文件，来减少使用中的文件的数量。这可有助于减少Solr使用的文件句柄的数目，代价是降低了性能。除非是应用程序用完了文件句柄，否则false的默认值应该就已经足够了。
mergeFacor：决定Lucene段被合并的频率。较小的值（最小为2）使用的内存较少但导致的索引时间也更慢。较大的值可使索引时间变快但会牺牲较多的内存。（典型的 时间与空间 的平衡配置）
maxBufferedDocs：在合并内存中文档和创建新段之前，定义所需索引的最小文档数。段 是用来存储索引信息的Lucene文件。较大的值可使索引时间变快但会牺牲较多内存。
maxMergeDocs：控制可由Solr合并的 Document 的最大数。较小的值（<10,000）最适合于具有大量更新的应用程序。
maxFieldLength：对于给定的Document，控制可添加到Field的最大条目数，进而阶段该文档。如果文档可能会很大，就需要增加这个数值。然后，若将这个值设置得过高会导致内存不足错误。
unlockOnStartup：告知Solr忽略在多线程环境中用来保护索引的锁定机制。在某些情况下，索引可能会由于不正确的关机或其他错误而一直处于锁定，这就妨碍了添加和更新。将其设置为true可以禁用启动索引，进而允许进行添加和更新。（锁机制）
 2、查询处理配置
query标记段中以下一些与缓存无关的特性：
maxBooleanClauses：定义可组合在一起形成以个查询的字句数量的上限。正常情况1024已经足够。如果应用程序大量使用了通配符或范围查询，增加这个限制将能避免当值超出时，抛出TooMangClausesException。
enableLazyFieldLoading：如果应用程序只会检索Document上少数几个Field，那么可以将这个属性设置为 true。懒散加载的一个常见场景大都发生在应用程序返回一些列搜索结果的时候，用户常常会单击其中的一个来查看存储在此索引中的原始文档。初始的现实常 常只需要现实很短的一段信息。若是检索大型的Document，除非必需，否则就应该避免加载整个文档。
query部分负责定义与在Solr中发生的时间相关的几个选项：
概念：Solr（实际上是Lucene）使用称为Searcher的Java类来处理Query实例。Searcher将索引内容相关的数据加载到 内存中。根据索引、CPU已经可用内存的大小，这个过程可能需要较长的一段时间。要改进这一设计和显著提高性能，Solr引入了一张“温暖”策略，即把这 些新的Searcher联机以便为现场用户提供查询服务之前，先对它们进行“热身”。
newSearcher和firstSearcher事件，可以使用这些事件来制定实例化新Searcher或第一个Searcher时，应该执 行哪些查询。如果应用程序期望请求某些特定的查询，那么在创建新Searcher或第一个Searcher时就应该反注释这些部分并执行适当的查询。
query中的智能缓存：
filterCache：通过存储一个匹配给定查询的文档 id 的无序集，过滤器让 Solr 能够有效提高查询的性能。缓存这些过滤器意味着对Solr的重复调用可以导致结果集的快速查找。更常见的场景是缓存一个过滤器，然后再发起后续的精炼查 询，这种查询能使用过滤器来限制要搜索的文档数。
queryResultCache：为查询、排序条件和所请求文档的数量缓存文档 id 的有序集合。
documentCache：缓存Lucene Document，使用内部Lucene文档id（以便不与Solr唯一id相混淆）。由于Lucene的内部Document id 可以因索引操作而更改，这种缓存不能自热。
Named caches：命名缓存是用户定义的缓存，可被 Solr定制插件 所使用。
其中filterCache、queryResultCache、Named caches（如果实现了org.apache.solr.search.CacheRegenerator）可以自热。
每个缓存声明都接受最多四个属性：
class：是缓存实现的Java名
size：是最大的条目数
initialSize：是缓存的初始大小
autoWarmCount：是取自旧缓存以预热新缓存的条目数。如果条目很多，就意味着缓存的hit会更多，只不过需要花更长的预热时间。
对于所有缓存模式而言，在设置缓存参数时，都有必要在内存、cpu和磁盘访问之间进行均衡。统计信息管理页（管理员界面的Statistics）对 于分析缓存的 hit-to-miss 比例以及微调缓存大小的统计数据都非常有用。而且，并非所有应用程序都会从缓存受益。实际上，一些应用程序反而会由于需要将某个永远也用不到的条目存储在 缓存中这一额外步骤而受到影响。

你可能感兴趣的:(schema)

openai 标准化协议 Structured Outputs 具体示例教程 weixin_40941102 语言模型
StructuredOutputs具体示例教程场景：个人财务管理助手假设我们要构建一个AI助手，帮助用户记录和管理个人财务支出。用户可以输入自然语言描述（如“昨天我花了50元买了午餐”），助手将提取关键信息并以结构化JSON格式返回，包括日期、金额、类别和备注。示例1：使用StructuredOutputs提取财务记录步骤1：定义JSONSchema我们需要一个清晰的Schema来描述财务记录：{
SQL分类 penglaifei Web sql 数据库
DDL(DataDefiationLanguage)数据定义语言，用来定义数据库对象（数据库、表、字段）数据库操作——查询所有数据库：show.databases；注：information_schemamysqlperformance_schemasys是系统自带的数据库——查询当前数据库selectdatabase();——使用/切换数据库usename#数据库名；——创建数据库（数据库名不可
数据库语句 lrydnh 数据库
//双击数据库useworld;//显示数据库里有多少张表showtables;一个大的项目就是数据库。SQL语句createschemaDataDefinitionLanguage:数据定义语言(DDL)查看创建和删除数据库：showdatabases;createdatabaseWorker;dropdatabaseWorker;增删改表tableshowtables;createtablet
PostgreSQL 用户及授权管理 04：授予及回收权限 LavenLiu postgresql
PostgreSQL是一个坚如磐石的数据库，它非常注重安全性，提供了非常丰富的基础设施来处理权限、特权和安全策略。在前面的章节中以我们介绍的基本概念为基础，重新审视角色概念，特别关注授予角色的安全性和权限（角色可以是用户，也可以是用户组）。我们将学习如何配置角色的各个方面以细致管理安全性，从连接到访问数据库中的数据。文章目录授予及回收权限表相关的权限基于列的权限序列相关的权限schema相关的权限
PostgreSQL数据库怎么生成一个随机的UUID chen2017sheng 经验总结数据库 postgresql
如果需要在pg数据库中生成UUID做表的主键该如何实现，有两种方法：方法一：使用pgcrypto扩展的pg_random_uuid()函数要在PostgreSQL中使用pg_random_uuid()函数，你需要首先确保pgcrypto扩展已经被安装在你的数据库中，并且对于你想要使用它的数据库（或schema）已经启用了这个扩展。以下是如何启用pgcrypto扩展的步骤：登录到PostgreSQL
Spark 中创建 DataFrame 的2种方式对比闯闯桑 spark 大数据分布式 scala
spark.createDataFrame(data).toDF("name","age")和spark.createDataFrame(spark.sparkContext.parallelize(data),schema)创建df的方式有什么区别？在Spark中，创建DataFrame的方式有多种，其中两种常见的方式是：spark.createDataFrame(data).toDF("nam
MongoDB在Spring商城用户行为记录中的应用小小初霁 mongodb spring 数据库
一、MongoDB的优势灵活Schema用户行为数据结构多变（如点击、搜索、下单），MongoDB的文档模型无需固定字段，适应快速迭代。高吞吐写入支持批量插入，适合高并发场景（如秒杀活动的用户操作记录）。复杂查询优化支持聚合管道、地理空间查询、全文索引，便于多维分析。水平扩展通过分片（Sharding）应对海量数据存储。二、用户行为数据建模1.基础行为记录集合（如user_actions）{"us
《 bilibili-起步级用户模块接口文档经验分享 ~》撒乎乎不撒大工程实时更新经验分享 springboot 后端前端
bilibili-用户模块接口文档-经验分享~数据库er关系图:迅速跳转链接枚举码实体类:迅速跳转链接使用apifox.json格式导入接口文档步骤登录Apifox。新建文件,将代码粘贴到该文件,并更改后缀为.apifox.json进入项目，点击“导入”。选择“Apifox”格式，导入文件。代码{"apifoxProject":"1.0.0","$schema":{"app":"apifox","
SpringBoot整合Hutool实现文件上传下载晚上睡不着！ #SpringBoot 笔记
前言我相信我们在日常开发中，难免会遇到对各种媒体文件的操作，由于业务需求的不同对文件操作的代码实现也大不相同数据库设计/*NavicatPremiumDataTransferSourceServer:MySQL5.5SourceServerType:MySQLSourceServerVersion:50554(5.5.54)SourceHost:localhost:3306SourceSchema
如何设计高效的数据湖架构？晴天彩虹雨架构大数据数据仓库
1.引言在大数据时代，数据湖（DataLake）逐渐成为企业存储和处理海量数据的重要基础设施。相比于传统数据仓库，数据湖能够支持结构化、半结构化和非结构化数据，同时提供更灵活的存储与计算能力。然而，如何合理设计数据湖架构，优化存储策略、Schema演进以及数据生命周期管理，是数据架构师必须深入思考的问题。本篇文章将深入探讨数据湖架构的设计方法，结合Hudi、Iceberg、DeltaLake等技术
SQL三级模式飘若随风数据库 sql oracle 数据库
文章目录三级模式的详细描述SQL如何支持三级模式1.支持内部模式2.支持概念模式3.支持外部模式示例总结问题讲解——SQL是如何支持三级模式的在数据库系统中，三级模式（Three-SchemaArchitecture）是由ANSI/SPARC数据库管理系统标准委员会在1970年代提出的一个框架，用来描述数据库系统的体系结构。它包含三个不同的层次：内部模式（InternalSchema）、概念模式（
hive 数字转换字符串_Hive架构及Hive SQL的执行流程解读 weixin_39756416 hive 数字转换字符串
1、Hive产生背景MapReduce编程的不便性HDFS上的文件缺少Schema(表名，名称，ID等，为数据库对象的集合)2、Hive是什么Hive的使用场景是什么？基于Hadoop做一些数据清洗啊(ETL)、报表啊、数据分析可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。Hive是SQL解析引擎，它将SQL语句转译成M/RJob然后在Hadoop执行。由Facebook开源，
Schema superXX07
1.最简单的Schema文档如何写一个最简单的XMLSchema文档呢？首先，我们写出一个最简单的XML文档。hello.xml-------------------HelloWorld!!hello.xsd－－－－－－－－－－XMLSchema文档后缀名是.xsd，完全符合XML语法，根元素是schema，命名空间xmlns:xsd="http://www.w3.org/2001/XMLSche
oracle pl/sql desc+表名无效sql的问题 dept123 Oracle
在pl/sql的sqlwindow里面写descschema.表名-->无效sql语句要换成commandwindow然后descshema.表名;
Java基础教程：dubbo源码解析-服务暴露与发现传智教育 dubbo java 分布式
概述dubbo是一个简单易用的RPC框架，通过简单的提供者，消费者配置就能完成无感的网络调用。那么在dubbo中是如何将提供者的服务暴露出去，消费者又是如何获取到提供者相关信息的呢？这就是本章我们要讨论的内容。dubbo与spring的整合在了解dubbo的服务注册和服务发现之前，我们首先需要掌握一个知识点：Spring中自定义Schema。Spring自定义SchemaDubbo现在的设计是完全
mysql导出表字段信息宜昌李国勇 SQL 前端 linux javascript
SELECTCOLUMN_NAMEAS'字段名',COLUMN_TYPEAS'数据类型',IS_NULLABLEAS'是否允许为空',COLUMN_DEFAULTAS'默认值',COLUMN_COMMENTAS'注释'FROMINFORMATION_SCHEMA.COLUMNSWHERETABLE_SCHEMA='kpl-hy-yz'--使用单引号包裹字符串值ANDTABLE_NAME='wms_
seacmsv9注入 2022计科一班唐文 oracle 数据库
一、当注入时，information_schema被禁用的解决方法information_schema数据库是MySQL和其他一些数据库系统中存储元数据的标准视图，包含表、列、权限等信息。攻击时可以直接查询这些信息来获取数据库结构，比如表名和列名。当information_schema被禁用时需要寻找其他途径来获取必要的信息。在information_schema数据库中储存了整个MySQL服务器
绕过information_schema库的一些方式夏炎正好眠 penetration 安全
information_schema库的意义：该数据库mysql其实是个信息数据库，保存着mysql服务器所维护的所有其他数据库信息，所以里面包含了数据库名，表名，字段名等，因此，information_schema的重要性就在这三点上了，而如果information_schema库被过滤掉了，就只能通过其他方式来处理了。绕过方式：1、使用盲注猜测信息：可以使用布尔盲注、时间盲注，对数据库信息进行
查数据库和表空间大小隔壁老登 sql代码数据库
查数据库和表空间大小一。postgresql数据库1.查看schema对应的表空间select*frompg_tables;2.查表空间使用情况SELECTschemaname,sum(pg_total_relation_size(schemaname||'.'||tablename))AStotal_sizeFROMpg_tableswhereschemaname='PROD'groupbysc
一文理清概念：数据中台(DMP)-数据仓库(DW)-数据湖(DL)-湖仓一体-数据治理(DG) Debug_Snail Hadoop Big Data Data Science 数据仓库大数据数据中台数据湖数据治理
数据仓库、数据中台、数据湖、湖仓一体是数据管理和分析领域的重要概念，它们在功能、架构和应用场景上各有特点，同时也在演进中相互关联和补充。以下是对它们的定义和关系的详细解析：1.核心概念（1）数据仓库（DataWarehouse,DW）定义：一种面向主题的、集成的、稳定的数据存储系统，用于支持企业决策分析（如BI、报表）。数据通常经过ETL（抽取、转换、加载）处理，以结构化形式存储，采用Schema
【护网行动】最新版护网知识总结，零基础入门到精通，收藏这篇就够了网络安全小宇哥 oracle 数据库安全 web安全计算机网络网络安全网络
一、基础知识1.SQL注入：一种攻击手段，通过在数据库查询中注入恶意SQL代码，获取、篡改或删除数据库数据。（1）危害：数据库增删改查、敏感数据窃取、提权/写入shell。（2）类型：按注入点（字符型、数字型、搜索型）、提交方式（get、post、cookie）、执行效果（联合、报错、布尔、时间）分类。（3）注入方式：包括information_schema注入、基于函数报错注入（如updatex
如何使用 XML Schema xyq2024 开发语言
如何使用XMLSchemaXMLSchema，也称为XSD（XMLSchemaDefinition），是一种用于定义XML文档结构和内容的语言。它提供了一种强大的方式来描述XML文档中允许的元素、属性和数据类型。使用XMLSchema，可以确保XML文档的格式正确，并且包含有效的数据。在本教程中，我们将介绍如何使用XMLSchema来定义和验证XML文档。1.XMLSchema简介XMLSchem
XML Schema weixin_43980049 Java初识 XML XML Schema
一、XMLSchema简介XMLSchema或XMLSchemaDefinition(XSD)可扩展标记语言架构:是以可扩展标记语言（标准通用标记语言的子集）为基础的，它用于可替代文档类型定义（外语缩写：XSD）；一份XMLschema文件描述了可扩展标记语言文档的结构。1.定义编辑它的作用是定义一份XML文档的合法组件群，就像文档类型定义（外语缩写：DTD）的作用一样,一份XMLSchema定义
Windows Terminal ssh到linux 驰驰的老爸 windows ssh linux
1.windowsstore安装WindowsTerminal2.打开json文件配置{"$help":"https://aka.ms/terminal-documentation","$schema":"https://aka.ms/terminal-profiles-schema","actions":[{"command":{"action":"copy","singleLine":fals
第六课：数据库集成：MongoDB与Mongoose技术应用 deming_su Nodejs 数据库 mongodb node.js html javascript
本文详细介绍了如何在Node.js应用程序中集成MongoDB数据库，并使用Mongoose库进行数据操作。我们将涵盖MongoDB在Ubuntu20系统中的安装、Bash命令的CRUD操作、Mongoose数据建模（Schema/Model）、关联查询与聚合管道，以及实战案例——用户注册系统的开发。通过本文，你将掌握Node.js与MongoDB集成的完整流程。1.MongoDB在Ubuntu2
湖仓一体化及冷、热、实时三级存储麦当当MDD 数据仓库 Spark 大数据数据库数据仓库数据库架构
一、湖仓一体化（Lakehouse）湖仓一体化（Lakehouse）是数据湖（DataLake）与数据仓库（DataWarehouse）的结合，旨在解决传统数据架构中数据孤岛、存储冗余、计算性能不足等问题。其核心思想是兼顾数据湖的存储灵活性和数据仓库的管理与计算能力，使得结构化、半结构化、非结构化数据能够在同一存储系统中高效管理和分析。二、为什么需要湖仓一体？数据湖的缺陷：缺乏强Schema，查询
OceanBase数据库常用巡检SQL 数据库sqloceanbase
本文为墨天轮数据库管理服务团队原创内容，如需转载请联系小墨（VX：modb666）并注明来源。一、版本信息select*frominformation_schema.GLOBAL_VARIABLESWHEREVARIABLE_NAMElike'version%';二、集群状态select*fromoceanbase.v$ob_cluster;三、服务器状态检查所有服务器的状态，包括这个Server
多租户适配、多租户隔离 Java掌门人技术资料公有云多租户 java websocket 混合云
多租户适配很多产品只有专属化版本，需要从产品底层进行尽量少的改造，满足上云之后多租户的数据、缓存、定时任务等隔离多租户适配条目条目名称适配方案持久层适配支持schema和字段隔离两种方案quartz定时任务上下文无法获取租户信息，通过JobGroup识别reids缓存缓存key体现租户id即可websocket场景从cookie获取、前端调用diwork的api获取租户信息塞到cookie，后端w
SQL注入绕information_schema防护的方法智商不在服务器渗透攻击网络安全 sql
1.利用其他系统表不同的DBMS提供了其他系统表，可以用来查询数据库结构。MySQL中的其他系统表1.利用mysql5.7新增的sys.schema_auto_increment_columns这是sys数据库下的一个视图，基础数据来自与information_schema,他的作用是对表的自增ID进行监控，也就是说，如果某张表存在自增ID，就可以通过该视图来获取其表名和所在数据库名以下为该表2.
PySpark实现获取S3上Parquet文件的数据结构，并自动在Snowflake里建表和生成对应的建表和导入数据的SQL weixin_30777913 python aws sql spark
PySpark实现S3上解析存储Parquet文件的多个路径，获取其中的数据Schema，再根据这些Schema，参考以下文本，得到创建S3路径Stage的SQL语句和上传数据到Snowflake数据库的SQL语句，同样的Stage路径只需创建一个Stage对象即可，并在S3上保存为SQL，并在Snowflake里创建对应的表，并在S3上存储创建表的SQL语句。要将存储在S3上的Parquet文件
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1