我一直在流浪

ElasticSearch系列 - SpringBoot整合ES：ElasticSearch分析器

文章目录

- - - 01. ElasticSearch 分析器
    - - 1. ElasticSearch match 文本搜索的过程？
      - 2. ElasticSearch 分析器是什么？
      - 3. ElasticSearch 分析器的功能？
    - 02. ElasticSearch 字符过滤器
    - - 4. ElasticSearch 字符过滤器是什么？
      - 5. ElasticSearch 内置的字符过滤器有哪些？
      - 6. ElasticSearch 字符过滤器如何使用？
    - 03. ElasticSearch 分词器
    - - 7. ElasticSearch 分词器是什么？
      - 8. ElasticSearch 内置的分词器有哪些？
      - 9. ElasticSearch 分词器如何使用？
    - 04. ElasticSearch 分词过滤器
    - - 10. ElasticSearch 分词过滤器是什么？
      - 11. ElasticSearch 内置的分词过滤器有哪些？
      - 12. ElasticSearch 分词过滤器如何使用？
    - 05. ElasticSearch 分析器的使用
    - - 13. ElasticSearch 分析器 API 的使用
      - 14. ElasticSearch 内置分析器
      - 15. ElasticSearch 索引时使用分析器
      - 16. ElasticSearch 搜索时使用分析器
      - 17. ElasticSearch 自定义分词器
    - 06. ElasticSearch 中文分词器
    - - 18. ElasticSearch ik分析器
      - 19. ElasticSearch 分析器 ik_smart 和 ik_max_word
      - 20. ElasticSearch ik分析器的使用
    - 07. ElasticSearch 使用同义词
    - - 21. ElasticSearch 建立索引时使用同义词
      - 22. ElasticSearch 查询时使用同义词
    - 08. ElasticSearch 使用停用词
    - - 23. ElasticSearch 自定义分析器使用停用词
      - 24. 在内置分析器中使用停用词
    - 09. ElasticSearch 高亮显示搜索
    - - 25. ElasticSearch 高亮显示搜索基本使用
      - 26. SpringBoot整合ES实现高亮显示
    - 10. ElasticSearch 拼写纠错

01. ElasticSearch 分析器

1. ElasticSearch match 文本搜索的过程？

Elasticsearch 的 match 查询是一种基于文本匹配的查询方式，它的搜索过程如下：

① 将查询字符串分词：Elasticsearch 会将查询字符串分成一个个词项（term），并去除停用词（如“的”、“是”等常用词汇）和标点符号等无意义的字符。

② 构建倒排索引：Elasticsearch 会将每个词项与它所在的文档建立倒排索引（inverted index），即记录每个词项出现的文档编号和出现次数。

③ 计算文档得分：当执行 match 查询时，Elasticsearch 会根据查询字符串中的词项在倒排索引中查找对应的文档，并计算每个文档的得分。得分的计算方式包括词频（term frequency）、逆文档频率（inverse document frequency）和字段长度等因素。

④ 返回结果：Elasticsearch 会按照得分从高到低的顺序返回匹配的文档，同时可以根据需要进行分页、排序、过滤等操作。

总的来说，Elasticsearch 的 match 查询是一种基于倒排索引的文本匹配方式，它可以高效地处理大规模的文本数据，并返回与查询字符串相关的文档。

如下为文本搜索的过程：

ES 分析器先将查询词切分为“金都”和“怡家”，然后分别到倒排索引里查找两个词对应的文档列表并获得了文档1、2、3，然后根据相关性算法计算文档得分并进行排序，最后将文档集合返回给客户端。

2. ElasticSearch 分析器是什么？

ElasticSearch 是一个基于 Lucene 的分布式搜索引擎，它提供了丰富的分析器来处理文本数据。分析器是将文本数据转换为可索引的单词的过程，一般用在下面两个场景中：

① 创建或更新文档时，对相应的文本字段进行分词处理；

② 查询文本字段时，对查询语句进行分词。

ES中的分析器有很多种，但是所有分析器的结构都遵循三段式原则，即字符过滤器、分词器和词语过滤器。其中，字符过滤器可以有0个或多个，分词器必须只有一个，词语过滤器可以有0个或多个。从整体上来讲，三个部分的数据流方向为字符过滤器→分词器→分词过滤器。

① 字符过滤器：用于对原始文本进行预处理，例如去除 HTML 标签、转换大小写等。

② 分词器：将文本数据分割成单词，例如将一段中文文本分割成单个汉字或者按照空格、标点符号等进行分割。

③ 词语过滤器：对分词器产生的单词进行进一步处理，例如去除停用词、同义词转换、词干提取等。

ElasticSearch 提供了多种内置的分析器，例如 Standard Analyzer、Simple Analyzer、Whitespace Analyzer、Keyword Analyzer 等。此外，ElasticSearch 还支持自定义分析器，用户可以根据自己的需求定义自己的分析器。

3. ElasticSearch 分析器的功能？

Elasticsearch 分析器是用于将文本数据分解为单个词汇单元的组件。它们是搜索引擎中的重要组成部分，因为它们允许搜索引擎在索引和搜索文本数据时进行正确的匹配。以下是 ElasticSearch 分析器的一些常见功能：

① 分词：将文本数据分解为单个词汇单元，例如将句子分解为单个单词。

② 去除停用词：去除常见的无意义词汇，例如“a”、“an”、“the”等。

③ 小写化：将所有文本转换为小写，以便在搜索时不区分大小写。

④ 同义词扩展：将搜索词扩展为其同义词，以便在搜索时能够匹配更多的文本数据。

⑤ 词干提取：将单词转换为其基本形式，例如将“running”转换为“run”。

⑥ 字符过滤：去除文本中的特定字符，例如标点符号或 HTML 标签。

⑦ 自定义规则：允许用户定义自己的规则，以便在分析器中执行特定的操作。

这些功能可以根据需要进行组合和配置，以便在搜索引擎中实现最佳的文本匹配和搜索结果。

02. ElasticSearch 字符过滤器

4. ElasticSearch 字符过滤器是什么？

Elasticsearch 字符过滤器是一种用于处理文本的插件，它可以在文本被分词之前对其进行预处理。字符过滤器可以用于去除 HTML 标签、转换字符大小写、删除特定字符或字符序列、替换字符等操作。在处理文本之前，字符过滤器可以对文本进行清理和标准化，以便更好地进行搜索和分析。Elasticsearch 提供了许多内置的字符过滤器，同时也支持自定义字符过滤器。

5. ElasticSearch 内置的字符过滤器有哪些？

ElasticSearch 内置了许多字符过滤器，可以用于在索引和搜索期间对文本进行预处理。以下是一些常见的字符过滤器：

① html_strip：从文本中删除 HTML 标记。
② pattern_replace：使用正则表达式替换文本中的模式。
③ lowercase：将文本转换为小写。
④ uppercase：将文本转换为大写。
⑤ ascii_folding：将文本中的非 ASCII 字符转换为 ASCII 字符。
⑥ mapping：使用映射表替换文本中的字符。
⑦ trim：删除文本开头和结尾的空格。
⑧ length：删除文本中长度小于或大于指定值的单词。

6. ElasticSearch 字符过滤器如何使用？

① 自定义一个字符过滤器

② 自定义一个分析器，并使用自定义字符过滤器

③ 对索引的字段使用自定义分析器

PUT /my_index
{
  "settings": {
    "analysis": {
      // 自定义一个过滤器：用于将文本中的“&”字符替换为“and”  
      "char_filter": {
        "my_char_filter": {
          "type": "mapping",
          "mappings": ["& => and"]
        }
      }, 
      // 自定义一个分析器：在分析器中使用字符过滤器
      "analyzer": {
         "my_analyzer": {
           // 使用 "standard" 分词器将文本分成单词
          "tokenizer": "standard",
           // 使用 "my_char_filter" 字符过滤器对文本进行预处理 
          "char_filter": ["my_char_filter"]
        }
      }
    }
  },
  "mappings": {
    "properties": {
      // 对 my_field 字段使用 my_analyzer 分析器
      "my_field": {
        "type": "text",
        "analyzer": "my_analyzer"
      }
    }
  }
}

④ 索引文本，索引一个包含“AT&T”文本的文档：

PUT /my_index/_doc/1
{
  "my_field": "AT & T"
}

⑤ 搜索包含“AT and T”文本的文档：

GET /my_index/_search
{
  "query": {
    "match": {
      "my_field": "AT and T"
    }
  }
}

{
  "took" : 8,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 0.8630463,
    "hits" : [
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.8630463,
        "_source" : {
          "my_field" : "AT & T"
        }
      }
    ]
  }
}

03. ElasticSearch 分词器

7. ElasticSearch 分词器是什么？

Elasticsearch 分词器是用于将文本分解为单词（或词条）。在 Elasticsearch 中，文本被视为一个或多个单词的集合，这些单词被称为词条。分词器将文本分解为词条，并将这些词条存储在倒排索引中，以便能够快速地搜索和检索文档。

8. ElasticSearch 内置的分词器有哪些？

ElasticSearch 内置的分词器包括：

① Standard Analyzer：标准分析器，适用于大多数语言，按照空格和标点符号进行分词。

② Simple Analyzer：简单分析器，按照非字母字符进行分词。

③ Whitespace Analyzer：空格分析器，按照空格进行分词。

④ Stop Analyzer：停用词分析器，去除常见的停用词，如“的”、“是”、“在”等。

⑤ Keyword Analyzer：关键词分析器，不进行分词，直接将输入作为一个整体进行索引。

⑥ Pattern Analyzer：模式分析器，按照正则表达式进行分词。

⑦ Language Analyzers：语言分析器，针对不同的语言提供了特定的分析器，如中文分析器、日文分析器等。

除了以上内置的分词器，ElasticSearch 还支持自定义分词器，可以根据具体需求进行定制。

9. ElasticSearch 分词器如何使用？

ElasticSearch 分词器是用于将文本分解为单词或词汇单元的工具。在 ElasticSearch 中，分词器是用于索引和搜索文本的关键组件之一。以下是使用 ElasticSearch 分词器的一些步骤：

① 创建索引：在 ElasticSearch 中，首先需要创建一个索引，以便可以将文档添加到其中。

② 定义分词器：在创建索引时，需要定义一个分词器。ElasticSearch 提供了多种不同类型的分词器，例如标准分词器、简单分词器、语言分词器等。如下，创建了一个名为 my_index 的索引，并定义了一个名为 my_analyzer 的分词器。然后，我们将 my_field 字段定义为 text 类型，并将其分析器设置为 my_analyzer。

PUT /my_index
{
  "settings": {
    "analysis": {
      "analyzer": {
        "my_analyzer":{
          "type": "standard"
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "my_field":{
        "type": "text",
        "analyzer": "my_analyzer"
      }
    }
  }
}

③ 添加文档：在索引中添加文档时，ElasticSearch 将使用指定的分词器将文本分解为单词或词汇单元，并将其存储在索引中。

POST /my_index/_doc/1
{
  "my_field": "这是一个示例文本"
}

④ 搜索文档：当搜索文档时，ElasticSearch 将使用相同的分词器将搜索查询分解为单词或词汇单元，并在索引中查找匹配的文档。

GET /my_index/_search
{
  "query": {
    "match": {
      "my_field": "示例"
    }
  }
}

{
  "took" : 376,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 0.5753642,
    "hits" : [
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.5753642,
        "_source" : {
          "my_field" : "这是一个示例文本"
        }
      }
    ]
  }
}

04. ElasticSearch 分词过滤器

10. ElasticSearch 分词过滤器是什么？

分词过滤器接收分词器的处理结果，并可以将切分好的词语进行加工和修改，进而对分词结果进行规范化、统一化和优化处理。例如，它可以将文本中的字母全部转换为小写形式，还可以删除停用词（如的、这、那等），还可以为某个分词增加同义词。ElasticSearch 提供了许多内置的分词过滤器，同时也支持自定义分词过滤器。

11. ElasticSearch 内置的分词过滤器有哪些？

Elasticsearch 内置的分词过滤器有很多，以下是一些常用的分词过滤器：

① Lowercase Token Filter：将所有的单词转换为小写形式。
② Stop Token Filter：去除常见的停用词，如“a”、“an”、“the”等。
③ Stemmer Token Filter：将单词还原为其词干形式，如“running”还原为“run”。
④ Synonym Token Filter：将指定的同义词替换为原始词汇，如“car”和“automobile”。
⑤ Word Delimiter Token Filter：将单词拆分为子单词，如“WiFi”拆分为“Wi”和“Fi”。
⑥ Edge N-gram Token Filter：生成指定长度的前缀或后缀 n-gram，如“quick”生成“q”、“qu”、“qui”、“quic”、“quick”。
⑦ Length Token Filter：过滤掉长度不在指定范围内的单词。

以上仅是一些常用的分词过滤器，Elasticsearch 还提供了很多其他的分词过滤器，可以根据具体需求进行选择和配置。

12. ElasticSearch 分词过滤器如何使用？

ElasticSearch 分词过滤器是用于对文本进行分词和过滤的工具。它可以将文本分解成单词，并根据指定的规则进行过滤和转换。以下是 ElasticSearch 分词过滤器的使用方法：

① 在创建索引时指定分词器和过滤器：创建一个名为 my_index 的索引，并指定了一个名为 my_analyzer 的标准分词器，并使用了一个名为 _english_ 的停用词过滤器。我们还将 my_field 字段的分析器设置为 my_analyzer。

PUT /my_index
{
  "settings": {
    "analysis": {
      "analyzer": {
        "my_analyzer": {
          "type": "standard",
          "stopwords": "_english_"
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "my_field": {
        "type": "text",
        "analyzer": "my_analyzer"
      }
    }
  }
}

② 索引文档：

PUT /my_index/_doc/1
{
  "my_field":"这是一个文本示例"
}

③ 使用分词器和过滤器进行搜索：

GET /my_index/_search
{
  "query": {
    "match": {
      "my_field":{
        "query":  "文本示例",
        "analyzer": "my_analyzer"
      }
    }
  }
}

{
  "took" : 545,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 0.72928625,
    "hits" : [
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.72928625,
        "_source" : {
          "my_field" : "这是一个文本示例"
        }
      }
    ]
  }
}

05. ElasticSearch 分析器的使用

13. ElasticSearch 分析器 API 的使用

① DSL中可以直接使用参数analyzer来指定分析器的名称进行测试，分析API的请求形式如下：

POST /_analyze 
{ 
  "analyzer": "standard",     //指定分析器名称为standard 
  "text": "The letter tokenizer is not configurable."  //待分析文本 
}

standard分析器对文本进行分析时，按照空格把上面的句子进行了分词。分析API返回信息的参数说明如下：

token：文本被切分为词语后的某个词语；
start_offset：该词在文本中的起始偏移位置；
end_offset：该词在文本中的结束偏移位置；
type：词性，各个分词器的值不一样；
position：分词位置，指明该词语在原文本中是第几个出现的。
start_offset和end_offset组合起来就是该词在原文本中占据的起始位置和结束位置。

{ 
 "tokens" : [                   //分析器将文本切分后的分析结果 
    { 
      "token" : "the",          //将文本切分后的第一个词语 
      "start_offset" : 0,       //该词在文本中的起始偏移位置 
      "end_offset" : 3,         //该词在文本中的结束偏移位置 
      "type" : "",    //词性 
      "position" : 0            //该词语在原文本中是第0个出现的词语 
    }, 
    { 
      "token" : "letter", 
      "start_offset" : 4, 
      "end_offset" : 10, 
      "type" : "", 
      "position" : 1 
    }, 
    {
      "token" : "tokenizer",
      "start_offset" : 11,
      "end_offset" : 20,
      "type" : "",
      "position" : 2
    },
    {
      "token" : "is",
      "start_offset" : 21,
      "end_offset" : 23,
      "type" : "",
      "position" : 3
    },
    {
      "token" : "not",
      "start_offset" : 24,
      "end_offset" : 27,
      "type" : "",
      "position" : 4
    },
    {
      "token" : "configurable",
      "start_offset" : 28,
      "end_offset" : 40,
      "type" : "",
      "position" : 5
    }
  ]
}

② 除了指定分析器进行请求分析外，用户还可以指定某个索引的字段，使用这个字段对应的分析器对目标文本进行分析。下面使用酒店索引的title字段对应的分析器分析文本。

POST /hotel/_analyze 
{                               //使用酒店索引的title字段对应的分析器分析文本 
  "field": "title", 
  "text": "金都嘉怡假日酒店" 
}

③ 在下面的示例中自定义了一个分析器，该分析器的分词器使用standard，分词过滤器使用Lower Case，其将分词后的结果转换为小写形式。

GET _analyze 
{ 
  "tokenizer": "standard",                   //使用standard分词器 
  "filter":["lowercase"],                    //使用Lower Case分词过滤器 
  "text": "JinDu JiaYi Holiday Hotel"       //待分析文本 
}

{
  "tokens" : [
    {
      "token" : "jindu",
      "start_offset" : 0,
      "end_offset" : 5,
      "type" : "",
      "position" : 0
    },
    {
      "token" : "jiayi",
      "start_offset" : 6,
      "end_offset" : 11,
      "type" : "",
      "position" : 1
    },
    {
      "token" : "holiday",
      "start_offset" : 12,
      "end_offset" : 19,
      "type" : "",
      "position" : 2
    },
    {
      "token" : "hotel",
      "start_offset" : 20,
      "end_offset" : 25,
      "type" : "",
      "position" : 3
    }
  ]
}

14. ElasticSearch 内置分析器

ES已经内置了一些分析器供用户使用，在默认情况下，一个索引的字段类型为text时，该字段在索引建立时和查询时的分析器是standard。standard分析器是由standard分词器、Lower Case分词过滤器和Stop Token分词过滤器构成的。注意，standard分析器没有字符过滤器。 ElasticSearch 内置了许多分析器，可以用于处理文本数据。以下是一些常见的 ElasticSearch 内置分析器：

① Standard Analyzer：标准分析器是默认的分析器，它将文本分成单个单词，并删除停用词和标点符号。

② Simple Analyzer：简单分析器将文本分成单个单词，但不删除停用词和标点符号。

③ Whitespace Analyzer：空格分析器将文本分成单个单词，但不删除任何字符。

④ Keyword Analyzer：关键字分析器将整个文本作为单个单词处理，不进行任何分词或标记化。

⑤ Stop Analyzer：停用词分析器删除常见的停用词，例如“a”和“the”。

⑥ Pattern Analyzer：模式分析器使用正则表达式将文本分成单个单词。

⑦ Language Analyzers：ElasticSearch 还提供了多种语言分析器，例如英语、法语、德语、西班牙语等，这些分析器可以处理特定语言的文本数据。

以上是一些常见的 ElasticSearch 内置分析器，可以根据需要选择适合的分析器来处理文本数据。

15. ElasticSearch 索引时使用分析器

文本字段在索引时需要使用分析器进行分析，ES默认使用的是standard分析器。如果需要指定分析器，一种方式是在索引的settings参数中设置当前索引的所有文本字段的分析器，另一种方式是在索引的mappings参数中设置当前字段的分析器。

① 在settings参数中指定在酒店索引的所有文本字段中使用simple分析器进行索引构建。

PUT /hotel
{
  "settings": {
    "analysis": {
      "analyzer": {
        "default":{
          "type": "simple" 
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "title":{
        "type": "text"
      },
      "content":{
        "type": "text"
      }
    }
  }
}

② 在mappings参数中指定在酒店索引的 title 字段中使用 whitespace 分析器进行索引构建：

PUT /hotel 
{ 
  "mappings": { 
    "properties": { 
      "title": { 
        "type": "text", 
        "analyzer": "whitespace"  
      }, 
      "content":{
        "type": "text"
      }
    } 
  } 
}

16. ElasticSearch 搜索时使用分析器

为了搜索时更加协调，在默认情况下，ES对文本进行搜索时使用的分析器和索引时使用的分析器保持一致。当然，用户也可以在mappings参数中指定字段在搜索时使用的分析器。

PUT /hotel 
{ 
  "mappings": { 
    "properties": { 
      "title": { 
        "type": "text", 
        "analyzer": "whitespace",            //索引时使用whitespace分析器 
        "search_analyzer": "whitespace"      //搜索时使用whitespace分析器 
      }, 
    } 
  } 
}

注意，这里指定的搜索分析器和索引时的分析器是一致的，但是在大多数情况下是没有必要指定的，因为在默认情况下二者就是一致的。如果指定的搜索分析器和索引时的分析器不一致，则ES在搜索时可能出现有不符合预期的匹配情况，因此该设置在使用时需要慎重选择。

17. ElasticSearch 自定义分词器

当系统内置的分析器不满足需求时，用户可以使用自定义分析器。在有些场景中，某个文本字段不是自然语言而是在某种规则下的编码。

① 创建索引时使用自定义分词器

在settings部分中，定义了一个名为“comma_analyzer”的分析器，它使用名为“comma_tokenizer”的分词器。该分词器使用逗号作为分隔符，将文本分成多个词条。这个分析器可以用于分析“title”字段中的文本。

在mappings部分中，title属性是一个文本类型，但使用了之前定义的“comma_analyzer”分析器进行分析。这意味着文本将按照逗号进行分词

PUT /hotel 
{ 
  "settings": { 
    "analysis": { 
      "analyzer": { 
        "comma_analyzer": {                    
          "tokenizer": "comma_tokenizer"      
        } 
      }, 
      "tokenizer": {          
        "comma_tokenizer": { 
          "type": "pattern", 
          "pattern": ","      
        } 
      } 
    } 
  }, 
  "mappings": { 
    "properties": { 
      "title": { 
        "type": "text", 
        "analyzer": "comma_analyzer"      
      }
    } 
  } 
}

② 下面向酒店索引中插入几条数据：

POST /_bulk 
{"index":{"_index":"hotel","_id":"001"}} 
{"title":"APP,H5"} 
{"index":{"_index":"hotel","_id":"002"}} 
{"title":"H5,WX"} 
{"index":{"_index":"hotel","_id":"003"}} 
{"title":"WX"}

③ 当前用户的客户端为H5或App，当搜索“金都”关键词时应该构建的DSL如下：

GET /hotel/_search 
{ 
  "query": {
    "match": {
      "title": "APP,H5"
    }
  } 
}

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 1.3411059,
    "hits" : [
      {
        "_index" : "hotel",
        "_type" : "_doc",
        "_id" : "001",
        "_score" : 1.3411059,
        "_source" : {
          "title" : "APP,H5"
        }
      },
      {
        "_index" : "hotel",
        "_type" : "_doc",
        "_id" : "002",
        "_score" : 0.43445712,
        "_source" : {
          "title" : "H5,WX"
        }
      }
    ]
  }
}

06. ElasticSearch 中文分词器

比较常用的第三方中文分析器是HanLP和IK分析器。

18. ElasticSearch ik分析器

Elasticsearch Ik分词器是一种基于Java开发的中文分词器，它是Elasticsearch官方推荐的中文分词器之一。Ik分词器支持细粒度和智能分词两种分词模式，可以根据不同的需求进行选择。细粒度模式适用于搜索引擎等需要精确匹配的场景，而智能模式则适用于一般的文本分析场景。

Ik分词器还支持自定义词典，可以通过添加自定义词典来提高分词的准确性。同时，Ik分词器还支持多种分词器插件，如拼音分词器、同义词分词器等，可以根据具体需求进行选择和配置。

总的来说，Elasticsearch Ik分词器是一种功能强大、灵活性高的中文分词器，可以满足各种中文文本分析的需求。

19. ElasticSearch 分析器 ik_smart 和 ik_max_word

IK分析器提供了两个子分析器，即 ik_smart 和 ik_max_word，另外它还提供了两个和分析器同名的子分词器。

下例使用ik_max_word分析器对待测试文本进行分析：

POST _analyze 
{ 
  "analyzer": "ik_max_word",           
  "text": "金都嘉怡假日酒店" 
}

{
  "tokens" : [
    {
      "token" : "金都",
      "start_offset" : 0,
      "end_offset" : 2,
      "type" : "CN_WORD",
      "position" : 0
    },
    {
      "token" : "嘉",
      "start_offset" : 2,
      "end_offset" : 3,
      "type" : "CN_CHAR",
      "position" : 1
    },
    {
      "token" : "怡",
      "start_offset" : 3,
      "end_offset" : 4,
      "type" : "CN_CHAR",
      "position" : 2
    },
    {
      "token" : "假日酒店",
      "start_offset" : 4,
      "end_offset" : 8,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "假日",
      "start_offset" : 4,
      "end_offset" : 6,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "酒店",
      "start_offset" : 6,
      "end_offset" : 8,
      "type" : "CN_WORD",
      "position" : 5
    }
  ]
}

下例使用ik_smart分析器对待测试文本进行分析：

POST _analyze 
{ 
  "analyzer": "ik_smart",       
  "text": "金都嘉怡假日酒店" 
}

{
  "tokens" : [
    {
      "token" : "金都",
      "start_offset" : 0,
      "end_offset" : 2,
      "type" : "CN_WORD",
      "position" : 0
    },
    {
      "token" : "嘉",
      "start_offset" : 2,
      "end_offset" : 3,
      "type" : "CN_CHAR",
      "position" : 1
    },
    {
      "token" : "怡",
      "start_offset" : 3,
      "end_offset" : 4,
      "type" : "CN_CHAR",
      "position" : 2
    },
    {
      "token" : "假日酒店",
      "start_offset" : 4,
      "end_offset" : 8,
      "type" : "CN_WORD",
      "position" : 3
    }
  ]
}

从上述两个分析结果中可以看到，ik_max_word和ik_smart分析器的主要区别在于切分词语的粒度上，ik_smart的切分粒度比较粗，而ik_max_word将文本进行了最细粒度的拆分，甚至穷尽了各种可能的组合。

20. ElasticSearch ik分析器的使用

① 创建索引时指定使用IK分词器：

PUT /my_index
{
  "settings": {
    "analysis": {
      "analyzer": {
        "ik_analyzer": {
          "tokenizer": "ik_max_word"
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "content": {
        "type": "text",
        "analyzer": "ik_analyzer"
      }
    }
  }
}

② 索引文档：

PUT /my_index/_doc/1
{
  "content":"中国人民"
}

PUT /my_index/_doc/2
{
  "content":"中国银行"
}

③ 查询时使用IK分词器：

GET /my_index/_search
{
  "query": {
    "match": {
      "content": {
        "query": "中国人民银行",
        "analyzer": "ik_max_word"
      }
    }
  }
}

{
  "took" : 10,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 2.6807432,
    "hits" : [
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 2.6807432,
        "_source" : {
          "content" : "中国人民"
        }
      },
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 0.9752057,
        "_source" : {
          "content" : "中国银行"
        }
      }
    ]
  }
}

07. ElasticSearch 使用同义词

在搜索场景中，同义词用来处理不同的查询词，有可能是表达相同搜索目标的场景。例如，当用户的查询词为“带浴缸的酒店”和“带浴池的酒店”时，其实是想搜索有单独泡澡设施的酒店。再例如，在电商搜索中，同义词更是应用广泛，如品牌同义词Adidas和“阿迪达斯”，产品同义词“投影仪”和“投影机”，修饰同义词“大码”和“大号”等。用户在使用这些与同义词相关的关键词进行搜索时，搜索引擎返回的搜索结果应该是一致的。

用户还可以通过ES中的分析器来使用同义词，使用方式分为两种，一种是在建立索引时指定同义词并构建同义词的倒排索引，另一种是在搜索时指定字段的search_analyzer查询分析器使用同义词。

21. ElasticSearch 建立索引时使用同义词

在ES内置的分词过滤器中，有一种分词过滤器叫作synonyms，它是一种支持用户自定义同义词的分词过滤器。

① 建立索引时使用同义词分析器：

"settings"字段：该字段用于设置索引的分析器，其中包含了一个名为"ik_synonyms_filter"的同义词过滤器，用于将一些同义词进行转换。例如，"北京"和"首都"是同义词，"天津"和"天津卫"是同义词，"假日"和"度假"是同义词。

“mappings"字段：该字段用于定义索引中的文档类型及其属性。在这个例子中，只定义了一个"title"属性，它的类型是"text”，使用了名为"ik_analyzer_synonyms"的分析器。这个分析器使用了"ik_max_word"分词器，将文本进行分词，并使用"lowercase"过滤器将所有单词转换为小写字母，然后使用"ik_synonyms_filter"过滤器将同义词进行转换。

PUT /hotel 
{ 
  "settings": { 
    "analysis": { 
     "filter": {                       //定义分词过滤器 
        "ik_synonyms_filter": {  
          "type": "synonym", 
          "synonyms": [                //在分词过滤器中定义近义词 
            "北京,首都", 
            "天津,天津卫", 
            "假日,度假" 
          ] 
        } 
      }, 
     "analyzer": {                      //自定义分析器 
        "ik_analyzer_synonyms": { 
          "tokenizer": "ik_max_word",   //指定分词器 
          "filter": [                   //指定分词过滤器 
            "lowercase", 
            "ik_synonyms_filter" 
          ] 
        } 
      } 
       
    } 
  }, 
  "mappings": { 
    "properties": { 
      "title": { 
        "type": "text", 
        "analyzer": "ik_analyzer_synonyms"  //指定索引时使用自定义的分析器 
      }
    } 
  } 
}

② 索引文档：

POST /_bulk 
{"index":{"_index":"hotel","_id":"001"}} 
{"title": "文雅假日酒店"} 
{"index":{"_index":"hotel","_id":"002"}} 
{"title": "北京金都嘉酒店"} 
{"index":{"_index":"hotel","_id":"003"}} 
{"title": "天津金都欣欣酒店"} 
{"index":{"_index":"hotel","_id":"004"}} 
{"title": "金都酒店"} 
{"index":{"_index":"hotel","_id":"005"}} 
{"title": "文雅精选酒店"}

③ 搜索文档：

GET /hotel/_search 
{ 
 "query": {                          
    "match": { 
      "title": "首都度假" 
    } 
  } 
}

{
  "took" : 415,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 1.9320302,
    "hits" : [
      {
        "_index" : "hotel",
        "_type" : "_doc",
        "_id" : "001",
        "_score" : 1.9320302,
        "_source" : {
          "title" : "文雅假日酒店"
        }
      },
      {
        "_index" : "hotel",
        "_type" : "_doc",
        "_id" : "002",
        "_score" : 1.9320302,
        "_source" : {
          "title" : "北京金都嘉酒店"
        }
      }
    ]
  }
}

由上面的结果可见，酒店标题中的“北京”和“假日”分别可以匹配查询词中的“首都”和“度假”，说明前面的同义词设置成功。

22. ElasticSearch 查询时使用同义词

在ES内置的分词过滤器中还有个分词过滤器叫作synonym_graph，它是一种支持查询时用户自定义同义词的分词过滤器。

① 建立索引时使用同义词分析器：

PUT /hotel 
{ 
  "settings": { 
    "analysis": { 
     "filter": {                          //定义分词过滤器 
        "ik_synonyms_graph_filter": { 
          "type": "synonym_graph", 
          "synonyms": [                   //在分词过滤器中定义近义词 
            "北京,首都", 
            "天津,天津卫", 
            "假日,度假" 
          ] 
        } 
      }, 
      "analyzer": {                       //自定义分析器 
        "ik_analyzer_synonyms_graph": { 
          "tokenizer": "ik_max_word",     //指定分词器 
          "filter": [      				  //指定分词过滤器 
            "lowercase", 
            "ik_synonyms_graph_filter" 
          ] 
        } 
      } 
       
    } 
  }, 
  "mappings": { 
    "properties": { 
      "title": { 
        "type": "text", 
        "analyzer": "ik_max_word", 
        "search_analyzer": "ik_analyzer_synonyms_graph"  //指定查询时使用自定义的分析器 
      }
    } 
  } 
}

② 索引文档：

POST /_bulk 
{"index":{"_index":"hotel","_id":"001"}} 
{"title": "文雅假日酒店"} 
{"index":{"_index":"hotel","_id":"002"}} 
{"title": "北京金都嘉酒店"} 
{"index":{"_index":"hotel","_id":"003"}} 
{"title": "天津金都欣欣酒店"} 
{"index":{"_index":"hotel","_id":"004"}} 
{"title": "金都酒店"} 
{"index":{"_index":"hotel","_id":"005"}} 
{"title": "文雅精选酒店"}

③ 检索文档：

GET /hotel/_search 
{ 
 "query": {                          
    "match": { 
      "title": "首都度假" 
    } 
  } 
}

{
  "took" : 29,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 1.2929529,
    "hits" : [
      {
        "_index" : "hotel",
        "_type" : "_doc",
        "_id" : "001",
        "_score" : 1.2929529,
        "_source" : {
          "title" : "文雅假日酒店"
        }
      },
      {
        "_index" : "hotel",
        "_type" : "_doc",
        "_id" : "002",
        "_score" : 1.2929529,
        "_source" : {
          "title" : "北京金都嘉酒店"
        }
      }
    ]
  }
}

08. ElasticSearch 使用停用词

23. ElasticSearch 自定义分析器使用停用词

Elasticsearch 支持使用停用词来提高搜索的准确性和效率。停用词是指在搜索中被忽略的常见词语，例如“的”、“是”、“在”等。这些词语在搜索中出现的频率很高，但它们并没有提供有用的信息，因此可以被忽略。

在 Elasticsearch 中，可以使用停用词过滤器来过滤掉停用词。停用词过滤器可以在索引和搜索时使用。在索引时，可以在分析器中配置停用词过滤器，以便在索引文档时过滤掉停用词。在搜索时，可以在查询中使用停用词过滤器，以便在搜索时过滤掉停用词。

① 可以通过创建自定义分析器的方式使用停用词，方法是在分析器中指定停用词过滤器，在过滤器中可以指定若干个停用词。下面使用standard分词器和停用词过滤器组成一个自定义分析器进行索引定义DSL如下：

PUT /my_index
{
  "settings": {
    "analysis": {
      "filter": {
        "my_top_filter":{
          "type":"stop",
          "stopwords":["我","的","这"]
        }
      },
      "analyzer": {
        "standard_stop":{
          "tokenizer": "standard", 
          "filter":["my_top_filter"] 
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "title":{
        "type": "text",
        "analyzer": "standard_stop"
      }
    }
  }
}

② 使用上述分析器进行文本分析，DSL如下：

POST /my_index/_analyze 
{                                  
  "field": "title", 
  "text": "我的酒店" 
}

{
  "tokens" : [
    {
      "token" : "酒",
      "start_offset" : 2,
      "end_offset" : 3,
      "type" : "",
      "position" : 2
    },
    {
      "token" : "店",
      "start_offset" : 3,
      "end_offset" : 4,
      "type" : "",
      "position" : 3
    }
  ]
}

通过以上结果可以看到，“我的酒店”中的“我”和“的”已经被停用词过滤器过滤，只剩下“酒”和“店”。但是“酒”的开始位置是2，“店”的开始位置是3，说明分析结果中“我”和“的”的位置被保留了下来，这种特意保留停用词的方式有助于后续的模糊搜索。

24. 在内置分析器中使用停用词

① 其实，像standard这种常用的分析器都自带有停用词过滤器，只需要对其参数进行相应设置即可。以下示例中使用standard分析器并通过设置其stopwords属性进行停用词的设定：

PUT /my_index
{ 
  "settings": { 
    "analysis": { 
     "analyzer": {                        
        "my_standard": { 
          "type": "standard",              
          "stopwords":["我","的","这"]     
        } 
      } 
    } 
  }, 
  "mappings": { 
    "properties": { 
      "title": { 
        "type": "text", 
        "analyzer": "my_standard"         
      } 
    } 
  } 
}

② 使用上述分析器进行文本分析，DSL如下：

POST /my_index/_analyze 
{                                  
  "field": "title", 
  "text": "我的酒店" 
}

{
  "tokens" : [
    {
      "token" : "酒",
      "start_offset" : 2,
      "end_offset" : 3,
      "type" : "",
      "position" : 2
    },
    {
      "token" : "店",
      "start_offset" : 3,
      "end_offset" : 4,
      "type" : "",
      "position" : 3
    }
  ]
}

09. ElasticSearch 高亮显示搜索

25. ElasticSearch 高亮显示搜索基本使用

在ES中通过设置DSL的highlight参数可以对搜索的字段高亮显示。

① 索引文档，构造数据：

PUT /my_index
{
  "mappings": {
    "properties": {
      "title":{
        "type": "text"
      },
      "content":{
        "type": "text"
      }
    }
  }
}

PUT /my_index/_doc/1
{
  "title": "文雅酒店",
  "content": "Beijing City"
}

PUT /my_index/_doc/2
{
  "title": "孟连酒店",
  "content": "Huaibei City"
}

② 高亮显示搜索：

GET /my_index/_search
{
  "query": {
    "match": {
      "title": {
        "query": "金都怡家酒店"
      }
    }
  },
  "highlight": {
    "fields": {
      "title": {}
    }
  }
}

其中设定对title字段的匹配结果进行高亮显示的标记标签，此处使用默认的HTML标签，因此将title对应的值置为空对象。上述DSL的搜索结果如下：

{
  "took" : 8,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 0.36464313,
    "hits" : [
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.36464313,
        "_source" : {
          "title" : "文雅酒店",
          "content" : "Beijing City"
        },
        "highlight" : {
          "title" : [
            "文雅酒店"
          ]
        }
      },
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 0.36464313,
        "_source" : {
          "title" : "孟连酒店",
          "content" : "Huaibei City"
        },
        "highlight" : {
          "title" : [
            "孟连酒店"
          ]
        }
      }
    ]
  }
}

在每个搜索结果中增加了一个highlight子结果，其中将查询字段中匹配上的字符串都用HTML标签进行了标记，这样的结果可以直接传送到前端，前端根据标记标签进行特殊化处理即可完成匹配字符串的高亮显示。

③ 当然，如果希望使用其他HTML标签对匹配内容进行标记，可以在DSL中进行更改。以下DSL将匹配内容标记标签改为了：

GET /my_index/_search
{
  "query": {
    "match": {
      "title": {
        "query": "酒店"
      }
    }
  },
  "highlight": {
    "fields": {
      "title": {
        "pre_tags": "",
        "post_tags": ""
      }
    }
  }
}

{
  "took" : 3,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 0.36464313,
    "hits" : [
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.36464313,
        "_source" : {
          "title" : "文雅酒店",
          "content" : "Beijing City"
        },
        "highlight" : {
          "title" : [
            "文雅酒店"
          ]
        }
      },
      {
        "_index" : "my_index",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 0.36464313,
        "_source" : {
          "title" : "孟连酒店",
          "content" : "Huaibei City"
        },
        "highlight" : {
          "title" : [
            "孟连酒店"
          ]
        }
      }
    ]
  }
}

26. SpringBoot整合ES实现高亮显示

@Slf4j
@Service
public class ElasticSearchImpl {

    @Autowired
    private RestHighLevelClient restHighLevelClient;

    public void searchUser() throws IOException {
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();

        // query
        MatchQueryBuilder matchQueryBuilder = QueryBuilders.matchQuery("title", "酒店");
        searchSourceBuilder.query(matchQueryBuilder);

        HighlightBuilder highlightBuilder = new HighlightBuilder();
        highlightBuilder.preTags("");
        highlightBuilder.postTags("");
        highlightBuilder.field("title");

        // highlight
        searchSourceBuilder.highlighter(highlightBuilder);

        SearchRequest searchRequest = new SearchRequest(new String[]{"my_index"},searchSourceBuilder);
        SearchResponse searchResponse = restHighLevelClient.search(searchRequest, RequestOptions.DEFAULT);
        System.out.println(searchResponse);
    }
}

10. ElasticSearch 拼写纠错

用户在使用搜索引擎的过程中，输入的关键词可能会出现拼写错误的情况。针对错误的关键词，绝大多数的搜索引擎都能自动识别并进行纠正，然后将纠正后的关键词放到索引中匹配数据。如果拼写错误特别多导致无法纠正，则会直接告知用户当前搜索没有匹配的结果。

也可以使用ES进行拼写纠错，首先需要搜集一段时间内用户搜索日志中有搜索结果的查询词，然后单独建立一个纠正词索引。当用户进行搜索时，如果在商品索引中没有匹配到结果，则在纠正词索引中进行匹配，如果有匹配结果则给出匹配词，并给出该匹配词对应的商品结果，如果没有匹配结果则告知用户没有搜索到商品。

在ES中进行纠错匹配时使用fuzzy-match搜索，该搜索使用编辑距离和倒排索引相结合的形式完成纠错，什么是编辑距离呢？词语A经过多次编辑后和词语B相等，编辑的次数就叫作编辑距离。可以这样定义一次编辑：替换一个字符，或删除一个字符，或插入一个字符，或交换两个字符的位置。

① 索引文档：

 PUT /error_correct 
{ 
  "mappings": { 
    "properties": { 
      "hot_word": {   
        "type": "text", 
        "analyzer": "ik_max_word" 
      } 
    } 
  } 
}

POST /_bulk 
{"index":{"_index":"error_correct","_id":"001"}} 
{"hot_word": "王府井"} 
{"index":{"_index":"error_correct","_id":"002"}} 
{"hot_word": "王府中环"} 
{"index":{"_index":"error_correct","_id":"003"}} 
{"hot_word": "双井"} 
{"index":{"_index":"error_correct","_id":"004"}} 
{"hot_word": "成府路"} 
{"index":{"_index":"error_correct","_id":"005"}} 
{"hot_word": "大王庄"}

② ES的match查询支持模糊匹配，这里的模糊匹配指的是ES将查询文本进行分词进而得到分词列表，然后将列表中的词语分别和索引中的词语进行匹配，这时按照编辑距离进行模糊匹配，在符合编辑距离阈值的情况下才算是匹配。如下指定编辑距离为1：

GET /error_correct/_search 
{ 
  "query": { 
    "match": { 
      "hot_word":{ 
        "query": "王府景", 
        "operator": "and",  
        "fuzziness": 1             
      } 
    } 
  } 
}

{
  "took" : 1212,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 1.2354476,
    "hits" : [
      {
        "_index" : "error_correct",
        "_type" : "_doc",
        "_id" : "001",
        "_score" : 1.2354476,
        "_source" : {
          "hot_word" : "王府井"
        }
      },
      {
        "_index" : "error_correct",
        "_type" : "_doc",
        "_id" : "004",
        "_score" : 0.0,
        "_source" : {
          "hot_word" : "成府路"
        }
      }
    ]
  }
}

通过以上结果可以看出，纠错结果基本符合预期，但是“成府路”也出现在搜索结果中，这是为什么呢？按照hot_word字段默认的分析器对查询词“王府景”和查询词“成府路”进行分析，查询词“王府景”被切分成了“王府”和“景”；查询词“成府路”被切分成了“成”“府”和“路”。因为“王府”和“府”的编辑距离为1，符合模糊匹配的编辑距离的阈值，因此“成府路”被匹配上。

你可能感兴趣的:(elasticsearch,spring,boot,搜索引擎)

SpringCloudAlibaba网关聚合微服务swagger
微服务swagger配置引入依赖io.springfoxspringfox-swagger22.9.2io.springfoxspringfox-swagger-ui2.9.2配置swaggerimportio.swagger.annotations.ApiOperation;importorg.springframework.context.annotation.Bean;importorg.s
Spring Cloud Config（微服务配置中心详解）白仑色 Spring系列微服务微服务架构配置中心 SpringCloud
关键词：SpringCloudConfig、配置中心、远程仓库、动态刷新、加密解密✅摘要在微服务架构中，随着服务数量的增加，统一管理各服务的配置信息变得尤为重要。传统的本地配置文件方式难以满足多环境、多实例、集中化的需求。SpringCloudConfig是SpringCloud提供的一个分布式配置中心解决方案，支持将配置信息集中存储在Git、SVN或本地文件系统中，并提供给各个微服务动态获取和更
微服务项目网关集成swagger bbober 后端-微服务-框架微服务架构云原生
微服务项目网关中集成swagger并使用knife4j进行增强前言本文场景为：使用SpringCloud框架，MyBatisPlus持久层框架；注册中心：nacos，配置中心：nacos；主要模块有：业务模块、网关模块、common模块（共享）；网关路由从配置中心动态拉取；其他情况动态调整。spring-boot-start版本：2.7.12（3版本以上只支持OpenApi3规范，差距较大）使用O
3、微服务整合Swagger3.0 - 网关Gateway聚合接口 cch记录JAVA 系统接口文档Swagger knife4j 微服务 gateway 架构 spring boot java 后端
1、SpringBoot快速整合Swagger3.02、微服务整合Swagger3.0-抽取为公共模块3、微服务整合Swagger3.0-网关Gateway聚合接口4、微服务整合Swagger3.0-使用方法5、微服务Swagger3.0升级为Knife4j一、实现的效果访问http://{ip}:{port}/swagger-ui/index.htmlspringfox-swagger提供的分组
Java技术栈/面试题合集(16)-SpringCloud篇霸道流氓气质 Java进阶 Java SpringCloud 微服务面试
场景Java入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享：Java入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享_java高级进阶-CSDN博客通过对面试题进行系统的复习可以对Java体系的知识点进行查漏补缺。注：博客：霸道流氓气质-CSDN博客实现什么是SpringCloud？一、SpringCloud的核心定位1.定义SpringC
解决lombok注解失效问题
Lombok注解失效是Java开发中的常见问题，通常由依赖配置、IDE支持或构建工具设置引起。最近在拉取别人springboot3+jdk21版本的项目时遇到了lombok注解失效，导致项目无法启动的问题，以下是我的解决方案：首先检查idea的lombok的注解设置：务必和默认设置一样！！！以下是网上的一些解决方案，希望对大家有所帮助：一、检查依赖配置Maven项目在pom.xml中确保依赖包含a
windows script host 无法找到脚本文件program files(x86)\游戏平台\steamalypc\estm.vbs 开机弹窗如何解决电气之子游戏
安装了某第三方游戏租号平台后每次开机都有这个弹窗，很烦，然后研究了这个解决方法分享给大家1.开始界面搜索任务计划程序，然后打开2.在中间的任务计划中找到boottriggertesttask以及boottriggertesttaskusers，分别单击选中后，点击最右侧的删除即可3.重启完美解决问题！！！
SpringBoot EhCache 缓存一只帆記 Java SpringBoot spring boot 缓存后端
一、EhCache核心原理层级存储堆内缓存（Heap）：高速访问，受JVM内存限制堆外缓存（Off-Heap）：突破JVM堆大小限制（直接内存）磁盘存储（Disk）：持久化超大缓存集群存储（RMI/JGroups）：分布式节点同步（需企业版）数据过期策略LRU（最近最少使用）LFU（最不经常使用）FIFO（先进先出）基于创建/访问时间的TTL（生存时间）缓存工作流程是否方法调用缓存是否存在?返回缓
【容器】优质文章分享
文章目录加速器Docker教程安装坑volumn网络配置踩坑其他dockerfiledocker-compose手册教程网络坑docker使用dockermysqldockermongoredisdocker-rabbitmqnginxtomcatnacoszookeeperelasticsearch加速器现在docker镜像站真的不好找了。阿里什么的加速目前只能给阿里自己的容器用了。且用且珍惜D
软件架构设计中消息总线的应用详解半青年消息总线网络协议信息与通信 kafka MQTT 物联网系统架构
目录一、消息总线的核心原理1.解耦与异步通信2.消息路由与协议适配3.可靠性保障二、消息总线的核心功能1.动态扩展与负载均衡2.容错与高可用性3.数据转换与集成三、典型应用场景1.微服务架构中的服务解耦2.大规模数据流处理3.复杂事务管理4.边缘计算与物联网四、设计考量与选型建议1.通信模式选择2.协议与生态适配3.容错与监控五、案例分析：SpringCloudBus与物联网平台1.SpringC
【Elasticsearch】自定义评分检索 G皮T #Elastic elasticsearch 大数据自定义评分查询检索 _score 搜索引擎
自定义评分检索1.自定义评分2.为什么需要自定义评分3.搜索结果相关度4.影响相关度评分的查询子句5.控制相关度评分的方法5.1FunctionScoreQuery5.1.1基础查询部分5.1.2评分函数部分（functions数组）第一个函数：品牌加权第二个函数：销量因子第三个函数：时间衰减5.1.3评分组合方式score_modeboost_mode5.1.4整体效果5.2使用Boosting
Java构建区块链版权交易平台：从智能合约到法律合规的全栈实战墨夶 Java学习资料1 java 区块链智能合约
——基于HyperledgerFabric与SpringBoot的版权交易系统设计数字版权时代的“信任危机”与技术破局在数字内容爆炸式增长的今天，版权侵权问题日益严峻。据统计，全球每年因版权纠纷造成的经济损失高达数百亿美元。Java技术栈凭借其企业级开发能力、区块链集成优势及完善的生态工具链，成为构建版权交易平台的核心选择。本文将从区块链存证、智能合约交易、法律合规模块三大维度，通过代码级深度解析
Java服务化架构转型实战：从“单体噩梦”到“微服务交响曲”，代码深度解析！墨夶 Java学习资料1 架构 java 微服务
**从0到1构建企业级服务化架构**1.服务拆分：从“大而全”到“小而美”1.1按业务领域拆分服务//SpringCloud微服务示例：订单服务@SpringBootApplication@EnableDiscoveryClient//服务注册发现publicclassOrderServiceApplication{publicstaticvoid
Elasticsearch：什么是搜索相关性？ Elastic 中国社区官方博客 Elasticsearch Elastic elasticsearch 大数据搜索引擎人工智能全文检索
搜索相关性定义搜索相关性衡量的是搜索引擎返回的搜索结果与用户查询和意图之间的匹配程度。搜索结果的质量取决于显示的信息与用户预期之间的契合度。提升搜索相关性和性能需要进行语言分析、排序算法优化以及考虑上下文因素。这些因素可能包括用户行为分析、位置信息、热门程度和搜索历史等。搜索相关性是客户体验中的关键因素，通过合理平衡，搜索体验可以同时满足企业和用户的需求。了解为什么相关性对搜索引擎至关重要，以及如
Spring面试总结，基于小林coding+个人总结会非的杨 spring 面试 java
Spring面试总结讲一下你对spring的理解Spring是一个轻量级的Java开发框架，它通过控制反转（IoC）和面向切面编程（AOP）等核心技术，为企业级应用提供了全面的解决方案。它整合了事务管理、Web开发、数据访问等功能模块，具有模块化、非侵入性等特点。核心特性：控制反转与依赖注入：IoC，将对象的创建和依赖关系的管理从代码中移除，转由Spring容器负责。DI：IoC的具体实现方式，通
Springboot和Python之间通过RabbitMQ进行双向异步消息交互demo示例同心圆码农后端 java-rabbitmq spring boot python
SpringBoot后端和Python算法之间解耦设计，采用通过消息总线RabbitMQ进行双向异步交互，以下是一个demo样例，罗列出了实现该功能需要做的工作，包括软件安装、RabbitMQ基本介绍、Springboot后端demo代码、Pythondemo代码、运行流程以及调试遇到问题软件安装Win10本地需要安装RabbitMQ，作为Springboot后端和Python模块通讯的消息中间件
Elasticsearch MacJerry elasticsearch 大数据搜索引擎
学习目标[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BGW4RqWM-1635414988340)(es.assets/Snipaste_2020-07-06_13-03-45.png)]Elasticsearch简介与安装什么是Elasticsearch？ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，基
领域驱动设计实战：用六边形架构解耦你的Spring Boot应用 lingRJ777 Java技术栈应用 java backend springboot ddd microservices
领域驱动设计实战：用六边形架构解耦你的SpringBoot应用引言在复杂的软件系统中，业务逻辑的持续演进和技术栈的不断更迭是两大核心挑战。以一个典型的电商系统为例，其订单处理模块不仅业务规则繁多（如价格计算、库存校验、优惠券使用、订单状态流转），还需与多种外部系统交互（如Web请求、数据库、消息队列、第三方支付接口）。在传统的N层架构中，我们常常会遇到以下核心挑战：技术债与僵化设计：业务逻辑与具体
分库分表之实战-sharding-JDBC水平分库+水平分表配置实战软件编程在线接单（需要可私）分库分表后端 java 数据库 mysql 分布式
大家好，我是工藤学编程一个正在努力学习的小博主，期待你的关注实战代码系列最新文章C++实现图书管理系统（QtC++GUI界面版）SpringBoot实战系列【SpringBoot实战系列】Sharding-Jdbc实现分库分表到分布式ID生成器Snowflake自定义wrokId实战环境搭建大集合环境搭建大集合(持续更新）分库分表分库分表之实战-sharding-JDBC广播表前情摘要：1、数据库
Git安装避坑指南：新手村通关秘籍
Git安装避坑指南：新手村通关秘籍刚学编程那会儿，Git安装差点让我砸键盘。满心欢喜打开官网下载，结果卡在配置上，命令行死活不认识git命令。看着教程里别人行云流水的操作，自己对着报错信息干瞪眼——这感觉，经历过的人都懂。今天这份避坑指南，就是帮你跳过这些“新手坑”，稳稳装好Git！第一坑：官网迷路，下载错版本坑点描述：直接在搜索引擎搜“Git下载”，排在前面的广告链接可能是“高速下载器”或第三方
JAVA——JAVA知识点集锦（下） Faith_chao JAVA基础 JAVA基础知识点
转自：http://blog.csdn.net/Scythe666/article/details/51994782这部分主要是开源JavaEE框架方面的内容，包括Hibernate、MyBatis、Spring、SpringMVC等，由于Struts2已经是明日黄花，在这里就不讨论Struts2的面试题，如果需要了解相关内容，可以参考我的另一篇文章《Java面试题集（86-115）》。此外，这篇
Java学习第二十二部分——了解框架慕y274 java 学习开发语言
目录一.概述二.分类1.Web开发框架2.持久层框架3.依赖注入框架4.安全框架5.微服务框架三.优势四.建议一.概述Java框架是一种用于简化Java开发过程的工具，它提供了一组预定义的类和接口，帮助开发者更高效地构建应用程序。二.分类1.Web开发框架-**SpringMVC**-**特点**：它是Spring框架的一部分，用于构建Web应用程序。它支持多种视图技术，如JSP、Thymelea
Spring的Bean原型模式下的使用
目录1、问题原因1.1、注入点只初始化一次1.2、代理模式问题1.3、使用不当的获取方式2、解决方案2.1.ApplicationContext获取2.2.使用ObjectProvider2.3.使用Lookup方法2.4.使用Provider接口3、原型模式的应用场景1.有状态的Bean2.线程不安全的对象3.需要每次使用新实例的场景4.需要避免副作用的场景4、注意事项前言原型(Prototyp
后端路线指导（3）：后端进阶版学习路线绝命Coding 后端技术分享学习经验分享后端职场和发展面试
后端进阶版学习路线：如果说基础版的学习路线是为了打地基，那么进阶版必然是添砖加瓦了。进阶版路线其实才是真正扎实“基本功”的阶段，这一阶段主要需要学习微服务的开发模式、并发编程、设计模式等编程技巧，学习Spring和Redis的底层设计思想和源码，以及针对面试问的最多的部分进行的专项提升训练（JVM、Spring的IOC、AOP等等）接下来先定义一下对于知识的掌握程度级别：入门->了解->熟悉->非
Spring Data REST极速构建REST API 代码的余温 spring java 后端 spring boot
SpringDataREST是SpringData项目家族中的一个子项目，它构建在SpringDataRepositories（如SpringDataJPA、SpringDataMongoDB等）之上，旨在自动将你的数据模型（实体）和SpringDataRepository暴露为超媒体驱动的RESTfulWeb服务。它的核心目标是极大简化构建围绕数据的RESTAPI的过程。核心思想：约定优于配置：
web渗透之指纹识别1 合作小小程序员小小店网络安全物联网网络安全网络攻击模型计算机网络
web渗透之指纹识别1前端技术：前端中我们需要掌握一些基础html,javascrip,jquery,bootstrap,前端框架vue.js,vue,angular,React等，在前端中可以利用的东西还是很多的，我们可使用xss配合csrf以及一些攻击漏洞进行弹框，获取cookie，劫持，绕过，跳转，跨域，重定向，重放，控制节点，挂暗链接，甚至隐藏我们的请求等。如果要说怎么在识别中使用，我们可
谢飞机面试记：一场啼笑皆非的 Java 技术面大揭秘！
谢飞机面试记：一场啼笑皆非的Java技术面大揭秘！面试官：谢飞机，听说你要来我们公司应聘Java开发工程师？谢飞机：对对对，我可是个技术宅，什么SpringBoot、SpringCloud啥的都玩得溜。第一轮问题：基础篇面试官：谈谈你对Java内存模型的理解。谢飞机：嗯...Java内存模型主要是关于线程之间如何通信和共享数据的吧。比如说，volatile关键字可以保证变量的可见性，synchro
SpringBoot集成Mybatis 【图文教程】 hdsoft_huge SpringBoot教程 spring boot mybatis 后端
文章目录一，SpringBoot与MyBatis介绍二，集成步骤三，注意事项四，利用ideaspringboot集成mybatis五，总结一，SpringBoot与MyBatis介绍SpringBoot是Spring框架的扩展，它简化了Spring应用的初始搭建和开发过程，通过自动配置和起步依赖，让开发者可以更专注于业务逻辑。MyBatis是一款优秀的持久层框架，它支持自定义SQL、存储过程以及高
谢飞机的Java高级开发面试：从Spring Boot到分布式架构的蜕变之旅
面试现场：谢飞机的求职奇遇记"请坐，谢先生。我看你简历上写了'精通Lombok'？"面试官推了推金丝眼镜。谢飞机一愣："啊...这个..."突然掏出手机，"您看我GitHub开源项目里用了@SneakyThrows，异常处理特别优雅！"面试官嘴角微扬："那说说SpringBoot自动装配原理？""这简单！"谢飞机来了精神，"就是通过@SpringBootApplication组合注解，结合SPI机
Java开发面试核心知识点解析：从Redis缓存到内存模型全面解读
Java开发面试核心知识点解析：从缓存到内存管理谢飞机的面试经历谢飞机：（擦汗）面试官，我准备好了！第一轮提问面试官：说说你在SpringBoot中如何使用Redis缓存？有啥优势？谢飞机：嗯...这个我会！Redis是一个内存数据库，可以用来做缓存。在SpringBoot中，可以通过@EnableCaching注解启用缓存功能，然后通过@Cacheable、@CachePut和@CacheEvi
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio