周全全

Elasticsearch基础篇(五)：创建es索引并学习分析器、过滤器、分词器的作用和配置

创建es索引并学习分析器、过滤器、分词器的作用和配置

一、基础概念
- Elasticsearch与MySQL的类比
- 1. ES与MySQL的结构类比图
- 2. ES与MySQL的类比示意表格
- 3. 索引中重要概念
- - 索引（Index）
  - 文档（Document）
  - 字段（Field）
  - 映射（Mapping）
二、定义索引
- 索引的组成
- 索引示例
三、索引分析
四、官方文档(参考)
- 分析器配置
- - 配置内置分析器(Configuring built-in analyzers)
  - 指定分析器（Specify an analyzer）
- 内置分析器参考
- 分词器参考
- - 面向单词的分词器
  - 面向部分单词的分词器
  - 结构化文本分词器
- 分词过滤器参考（Token filter reference）
- 字符过滤器参考（Character filters reference）
- 标准化器（Normalizers）

一、基础概念

Elasticsearch 是一个分布式搜索和分析引擎，它使用JSON文档来存储数据。索引是Elasticsearch中数据的基本组织单元之一，下面是Elasticsearch索引相关的基本概念：

Elasticsearch与MySQL的类比

1. ES与MySQL的结构类比图

2. ES与MySQL的类比示意表格

结构元素	Elasticsearch	MySQL
数据库	索引（Index）	数据库（Database）
表格	类型（Type）*	表（Table）
记录/行	文档（Document）	记录（Row）
列/字段	字段（Field）	列（Column）
主键	_id 字段	主键（Primary Key）
查询语言	Query DSL	SQL

注意：在Elasticsearch 7.x版本之后，不再使用类型（Type）的概念，每个索引只包含文档。所以在新版本中，没有类型，只有索引和文档。因此es的索引我们也可以类比为mysql中的数据表

3. 索引中重要概念

索引（Index）

索引是Elasticsearch中的主要数据存储单元。它类似于传统数据库中的表，但更加灵活。
索引用于存储相关文档，这些文档可能属于不同的数据类型，但具有共同的查询需求。
一个索引可以包含许多文档，每个文档都是一个JSON对象。

文档（Document）

文档是索引中的基本数据单元。每个文档都是一个JSON对象，它包含了数据字段和对应的值。
例如，在一个名为"books"的索引中，每个文档可能表示一本书，包含书名、作者、出版日期等字段。

字段（Field）

字段（Field）是文档（Document）中包含数据的单个元素。字段可以包含不同类型的数据，如文本、数字、日期等

映射（Mapping）

映射定义索引中每个字段的数据类型和属性。它告诉Elasticsearch如何解释和处理每个字段的数据。
映射可以自动创建，也可以手动定义以更精确地控制字段的处理。

二、定义索引

在开发中es的index我们可以预先定义好，包括索引的别名（alias）、设置（settings）、映射（mappings）等。如果直接用默认的设置，添加文档时es会自动帮我们创建索引，但默认的不一定符合我们的需求

索引的组成

创建Elasticsearch索引的过程通常包括三个关键部分：别名（Aliases）、设置（Settings）、和映射（Mappings），每个部分的作用如下：

别名（Aliases）：
- 别名是索引的可选名称，允许您将一个或多个索引关联到一个别名上。
- 别名用于简化查询和索引维护，可以用于切换索引版本、滚动索引、分离索引等操作。
- 通过别名可以在不更改查询的情况下轻松切换索引，这对于数据版本管理非常有用
设置（Settings）：
- 设置包括了索引的配置参数，它们会影响索引的行为和性能。
- 设置可以包括索引的分片和副本配置、刷新间隔、合并策略、搜索相关配置等。
- 通过设置可以调整索引以满足特定需求。例如，可以设置分片的数量、副本的数量、自定义分析器等。
映射（Mappings）：
- 映射定义了索引中每个字段的数据类型和属性。它告诉Elasticsearch如何解释和处理文档中的数据。
- 可以选择让Elasticsearch自动创建映射（Dynamic Mapping），或者可以显式定义映射以更精确地控制字段的处理（推荐显式定义）。
- 映射定义通常包括字段名称、数据类型（如文本、整数、日期等）、分析器（用于文本字段的文本分词）等信息。

索引示例

使用Elasticsearch的REST API来创建一个名为"books"的索引：

PUT /books
{
  "aliases": {
    "cn_book": {}
  },
  "settings": {
    "number_of_shards": 5,
    "number_of_replicas": 2
  },
  "mappings": {
    "properties": {
      "title": {
        "type": "text",
        "analyzer": "standard"
      },
      "author": {
        "type": "keyword"
      },
      "publish_date": {
        "type": "date",
        "format": "yyyy-MM-dd"
      }
    }
  }
}

以下是每个部分的说明：

aliases（别名）：

别名是一个可选项，允许您为索引定义一个或多个别名，以便更容易引用该索引。在示例中，索引被命名为"cn_book"，并且有一个空的别名对象。

settings（设置）：

在设置部分，您可以配置索引的全局设置。
number_of_shards：指定索引分成的主分片数量。在示例中，索引分成了5个主分片。
number_of_replicas：指定每个主分片的副本数量。在示例中，每个主分片有2个副本，用于提高数据冗余和可用性。

mappings（映射）：

映射定义了索引中的字段及其数据类型和属性。
在示例中，有三个字段定义：
- title：类型为"text"，使用"standard"分析器。这是一个文本字段，通常用于全文搜索。
- author：类型为"keyword"。这是一个关键字字段，通常用于精确匹配和聚合。
- publish_date：类型为"date"，使用"yyyy-MM-dd"日期格式。这是一个日期字段，用于存储日期信息。

三、索引分析

{
  "aliases": {
    "data": {},
    "book": {}
  },
  "settings": {
    "index": {
      "refresh_interval": "5s",
      "max_inner_result_window": "10000",
      "max_result_window": "20000",
      "analysis": {
        "analyzer": {
          "pinyin_analyzer": {
            "tokenizer": "my_pinyin"
          }
        },
        "tokenizer": {
          "my_pinyin": {
            "type": "pinyin",
            "keep_separate_first_letter": false,
            "keep_full_pinyin": true,
            "keep_original": true,
            "limit_first_letter_length": 16,
            "lowercase": true,
            "remove_duplicated_term": true
          }
        },
        "char_filter": {
          "pinyin_multi": {
            "type": "mapping",
            "mappings": [
              "重庆 => 从庆"
            ]
          },
          "pinyin_first": {
            "type": "mapping",
            "mappings_path": "pinyin_first.txt"
          },
          "remove_space": {
            "type": "pattern_replace",
            "pattern": "[\\s「」﹝﹞·，。/《》？；‘’、：“”\\|【】\\{\\}\\~\\·\\！\\@\\#\\￥\\%\\……\\&\\*（）\\—\\+\\-\\=\\,\\.\\/\\<\\>\\?\\;'\\\\,\"\\|\\[\\]\\{\\}\\`\\~\\!\\@\\#\\$\\%\\^\\&\\*\\(\\)\\-\\=\\_\\+]*",
            "replacement": ""
          }
        },
        "normalizer": {
          "sort_normalizer": {
            "type": "custom",
            "char_filter": [
              "remove_space",
              "pinyin_multi",
              "pinyin_first"
            ],
            "filter": [
              "cjk_width",
              "asciifolding"
            ]
          }
        }
      }
    }
  },
  "mappings": {
    "dynamic": "false"
  }
}

别名（Aliases）:
- “navy_data”: 这是一个名为"data"的索引别名。
- “book”: 这是一个名为"book"的索引别名。
索引设置（Settings）:
- “index”: 这是索引的根配置。
  - “refresh_interval”: 索引的刷新间隔设置为"5s"，表示每5秒进行一次刷新。
  - “max_inner_result_window”: 设置内部结果窗口的最大大小为"10000"。
  - “max_result_window”: 设置结果窗口的最大大小为"20000"。
  - “analysis”: 这是索引的文本分析配置。
    - “analyzer”: 文本分析器的配置。
      - “pinyin_analyzer”: 这是一个名为"pinyin_analyzer"的分析器。
        
        “tokenizer”: 指定了使用的分词器，这里使用了名为"my_pinyin"的自定义分词器。
    - “tokenizer”: 自定义分词器的配置。
      - “my_pinyin”: 这是一个名为"my_pinyin"的分词器，类型为"pinyin"。
        
        “keep_separate_first_letter”: 设置为"false"，表示不保留拼音的首字母。
        
        “keep_full_pinyin”: 设置为"true"，表示保留完整拼音。
        
        “keep_original”: 设置为"true"，表示保留原始文本。
        
        “limit_first_letter_length”: 设置首字母的长度限制为"16"。
        
        “lowercase”: 设置为"true"，表示将拼音转换为小写。
        
        “remove_duplicated_term”: 设置为"true"，表示删除重复的词项。
    - “char_filter”: 字符过滤器的配置。
      - “pinyin_multi”: 这是一个名为"pinyin_multi"的字符过滤器，类型为"mapping"，用于将特定字符映射为其他字符。
      - “pinyin_first”: 这是一个名为"pinyin_first"的字符过滤器，类型为"mapping"，使用了外部文件"pinyin_first.txt"中的映射。
      - “remove_space”: 这是一个名为"remove_space"的字符过滤器，类型为"pattern_replace"，用于移除指定的空格和标点符号。
        
        “pattern”: 指定了匹配的正则表达式模式。
        
        “replacement”: 指定了替换的字符。
    - “normalizer”: 规范化器的配置。
      - “sort_normalizer”: 这是一个名为"sort_normalizer"的自定义规范化器。
        
        “char_filter”: 包括了字符过滤器，包括"remove_space"、“pinyin_multi"和"pinyin_first”。
        
        “filter”: 包括了过滤器，包括"cjk_width"和"asciifolding"。
映射（Mappings）:
- “dynamic”: 设置为"false"，表示禁用动态映射，索引中的字段需要明确定义，不允许自动添加新字段。

四、官方文档(参考)

分析器配置

参考：Configure text analysis

默认情况下，Elasticsearch对所有文本分析使用标准分析器。标准分析器为大多数自然语言和用例提供开箱即用的支持。如果选择使用标准分析器，通常不需要进一步的配置。
如果标准分析器不满足您的需求，请查看和测试Elasticsearch的其他内置分析器。内置分析器不需要配置，但某些支持选项可用于调整其行为。例如，您可以配置标准分析器，以去除自定义停用词的列表。

如果没有内置分析器满足您的需求，您可以测试并创建自定义分析器。自定义分析器涉及选择和组合不同的分析器组件，从而提供更大的控制权。
分析器测试（Test an analyzer）
analyzer API 用于查看由分析器生成的术语。内置分析器可以在请求中内联指定:

POST _analyze
{
  "analyzer": "whitespace",
  "text":     "今天 是 周五"
}

执行结果

{
  "tokens" : [
    {
      "token" : "今天",
      "start_offset" : 0,
      "end_offset" : 2,
      "type" : "word",
      "position" : 0
    },
    {
      "token" : "是",
      "start_offset" : 3,
      "end_offset" : 4,
      "type" : "word",
      "position" : 1
    },
    {
      "token" : "周五",
      "start_offset" : 5,
      "end_offset" : 7,
      "type" : "word",
      "position" : 2
    }
  ]
}

还可以测试以下组合：

● A tokenizer 分词器
● Zero or more token filters 零个或多个分词过滤器
● Zero or more character filters 零个或多个字符过滤器

POST _analyze
{
  "tokenizer": "standard",
  "filter":  [ "lowercase", "asciifolding" ],
  "text":      "Is this déja vu?"
}

自定义分析器

PUT my-index-000001
{
  "settings": {
    "analysis": {
      "analyzer": {
        # 自定义分析器
        "std_folded": { 
          "type": "custom",
          "tokenizer": "standard",
          "filter": [
            "lowercase",
            "asciifolding"
          ]
        }
        
      }
    }
  },
  "mappings": {
    "properties": {
      "my_text": {
        "type": "text",
        "analyzer": "std_folded" 
      }
    }
  }
}

GET my-index-000001/_analyze 
{
  "analyzer": "std_folded", 
  "text":     "Is this déjà vu?"
}

GET my-index-000001/_analyze 
{
  "field": "my_text", 
  "text":  "Is this déjà vu?"
}

配置内置分析器(Configuring built-in analyzers)

内置分析器无需任何配置即可直接使用。然而，其中一些支持配置选项来改变其行为。例如，标准分析器可以配置为支持停用词列表：

PUT my-index-000001
{
  "settings": {
    "analysis": {
      "analyzer": {
        "std_english": { 
          "type":      "standard",
          "stopwords": "_english_"
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "my_text": {
        "type":     "text",
        "analyzer": "standard", 
        "fields": {
          "english": {
            "type":     "text",
            "analyzer": "std_english" 
          }
        }
      }
    }
  }
}



POST my-index-000001/_analyze
{
  "field": "my_text", 
  "text": "The old brown cow"
}

POST my-index-000001/_analyze
{
  "field": "my_text.english", 
  "text": "The old brown cow"
}

指定分析器（Specify an analyzer）

Elasticsearch提供了多种指定内置或自定义分析器的方法：

通过文本字段、索引或查询
用于索引或搜索时

在需要时，可以在不同级别和不同时间指定分析器，这是灵活性的体现。
在大多数情况下，采用简单的方法最有效：为每个文本字段指定一个分析器，如在“为字段指定分析器”中所述。
这种方法与Elasticsearch的默认行为很好地配合，让您可以在索引和搜索时使用相同的分析器。它还让您能够通过使用"get mapping" API快速查看哪个分析器适用于哪个字段。
如果您通常不为索引创建映射，您可以使用索引模板来实现类似的效果。

Elasticsearch如何确定索引分析器：
Elasticsearch通过按以下顺序检查以下参数来确定要使用的索引分析器：

字段的分析器映射参数。请参阅“为字段指定分析器”。
analysis.analyzer.default索引设置。请参阅“为索引指定默认分析器”。
如果没有指定上述参数，则使用标准分析器。

为字段指定分析器：
在映射索引时，您可以使用分析器映射参数为每个文本字段指定一个分析器。以下是一个创建索引的API请求示例，将空格分析器设置为标题字段的分析器：

PUT my-index-000001
{
  "mappings": {
    "properties": {
      "title": {
        "type": "text",
        "analyzer": "whitespace"
      }
    }
  }
}

为索引指定默认分析器：
除了字段级分析器，您还可以使用analysis.analyzer.default设置为索引设置一个备用分析器。以下是一个创建索引的API请求示例，将简单分析器设置为my-index-000001的备用分析器：

PUT my-index-000001
{
  "settings": {
    "analysis": {
      "analyzer": {
        "default": {
          "type": "simple"
        }
      }
    }
  }
}

Elasticsearch如何确定搜索分析器：
在大多数情况下，指定不同的搜索分析器是不必要的。这样做可能会对相关性产生负面影响，导致意外的搜索结果。

如果选择指定单独的搜索分析器，我们建议在部署到生产环境之前进行彻底的分析配置测试。

在搜索时，Elasticsearch通过按以下顺序检查以下参数来确定要使用的分析器：

查询中的analyzer参数。请参阅“为查询指定搜索分析器”。
字段的search_analyzer映射参数。请参阅“为字段指定搜索分析器”。
analysis.analyzer.default_search索引设置。请参阅“为索引指定默认搜索分析器”。
字段的分析器映射参数。请参阅“为字段指定分析器”。
如果没有指定上述参数，则使用标准分析器。

为查询指定搜索分析器：
在编写全文查询时，您可以使用analyzer参数来指定搜索分析器。如果提供了此参数，它将覆盖任何其他搜索分析器。以下是一个示例，为匹配查询设置了停用词分析器作为搜索分析器：

GET my-index-000001/_search
{
  "query": {
    "match": {
      "message": {
        "query": "Quick foxes",
        "analyzer": "stop"
      }
    }
  }
}

为字段指定搜索分析器：
在映射索引时，您可以使用search_analyzer映射参数为每个文本字段指定搜索分析器。如果提供了搜索分析器，则必须还使用analyzer参数指定索引分析器。以下是一个创建索引的API请求示例，将简单分析器设置为标题字段的搜索分析器：

PUT my-index-000001
{
  "mappings": {
    "properties": {
      "title": {
        "type": "text",
        "analyzer": "whitespace",
        "search_analyzer": "simple"
      }
    }
  }
}

为索引指定默认搜索分析器：
在创建索引时，您可以使用analysis.analyzer.default_search设置为索引设置一个默认搜索分析器。如果提供了搜索分析器，则必须使用analysis.analyzer.default设置指定默认索引分析器。以下是一个创建索引的API请求示例，将空格分析器设置为my-index-000001的默认搜索分析器：

PUT my-index-000001
{
  "settings": {
    "analysis": {
      "analyzer": {
        "default": {
          "type": "simple"
        },
        "default_search": {
          "type": "whitespace"
        }
      }
    }
  }
}

这些设置和指定分析器的方式可根据您的需求和索引映射的复杂程度进行调整。根据具体的需求，您可以选择使用简单或复杂的分析配置。

内置分析器参考

官网参考：Built-in analyzer reference

Elasticsearch内置了各种分析器，可以在不需要进一步配置的情况下用于任何索引：

标准分析器（Standard Analyzer）
- 标准分析器根据Unicode文本分割算法在单词边界将文本划分为项（terms）。
- 它移除大多数标点符号、将项转换为小写，并支持移除停用词。
简单分析器（Simple Analyzer）
- 简单分析器在遇到非字母字符时将文本划分为项。
- 它将所有项转换为小写。
空格分析器（Whitespace Analyzer）
- 空格分析器在遇到任何空格字符时将文本划分为项。
- 它不将项转换为小写。
停用词分析器（Stop Analyzer）
- 停用词分析器类似于简单分析器，但还支持停用词的移除。
关键字分析器（Keyword Analyzer）
- 关键字分析器是一个“无操作”分析器，接受任何文本并输出与原始文本相同的单个项。
模式分析器（Pattern Analyzer）
- 模式分析器使用正则表达式将文本划分为项。
- 它支持小写处理和停用词的移除。
语言分析器（Language Analyzers）
- Elasticsearch提供了许多语言特定的分析器，如英语或法语。
指纹分析器（Fingerprint Analyzer）
- 指纹分析器是一个专门的分析器，用于创建用于重复检测的指纹。
自定义分析器（Custom Analyzers）
- 如果找不到适合您需求的分析器，您可以创建一个自定义分析器，结合适当的字符过滤器、标记器和标记过滤器。

分词器参考

一个分词器接收一系列字符流，将其分解成单独的分词（通常是单个单词），并输出一系列分词。例如，一个空格分词器会在看到任何空格时将文本分成分词。它会将文本 “Quick brown fox!” 转换为词项 [Quick, brown, fox!]。

分词器还负责记录以下信息：

●每个词项的顺序或位置（用于短语和单词接近查询）。
●每个词项表示的原始单词的起始和结束字符偏移量（用于突出显示搜索片段）。
●分词类型，对生成的每个词项进行分类，如、或。更简单的分析器只生成单词分词类型。

Elasticsearch内置了许多分词器，可以用于构建自定义分析器。

面向单词的分词器

以下的分词器通常用于将全文分词成单独的单词：

标准分词器（Standard Tokenizer）
- 标准分词器根据Unicode文本分割算法在单词边界将文本划分为词项。
- 它移除大多数标点符号。对于大多数语言来说，这是最佳选择。
字母分词器（Letter Tokenizer）
- 字母分词器在遇到非字母字符时将文本划分为词项。
小写分词器（Lowercase Tokenizer）
- 小写分词器，类似于字母分词器，在遇到非字母字符时将文本划分为词项，但还将所有词项转换为小写。
空格分词器（Whitespace Tokenizer）
- 空格分词器在遇到任何空格字符时将文本划分为词项。
UAX URL Email 分词器（UAX URL Email Tokenizer）
- uax_url_email 分词器类似于标准分词器，不过它识别URL和电子邮件地址作为单个词项。
经典分词器（Classic Tokenizer）
- 经典分词器是一种基于语法的英语语言分词器。
泰语分词器（Thai Tokenizer）
- 泰语分词器将泰文文本分割成单词。

面向部分单词的分词器

这些分词器将文本或单词分割成小片段，用于部分单词匹配：

N-Gram 分词器（N-Gram Tokenizer）
- ngram 分词器可以在遇到指定字符列表之一（例如空格或标点符号）时将文本分解为词项，然后返回每个词项的n-gram（连续字母的滑动窗口），例如 quick → [qu, ui, ic, ck]。
边缘 N-Gram 分词器（Edge N-Gram Tokenizer）
- 边缘 ngram 分词器可以在遇到指定字符列表之一（例如空格或标点符号）时将文本分解为词项，然后返回每个词项的n-gram，这些n-gram锚定在单词的开头，例如 quick → [q, qu, qui, quic, quick]。

结构化文本分词器

以下的分词器通常用于结构化文本，如标识符、电子邮件地址、邮政编码和路径，而不是用于全文：

关键字分词器（Keyword Tokenizer）
- 关键字分词器是一个“无操作”分词器，接受任何文本并输出与原始文本相同的单个词项。它可以与分词过滤器（如小写化）结合使用以规范分析后的词项。
模式分词器（Pattern Tokenizer）
- 模式分词器使用正则表达式，可以在匹配单词分隔符时将文本分解为词项，或捕获匹配的文本作为词项。
简单模式分词器（Simple Pattern Tokenizer）
- 简单模式分词器使用正则表达式捕获匹配的文本作为词项。它使用正则表达式功能的有限子集，通常比模式分词器更快。
字符组分词器（Char Group Tokenizer）
- 字符组分词器可通过一组要分割的字符进行配置，通常比运行正则表达式更经济。
简单模式拆分分词器（Simple Pattern Split Tokenizer）
- 简单模式拆分分词器使用与简单模式分词器相同的有限正则表达式子集，但在匹配时分割输入，而不是将匹配作为词项返回。
路径分词器（Path Tokenizer）
- path_hierarchy 分词器接受分层值，如文件系统路径，按路径分隔符拆分，并为树中的每个组件发出一个词

分词过滤器参考（Token filter reference）

官网参考：Token filter reference

分词过滤器（Token filters）接受来自分词器的分词流（tokens），可以修改分词（例如小写化）、删除分词（例如去除停用词）或添加分词（例如同义词）。Elasticsearch提供了多个内置的分词过滤器，可以用它们来构建自定义分析器。

Apostrophetokenfilter
ASCIIfoldingtokenfilter
CJKbigramtokenfilter
CJKwidthtokenfilter
Classictokenfilter
Commongramstokenfilter
Conditionaltokenfilter
Decimaldigittokenfilter
Delimitedpayloadtokenfilter
Dictionarydecompoundertokenfilter
Edgen-gramtokenfilter
Elisiontokenfilter
Fingerprinttokenfilter
Flattengraphtokenfilter
Hunspelltokenfilter
Hyphenationdecompoundertokenfilter
Keeptypestokenfilter
Keepwordstokenfilter
Keywordmarkertokenfilter
Keywordrepeattokenfilter
KStemtokenfilter
Lengthtokenfilter
Limittokencounttokenfilter
Lowercasetokenfilter
MinHashtokenfilter
Multiplexertokenfilter
N-gramtokenfilter
Normalizationtokenfilters
Patterncapturetokenfilter
Patternreplacetokenfilter
Phonetictokenfilter
Porterstemtokenfilter
Predicatescripttokenfilter
Removeduplicatestokenfilter
Reversetokenfilter
Shingletokenfilter
Snowballtokenfilter
Stemmertokenfilter
Stemmeroverridetokenfilter
Stoptokenfilter
Synonymtokenfilter
Synonymgraphtokenfilter
Trimtokenfilter
Truncatetokenfilter
Uniquetokenfilter
Uppercasetokenfilter
Worddelimitertokenfilter
Worddelimitergraphtokenfilter

字符过滤器参考（Character filters reference）

官网参考：Character filters reference

字符过滤器（Character filters）用于在字符流传递给分词器之前对其进行预处理。
字符过滤器接收原始文本作为字符流，并可以通过添加、删除或更改字符来转换字符流。例如，字符过滤器可以用于将印度-阿拉伯数字（٠‎١٢٣٤٥٦٧٨‎٩‎）转换为其阿拉伯-拉丁等效形式（0123456789），或者从流中剥离 HTML 元素，如。

Elasticsearch 提供了多个内置的字符过滤器，可以用它们来构建自定义分析器。

HTML 剥离字符过滤器（HTML Strip Character Filter）：剥离 HTML 元素，如 ，并解码 HTML 实体，如 &。
映射字符过滤器（Mapping Character Filter）：替换指定字符串的任何出现次数为指定的替代字符串。
模式替换字符过滤器（Pattern Replace Character Filter）：使用指定的替代字符串替换与正则表达式匹配的任何字符。

标准化器（Normalizers）

规范化器与分析器类似，不同之处在于它们只能发出单个令牌。因此，它们没有标记化器，只接受可用的字符过滤器和标记过滤器的子集。只允许使用按字符工作的筛选器。例如，允许使用小写过滤器，但不允许使用词干过滤器，因为词干过滤器需要将关键字作为一个整体来查看。可在规范化器中使用的过滤器的当前列表如下：阿拉伯规范化、asciifolding、bengali_normalization、cjk_width、decimal_digh、elision、german_normalization、hindi_normalizing、indic_normalization、小写、persian_normalizion、scandinavian_folding、serbian_normalized、sorani_normalize、大写。Elasticsearch附带了一个小写的内置规范器。对于其他形式的规范化，需要自定义配置。
以下是一个示例，演示如何创建一个自定义规范化器：

PUT index
{
  "settings": {
    "analysis": {
      "char_filter": {
        "quote": {
          "type": "mapping",
          "mappings": [
            "« => \"",
            "» => \""
          ]
        }
      },
      "normalizer": {
        "my_normalizer": {
          "type": "custom",
          "char_filter": ["quote"],
          "filter": ["lowercase", "asciifolding"]
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "foo": {
        "type": "keyword",
        "normalizer": "my_normalizer"
      }
    }
  }
}

在上述示例中，我们创建了一个名为my_normalizer的自定义规范化器，使用了字符过滤器quote和过滤器lowercase、asciifolding。然后，我们将这个规范化器应用于索引中的foo字段。

你可能感兴趣的:(#,elasticsearch,学习,大数据,es,非关系型数据库)

Flink提交任务命令执行错误NoSuchMethodError 500佰 Flink线上问题处理方案 flink 大数据云计算运维
#Flink常见故障#大数据#生产环境真实案例#Flink#流式计算#流批一体#整理#经验总结说明：此篇总结Flink常见故障案例处理方案结合自身经历总结不易+关注+收藏欢迎留言更多Flink案例汇总方案解决方案：Flink业务常见故障多案例解决方案Flink提交任务命令执行错误NoSuchMethodError问题使用flinkrun命令提交任务时报错，报错如下：java.lang.NoSuch
毕设开源深度学习图像搜索算法-图像搜索引擎(源码分享) knooor 毕业设计毕设大数据
文章目录0简介1前言2图像检索介绍(1)无监督图像检索(2)有监督图像检索3图像检索步骤4应用实例最后0简介今天学长向大家分享一个毕业设计项目毕业设计深度学习图像搜索算法-图像搜索引擎(源码分享)项目运行效果：毕业设计深度学习图像搜索算法-图像搜索引擎项目分享:见文末!1前言图像检索：是从一堆图片中找到与待匹配的图像相似的图片，就是以图找图。网络时代，随着各种社交网络的兴起，网络中图片，视频数据每
毕业设计大数据B站数据分析可视化系统 knooor 毕业设计毕设大数据
文章目录0前言1项目运行效果2设计原理数据处理方案可视化呈现方案综合得分计算指标综合得分漏斗图游客画像完成度三连排行榜点赞、投币、收藏与白嫖的比例分析3最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天
毕设分享基于大数据的b站数据分析 knooor 毕业设计毕设大数据
文章目录0数据分析目标1B站整体视频数据分析1.1数据预处理1.2数据可视化1.3分析结果2单一视频分析2.1数据预处理2.2数据清洗2.3数据可视化3文本挖掘（NLP）3.1情感分析0数据分析目标今天向大家介绍如何使用大数据技术，对B站的视频数据进行分析，得到可视化结果。项目运行效果：毕业设计基于大数据的b站数据分析项目分享:见文末!1B站整体视频数据分析分析方向：首先从总体情况进行分析，之后分
网络安全学习路线图（2025版详解）程序员羊羊 web安全学习安全运维密码学
近期，大家在网上对于网络安全讨论比较多，想要学习的人也不少，但是需要学习哪些内容，按照什么顺序去学习呢？其实我们已经出国多版本的网络安全学习路线图，一直以来效果也比较不错，本次我们针对市场需求，整理了一套系统的网络安全学习路线图，供大家学习参考。希望大家按照路线图进行系统学习不仅可以更高效的完成上岸，还能够系统化学习，提升自己的后期竞争力。第一阶段：数通安全Windows系统安全1.企业资产安全规
STLG_09_01_程序设计C++语言 - 概述与环境搭建魔都天健 c++开发语言笔记
C++是一种功能强大的编程语言，广泛应用于系统开发、游戏设计和高性能计算等领域。它继承了C语言的高效性，同时增加了面向对象的特性，如封装、继承和多态。学习C++需要先搭建开发环境，通常使用集成开发环境（IDE）如VisualStudio或Code::Blocks，安装相应的编译器（如GCC）后，即可开始编写和运行C++代码，开启编程之旅。一、简介C++是一种静态类型的、编译式的、通用的、大小写敏感
几行Python代码，轻松获取美股阿里巴巴的交易数据! Python资深程序员 Python Python
学Python可以干很多事情，比如爬虫，数据分析，机器学习，但是有一个非常小众的分支，不仅结合了两大高薪行业，而且还薪水非常诱人，就是量化金融岗位。目前Python已经是金融行业最低的一个门槛，几乎所有从事金融证券行业的人都要学会Python。今天给大家分享如何用Python获取美股的交易数据！Python资源共享群：626017123数据获取是数据分析的第一步，找不到可靠、真实的数据，数据分析无
Error: listen tcp 127.0.0.1:11434: bind: Only one usage of each socket address MurphyStar tcp/ip 网络协议网络
原因：Windows中默认安装Ollama会开机启动。因此才会在ollamaserve时报错如下：Error:listentcp127.0.0.1:11434:bind:Onlyoneusageofeachsocketaddress(protocol/networkaddress/port)isnormallypermitted.解决方法：退出Ollama:快捷键win+x打开任务管理器：启动应用
一次bilibili的漏洞扫描完全之人技巧安全
拿到bilibili的shell，到时为所欲为，嘿嘿嘿。nmap命令：nmap-Obilibili.com；没。nmap-A-T4bilibili.com；有！以下是对该SSL/TLS扫描结果的深技术分析及安全加固建议：1.协议与加密套件分析观察结果markdown复制-协议版本:TLSv1.2(100%)-支持加密套件:*ECDHE-RSA-AES256-GCM-SHA384(前向保密)*DHE
k8s二进制集群之ETCD集群部署 smart_ljh k8s二进制搭建 kubernetes etcd 容器
下载etcd安装包创建etcd配置文件准备证书文件和etcd存储目录ETCD证书文件安装（分别对应指定节点）创建证书服务的配置文件启动etcd集群验证etcd集群状态继续上一篇文章《k8s二进制集群之ETCD集群证书生成》下面介绍一下etcd证书生成配置。下载etcd安装包https://github.com/etcd-io/etcd/releases/tag/v3.5.9https://gith
04树 + 堆 + 优先队列 + 图（D1_树（D10_决策树）） Java丨成神之路 06数据结构与算法数据结构算法
目录一、引言二、算法原理三、算法实现四、知识小结一、引言决策树算法是一种常用的机器学习算法，可用于分类和回归问题。它基于特征之间的条件判断来构建一棵树，树的每个节点代表一个特征，每个叶节点代表一个类别或回归值。决策树算法具有简单、易于理解和解释的特点，且在处理大规模数据时具有较高的效率。本文将介绍决策树算法的基本原理，并提供了Java代码示例来说明其实现过程。二、算法原理决策树算法基于“分而治之”
【Linux】--- 制作一个简易的shell 为快乐起舞 Linux linux
制作一个简易的shell一、设置命令行二、获取输入的命令第一步和第二步代码细节剖析三、命令行字符串分割第三步细节剖析四、执行命令五、代码汇总及演示想要制作一个简易的shell，过程分为四步一、设置命令行#include#include#include#include#include#include#include#defineSIZE512#defineSEP""#defineZERO'\0'#d
kamailio在ESXI的虚拟机中的并发量预估狂爱代码的码农 VOIP那些事 kamaimio
基于ESXi虚拟机的KamailioSIP信令转发性能评估1.硬件配置分析组件配置CPUIntelXeonE5-2673v4×2（双路，共40核/80线程，2.3~3.5GHz）内存2166MHzDDR4，32GB×4（共128GB）存储SAS硬盘RAID5（读写性能较低，适合日志存储）虚拟化平台VMwareESXi虚拟机配置8核vCPU，16GB内存2.性能评估方法(1)CPU性能物理CPU：E
基于Kamailio的VoIP管理系统方案（技术栈：MySQL + Redis + Gin + Vue.js 狂爱代码的码农 VOIP那些事 kamaimio
基于Kamailio的VoIP管理系统方案（技术栈：MySQL+Redis+Gin+Vue.js）1.系统架构核心组件：Kamailio：处理SIP信令、路由、负载均衡、安全过滤。MySQL：存储用户数据、CDR（呼叫记录）、费率规则、系统配置。Redis：缓存用户会话、黑白名单、实时计费锁、高频操作临时数据。Gin（Go语言后端）：提供RESTfulAPI，处理业务逻辑和数据库交互。Vue.js
现代OpenGL学习笔记五：变换不想不努力的菜菜 OpenGL
上篇笔记中学习了给图形添加纹理，并且第一次接触到3D物体，并且应用一定的图形旋转，本篇将继续学习变换，从而将静态的物体可以移动，并将不懂的地方进行说明记录。推荐参考原文：https://learnopengl-cn.github.io/https://learnopengl-cn.github.io/01Gettingstarted/07Transformations/变换尽管我们现在已经知道了如
Windows平台下C++串口通信 YxVoyager windows c++
文章目录通信基础串口通信串口UART字符帧波特率WindowsAPI串口通信CreateFileSetupCommReadFileWriteFileCloseHandleGetCommStateBuildCommDCBSetCommStateSetCommTimeoutsClearCommErrorPurgeCommSetCommMaskWaitCommEventWaitForSingleObje
在群晖上搭建基于 PostgreSQL 的 Joplin Server Ox119O1 postgresql docker 数据库
前言笔者一直想找一款能代替MWeb的跨平台工具，由于工作的变更，很多Mac上好用的软件在Windows平台直接无法使用……反正探索了一圈感觉Joplin看起来是不错的，笔记功能和MWeb很像，跨平台，并且笔记数据可以本地保存。恰好笔者近日购买了一台群晖的NAS，一切刚刚好，如同量身定制美滋滋。JoplinServer介绍既然决定将笔记存在本地自己的NAS上面，Joplin提供的JoplinClou
教妹学 Java：异常处理机制沉默王二 Java程序员进阶之路 java 异常处理机制
“二哥，今天就要学习异常了吗？”三妹问。“是的。只有正确地处理好异常，才能保证程序的可靠性，所以异常的学习还是很有必要的。”我说。“那到底什么是异常呢？”三妹问。“异常是指中断程序正常执行的一个不确定的事件。当异常发生时，程序的正常执行流程就会被打断。一般情况下，程序都会有很多条语句，如果没有异常处理机制，前面的语句一旦出现了异常，后面的语句就没办法继续执行了。”“有了异常处理机制后，程序在发生异
PostgreSQL 约束 lsx202406 开发语言
PostgreSQL约束引言在数据库设计中，约束是确保数据完整性和一致性的关键工具。PostgreSQL，作为一款功能强大的开源关系型数据库管理系统，提供了丰富的约束类型来满足不同的数据库设计需求。本文将详细介绍PostgreSQL中的各种约束，包括其定义、用途和实现方法。一、约束概述约束是数据库表中定义的一组规则，用于限制表中数据的插入、更新和删除操作。这些规则确保数据满足特定的条件，从而维护数
OpenGL学习笔记8——变换 lxbhahaha #OpenGL opengl glsl cpp 图形学
OpenGL学习笔记8——变换1概念2应用变换2.1GLM2.2给四边形应用变换1概念基本上都是线性代数的知识，矩阵的运算、向量的运算。就不多写了，挑几个关键点的记一下。点乘，向量和向量之间做点乘，结果是一个标量。点乘是通过将对应分量逐个相乘，然后再把所得积相加。相当于求投影。用来计算角度很方便，可能用在光照的计算。叉乘，向量和向量之间做叉乘，结果还是一个向量，并且这个向量会垂直于两个向量所在的平
Linux - 参考文档 HZero.chen Linux 个人成长 linux 运维服务器
内核版本https://kernelnewbies.org/LinuxChanges查看内核版本变化邮件列表http://vger.kernel.org/vger-lists.htmlLinux邮件列表1https://lore.kernel.org/lists.htmlLinux邮件列表2http://vger.kernel.org/vger-lists.html#linux-blockLinu
《算法零基础100讲》(第61讲) 前缀和(五) 二维前缀和英雄哪里出来《算法零基础100讲》算法线性代数矩阵前缀和二维前缀和
文章目录一、概念定义1、预处理2、预处理代码实现3、查询4、查询代码实现二、题目描述三、算法详解四、源码剖析五、推荐专栏六、习题练习一、概念定义有关一维前缀和的概念，在《算法零基础100讲》(第57讲)前缀和(一)线性前缀和入门中已经较为清晰的阐述，今天我们来学习二维的情况。1、预处理问题的起源就是对一个矩阵，如何在最快的时间内，求出它的某个子矩阵的和。我们首先把问题简化，对于一个n×mn
30分钟入门CompletableFuture并发工具使用 LUCIAZZZ java spring boot 并发异步多线程
快速学习基本方法，然后30分钟直接学会CompletableFuture的使用异步处理：supplyAsync（）分析Supplier接口首先我们看看Supplier接口这是一个函数式接口，没有入参，只有一个返回值我们这段代码会在另一个线程执行然后returnpublicclassMain{publicstaticvoidmain(String[]args){CompletableFuturecf
手写单例模式 LUCIAZZZ 单例模式 java 开发语言 spring boot
饿汉式加载模式（线程安全）类一加载就创建对象，这种方式比较常用优点：线程安全，没有加锁，执行效率高缺点：不是懒加载，类初始化的时候就加载，浪费内存空间packagecom.example.threadpool.Singleton;publicclassSingleton1{//私有化构造方法privateSingleton1(){}//定义一个静态变量指向自己类型privatefinalstati
【漫话机器学习系列】079.超参数调优（Hyperparameter Tuning） IT古董漫话机器学习系列专辑机器学习深度学习人工智能
超参数调优（HyperparameterTuning）是机器学习中优化模型性能的重要步骤之一。超参数是模型在训练之前设定的参数，而不是通过训练数据学习到的参数。正确地选择超参数可以显著提高模型的预测能力，反之，错误的超参数选择可能会导致过拟合、欠拟合或训练过程缓慢。1.超参数的定义超参数是控制学习过程的外部参数，不同于模型参数（例如权重和偏置），超参数不通过训练过程自动优化。常见的超参数包括：学习
Swift架构概述 KKSamoyed Swift OpenStack swift
SwiftArchitecturalOverview（Swift架构概述）ProxyServerTheProxyServerisresponsiblefortyingtogethertherestoftheSwiftarchitecture.Foreachrequest,itwilllookupthelocationoftheaccount,container,orobjectinthering(
【漫话机器学习系列】054.极值（Extrema） IT古董漫话机器学习系列专辑机器学习人工智能
极值（Extrema）定义极值是数学分析和优化问题中的一个核心概念，指函数在某个定义域内取得的最大值或最小值。根据极值的性质，可以将其分为两类：局部极值（LocalExtrema）：函数在某点附近的最大值或最小值。全局极值（GlobalExtrema）：函数在整个定义域内的最大值或最小值。分类局部极大值（LocalMaximum）：若在点x=a附近存在某邻域，使得对任意x在该邻域内，满足f(x)≤
自学黑客的11个步骤，零基础入门到精通，收藏这一篇就够了～小羊没烦恼～ java 数据库开发语言人工智能 intellij-idea 安全 web安全
黑客攻防是一个极具魅力的技术领域，但成为一名黑客毫无疑问也并不容易。你必须拥有对新技术的好奇心和积极的学习态度，具备很深的计算机系统、编程语言和操作系统知识，并乐意不断地去学习和进步。如果你想成为一名优秀的黑客，下面是10种最重要的基础条件，请认真阅读：1.了解黑客的思维方式我们生活中用到的网站、软件等，都是由程序员编写的代码构成的。这些代码在设计的过程中，都是基于一种正向的逻辑进行的，为了实现某
Codeforces Educational Codeforces Round 170 (Rated for Div. 2) 关于SPFA它死了 Codeforces 算法 c++
A-TwoScreens大意：给两个字符串，每次在两个空子符串进行两种操作1、字符串末尾加一个任意字母2、一个字符串全部复制给另一个字符串求得到给定的两个字符串的最小操作数思路：看最前面有多少相等即可当时想多了。。。代码：#includeusingnamespacestd;#defineintlonglongconstintN=2e5+10,INF=0x3f3f3f3f;constintmod=1
selenium.common.exceptions.WebDriverException: Message: unknown error: net::ERR_CONNECTION_CLOSED 芝麻团坚果 chrome 爬虫
https://www.cnblogs.com/lfri/p/10542797.html参照这篇重装chromedriver根据chromeF12修改代码里的headers设置
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p