啊桑桑

Elasticsearch 实战应用系列

Chat专栏专题电子书

开始创作

Elasticsearch 实战应用系列

桃花惜春风

CSDN博客专家。曾负责大数据平台日TB级实时高并发数据流架构，曾人工智能创业团队大数据开发组负责人，万方搜索引擎负责人，近几年专注Elasticsearch底层技术，高级Elasticsearch工程师。

查看本场Chat

本篇文章我们主要讲述一些生产上的简单实战场景。主要涉及一些我们常见的一些应用，技术难点虽然不高，但很实用。文章共分九章，并且每一章都是相互独立的，读者可根据自己情况选读。

Elasticsearch 作为当下最火的搜索引擎，可以说是继 Hadoop、Spark 之后，第三代红利，互联网行业刚需技术。Elasticsearch 讲起来有太多的东西，每次去官网查找资料都会看到未知的东西，只有不断的学习才能不断的进步，才能不被新鲜血液超越。有幸接触 Elasticsearch 的时间比较早，从 2.x 版本开始到现在 6.x 版本，Elasticsearch 迭代更新特别快，无论你是初学者还是已经接触 Elasticsearch 有段时间的开发人员，我都建议去官网学习，有问题找官网，最后你会发现，你的问题都能在官网找到答案。

由于篇幅原因，本篇文章会尽量讲清楚文章的核心知识点，对于文章中有不懂的地方可以随时交流。作者现在已经在考虑写一个关于 Elasticsearch 深入浅出的达人课，达人课前半部分针对初学者讲述一些基础性东西，后半部分针对开发运维人员讲述内部原理和优化的进阶知识。

- - 一、集群安装
    - 安装 Java
    - 自动安装
    - 手动安装
    - 配置文件
      - elasticsearch.yml
      - jvm.options
    - 测试
    - 本章小结
  - 二、插件安装
    - IK 分词器
      - 自动安装
      - 手动安装
      - 配置
      - 注意事项
      - Mapping 中使用 IK
    - pinyin 分词器
      - 自动安装
      - 手动安装
    - stconvert 分词器
      - 自动安装
      - 手动安装
      - 说明
    - 本章小结
  - 三、索引模版
    - 使用场景
    - 示例
    - 本章小结
  - 四、单机多实例
    - 配置方法
    - 自动安装方式
    - 手动安装方式
    - 本章小结
  - 五、冷热数据分离
    - 冷热分离
    - 读写分离
    - 手动分配
    - 查询分离
    - 本章小结
  - 六、外网访问 ES
    - 访问 AWS
    - 访问虚拟机
    - 本章小结
  - 七、滚动升级集群
    - 停机升级
    - 在线升级
    - 本章小结
  - 八、线上 reindex
    - 索引别名
    - reindex
    - 本章小结
  - 九、集群监控
    - 本章小结
  - 总结

一、集群安装

这里不介绍单机版安装，不过Elasticsearch单节点一样可以实现基本功能。

安装 Java

sudo apt-get install openjdk-8-jre

说明：Elasticsearch 从 5.x 版本开始使用 JDK 8，低版本 JDK 是无法启动的。

自动安装

这里拿 6.4.2 版本举例。

下载：

curl -L -O https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.4.2.deb

安装：

sudo dpkg -i elasticsearch-6.4.2.deb

启动：

systemctl start elasticsearch.service

说明：这里使用自动安装是要安装在 root 用户下的，可能有些人有一些误解，Elasticsearch 并非不能安装在 root 用户下，只是不能以 root 用户去启动。这里使用的启动方式默认是以 Elasticsearch 用户去启动，也可以自定义启动用户（/usr/lib/systemd/system 路径下修改 elasticsearch.service）。如果不想把 Elasticsearch 安装在 root 下，下面会介绍手动安装到指定用户下。

参考：

https://www.elastic.co/guide/en/elasticsearch/reference/6.4/deb.html

手动安装

有些使用场景让我们不得不使用手动安装这种方式，比如机器处在内网环境。

创建好自己想要安装 Elasticsearch 的用户，并进入该用户下你想要安装的路径下。

下载：

wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.4.2.tar.gz

解压：

tar -xzf elasticsearch-6.4.2.tar.gz

启动：

bin/elasticsearch

或（长期运行）：

bin/elasticsearch  -d

配置文件

前面介绍了两种安装方式，可以根据自己喜欢选择。但要启动服务，还需要更改一些基础配置。

如果使用的是自动安装方式，配置文件在 /etc/elasticsearch 下，安装路径为 /usr/share/elasticsearch。

如果使用的是手动安装方式，配置文件在你安装路径的 conf 文件夹下。

好，配置文件路径我们找到了，现在开始修改配置。

elasticsearch.yml

##集群名，现版本的ES已经不是通过集群名来发现节点了
cluster.name: elasticsearch

##节点名，每个节点不相同即可
node.name: node-1

##是否有选举成Master的资格
node.master: true

##是否作为数据节点
node.data: true

##数据存储路径，注意保证挂在正确磁盘上
path.data: /var/lib/elasticsearch

##日志路径
path.logs: /var/log/elasticsearch

##本机地址
network.host: node-1

##发现Master列表，只写有Master资格的节点即可，注意空格
discovery.zen.ping.unicast.hosts: ["192.168.56.101", "192.168.56.102", "192.168.56.103"

jvm.options

## 分配给ES内存，生产上一般设置不大于32
-Xms31g
-Xmx31g

测试

http://node-1:9092

本章小结

这一章主要介绍了关于 Elasticsearch 的两种安装方式以及一些必要的基础配置。关于本章有什么问题可以在读者圈交流。下一章我们详细介绍 Elasticsearch 的常用插件安装。

二、插件安装

本章主要介绍 Elasticsearch 的一些常用插件安装，主要包括 IK、pinyin、stconvert。同样介绍自动安装和手动安装两种方式。下面介绍的均为单节点的安装方式，实际应用中必须所有节点全部安装成功。篇幅比较啰嗦，主要是照顾一些初学者，对于插件安装已经很熟练的可以越过此章。

IK 分词器

相信使用 Elasticsearch 的小伙伴对 IK 一点都不陌生，目前大多数需要分词的场景都是使用 IK 来处理的。

自动安装

进入到你的 Elasticsearch 安装路径下安装：

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.3.0/elasticsearch-analysis-ik-6.3.0.zip

注意：

版本号要与 ES 对应。
安装完之后需要重启节点。

手动安装

进入到你的 Elasticsearch 安装路径下的 plugins 文件夹中：

创建 IK 文件夹

mkdir ik

下载

选择合适版本安装包：

https://github.com/medcl/elasticsearch-analysis-ik/releases

解压到 IK 目录下
重启节点

配置

自动安装方式配置文件路径：

/etc/elasticsearch/analysis-ik

手动安装方式配置文件路径：

/ELASTICSEARCH_PATH/plugins/ik/config

IKAnalyzer.cfg.xml




    IK Analyzer 扩展配置
    
    custom/mydict.dic;custom/single_word_low_freq.dic
     
    custom/ext_stopword.dic
     
    location
     
    http://xxx.com/xxx.dic

注意事项

请确保你的扩展词典的文本格式为 UTF8 编码，每个词以换行符相隔。
IK 分词从 5.0.0 版本开始使用 ik_smart 和 ik_max_word 两种分词方式。

ikmaxword

表示最细粒度拆分。优点是查询效果比较好。缺点是会产生很多碎片，对于大文本字段不建议使用 ik_max_word。

例：

将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”，会穷尽各种可能的组合。

ik_smart

表示最粗粒度拆分，优点是降低了索引存储。缺点是查询效果不好。

例：将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”。这个时候输入“中华”是匹配不到的，只能匹配“中华人民共和国”或“国歌”。

Mapping 中使用 IK

"content": {

   "type": "text",

   "analyzer": "ik_max_word",              ##索引分词

   "search_analyzer": "ik_max_word"。      ##查询分词

 }

想了解 IK 分词与其他分词组合使用，建立自定义分词器的可以去我博客有相关文章。

关于热更新词库，medcl 大神讲的很清楚，需要的小伙伴可以参考一下。

参考：https://github.com/medcl/elasticsearch-analysis-ik

pinyin 分词器

对于很多的搜索场景，用户输入的有时候并非汉字，可能是拼音或者拼音首字母，这个时候我们同样要匹配到数据，就需要引入 pinyin 分词器。

自动安装

进入到你的 Elasticsearch 安装路径下：

安装

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v6.3.0/elasticsearch-analysis-pinyin-6.3.0.zip

注意：

版本号要与 ES 对应。
安装完之后需要重启节点。

手动安装

进入到你的 Elasticsearch 安装路径下的 plugins 文件夹中

创建 pinyin 文件夹

mkdir pinyin

下载

选择合适版本安装包：

https://github.com/medcl/elasticsearch-analysis-pinyin/releases

解压到 pinyin 目录下
重启节点

参考：https://github.com/medcl/elasticsearch-analysis-pinyin

stconvert 分词器

stconvert 主要是用来简体繁体字互换使用的，主要是针对港澳的一些用户使用。

自动安装

进入到你的 Elasticsearch 安装路径下安装：

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-stconvert/releases/download/v6.3.0/elasticsearch-analysis-stconvert-6.3.0.zip

注意：

版本号要与 ES 对应。
安装完之后需要重启节点。

手动安装

进入到你的 Elasticsearch 安装路径下的 plugins 文件夹中

创建 stconvert 文件夹

mkdir  stconvert

下载

选择合适版本安装包：

https://github.com/medcl/elasticsearch-analysis-stconvert/releases

解压到 pinyin 目录下
重启节点

说明

s2t ：将字符从简体中文转换为繁体中文
t2s ：将繁体中文中的字符转换为简体中文

参考：https://github.com/medcl/elasticsearch-analysis-stconvert

本章小结

本章主要介绍了 Elasticsearch 常用的插件安装。当然还包括很多没提到的。像 sql、hanlp、jieba 等等。新版本的 x-pack 已经支持 sql，有需要的同学可以在读者圈交流。

三、索引模版

在我们实际应用中某些场景不免要使用索引模版，其实模版是一把双刃剑，用得好会给我们带来很大方便，用不好一样会成为我们的负担。

使用场景

在 Elasticsearch 我们都知道 Mapping 属于集群状态信息，是由 Master 节点来维护的，所以一旦 Mapping 发生变化，就要请求等待 Master 处理。这个时候写入阻塞。所以我们一般设置 dynamic=true 来禁止动态生成新字段，这样即使写入一个陌生字段也不会对 Mapping 进行修改，只是该文档插入失败。

但是，有另外一种场景，就像日志类的索引，一般我们需要每天，甚至更细粒度的创建索引。这种情况下我们一般都会选择使用模版来预先制定好索引的 Mapping。这也是模版使用的主要场景，但有些负载比较大的集群，要考虑慎用。因为我们在使用模版的场景一般是每天的凌晨或者某个时间点，按照模版建立新的索引，这也就导致了某个时间点会有大量新的 index 生成，这个时候集群的阻塞期可能会很长。

对于这种场景给出两种解决方案：

不使用模版，在业务压力比较小的时间点用脚本预建第二天的索引。
使用模版，但从业务场景考虑，不集中在凌晨集中建立新索引。

示例

创建模版

PUT _template/server-log         ##指定模版名：server-log

{

  "template" : "server*",        ##匹配所有以server开头的索引名：server*

  "settings": {                  ##指定索引的setting，索引创建后可以修改

    "index.number_of_replicas": "1",

    "index.number_of_shards": "5",

    "index.translog.flush_threshold_size": "512mb",

    "index.translog.sync_interval": "60s",

    "index.codec": "best_compression"

      },

  "mappings": {                   ##指定索引mapping，索引创建后不可修改

    "doc": {

      "dynamic": "strict",

      "_all": {

        "enabled": false

      },

        "properties": {

        "@timestamp": {

            "type": "date"

        },

       "logdate": {

            "type": "date",

            "format": "yyyyMMdd||yyyy-MM-dd||yyyy/MM/dd||yyyyMMddHHmmss||yyyy-MM-dd HH:mm:ss||yyyy/MM/dd HH:mm:ss||yyyy-MM-dd'T'HH:mm:ss'Z'||yyyy/MM/dd'T'HH:mm:ss'Z'||yyyy/MM/dd HH:mm:ss'Z'||yyyy-MM-dd HH:mm:ss'Z'"

        },

        "message": {

          "norms": false,

          "type": "keyword"

        }

      }

    }

  }

}

本章小结

本章我们讲述了关于索引模版的使用和使用模版会产生哪些弊端以及解决方案，大家在使用的过程中有什么问题可以随时交流。

四、单机多实例

我们在刚刚接触 Elasticsearch 的时候，网上铺天盖地地说 “Elasticsearch 只能分配 32G，分再多也没用啦，甚至会更慢！” 等等这些。可能很多人只是知其然不知其所以然。这里给大家分享一个（链接），这里详细讲述了，为什么分配给 Elasticsearch 内存不能超过 32G。

回过头来，为什么不能分配超过 32 不是本章的重点，你只要记得有这么个事就行了。一般情况下我们分给 Elasticsearch32 个 G，还需要留给 Lucene32 个 G，所以一个节点 64G 内存足够我们使用了。但实际情况是，像笔者之前所在的公司，有自己专门的机房，具体有多少服务器我没了解过，光我们项目就有 1000 多台服务器。服务器越多维护成本越高，所以统一都是采购的高配服务器。这种情况下一台服务器的配置肯定远远高于 64G，这样就造成了大量的资源浪费。但是 Elasticsearch 并非像 kafka 那样一个 broker 就是一台机器，它可以在一台机器上启动两个甚至更多实例，这样就可以做到资源的充分利用。

配置方法

首先你要了解多个实例的概念
配置多实例一个安装包即可，但每个实例要建立不同的配置文件

下面按照之前讲述的手动和自动两种安装方式分别讲解。

自动安装方式

自动安装方式的配置文件默认在 /etc/elasticsearch 下，但这只是单实例情况，我们要对每个实例有单独的配置文件。

1. 建立两个文件夹存放两个实例的配置文件：

mkdir /etc/elasticsearch/example-1
mkdir /etc/elasticsearch/example-2

2. 将以下 4 个配置文件分别拷贝到两个目录下：

elasticsearch.yml
jvm.options
log4j2.properties
scripts

3. 分别修改两个目录下的 elasticsearch.yml：

##集群名一致
cluster.name: elasticsearch

##节点名不一致
node.name: node-1

##不建议一台机器多个实例同时都可以选Master，一般Master需要单台机器
node.master: true

##是否作为数据节点
node.data: true

##数据存储路径，每个实例要对应不同的路径
path.data: /var/lib/elasticsearch

##日志路径，每个实例要对应不同的路径
path.logs: /var/log/elasticsearch

##本机地址，这个不用改，因为还是在一台机器上ip都一样
network.host: node-1

##指定外部端口号，每个实例不一致，一般设置9200、9201...，必须显式配置
http.port: 9200

##指定transport端口号，每个实例不一致，一般设置9300、9301...，必须显式配置
transport.tcp.port: 9300

##发现Master列表，注意不同实例以端口号区分
discovery.zen.ping.unicast.hosts: ["192.168.56.101:9300", "192.168.56.102:9301", "192.168.56.103"

##单机上最大允许运行的ES实例个数，默认为1
node.max_local_storage_nodes: 2 

##禁止副本分片分配到同一个机器
cluster.routing.allocation.same_shard.host: true

4. 其他三个配置文件可根据实际情况自行修改

5. 复制启动文件

cd /usr/lib/systemd/system/
cp elasticsearch.service elasticsearch-example1.service 
cp elasticsearch.service elasticsearch-example2.service

6. 修改启动文件

##分别指定两个实例的配置文件路径和pid文件路径，目录需要提前创建
Environment=ES_PATH_CONF=/etc/elasticsearch/example-1
Environment=PID_DIR=/var/run/elasticsearch/example-1

7. 启动

systemctl start elasticsearch-example1.service 
systemctl start elasticsearch-example2.service

手动安装方式

第 1、2、3、4 步同上
启动，注意目录文件权限

./elasticsearch -d -Des.path.conf=/etc/elasticsearch/example-1 -p /var/run/elasticsearch/example-1/example1.pid
./elasticsearch -d -Des.path.conf=/etc/elasticsearch/example-2 -p /var/run/elasticsearch/example-1/example2.pid

本章小结

本章我们讲述了单机多实例的配置方法。关于本章有疑问的可以在读者圈交流。

五、冷热数据分离

冷热数据呢是我们很多业务场景都会遇到的问题，数据分离其实是分为冷热分离和读写分离。本章主要从两个场景出发，谈谈具体的解决方案。

冷热分离

我们在使用 Elasticsearch 过程中经常会遇到一种场景，每天会有新的数据不停的在写入，并且历史数据期限很长，可能是很久很久以前的老数据，对于这些老数据查询请求非常低。这种情况很容易导致负载不均衡的情况。我们可以通过以下操作方案来解决这一问题。

1. 修改配置 elasticsearc.yml

在热数据节点上配置：

node.attr.zone: hot

在冷数据节点上配置：

node.attr.zone: stale

注：5.0 版本开始节点属性配置必须加上前缀 node.attr。

2. 新建索引或创建模版时加上索引settings，表明新建的 index 指向 hot 节点，这样新的热数据的分片就只会存储在 hot 属性的节点上。

"settings" : {
  "index.routing.allocation.include.zone" : "hot"
}

3. 定期更新索引属性 hot 为 stale，这样索引数据会从 hot 节点转移到 stale 节点上成为冷数据。

PUT /index_name/_settings
{
   "index.routing.allocation.include.zone" : "stale"
}

4. [选] hot 节点使用高配，stale 节点低配。

读写分离

上面的冷热分离操作解决了我们冷热数据的问题，但是还有一种场景，我们每天写入热数据，同时热数据的查询请求又特别高，这样读写请求全部都集中在 hot 节点空间上了，stale 几乎是闲置状态，这同样不是我们想看到的。

修改配置 elasticsearc.yml

指定节点属性：

cluster.routing.allocation.awareness.attributes：zone

指定强制分配分片规则：

cluster.routing.allocation.awareness.force.zone.values: zone1,zone2,zone3

说明：

这里需要节点必须指定 zone（也可以是其他任何名称）属性为 zone.values 其中一个值，否则节点是分配不到分片的。
此配置含义是相同的副本分片是不会分配在 zone 属性相同的节点上。就是说两个副本是不会全部分配到 zone1 上。

手动分配

如果上述的冷热分离和读写分离操作依然没有达到我们想要的效果的话，我们可以尝试手动分配分区。

POST /_cluster/reroute
{
    "commands" : [
        {
            "move" : {
                "index" : "test", "shard" : 0,
                "from_node" : "node1", "to_node" : "node2"
            }
        },
        {
          "allocate_replica" : {
                "index" : "test", "shard" : 1,
                "node" : "node3"
          }
        }
    ]
}

参考：

https://www.elastic.co/guide/en/elasticsearch/reference/current/cluster-reroute.html

查询分离

如果如果如果上述还是没法实现我们的要求，我们一样可以通过查询来分担集群的压力。但是重要的事说三遍（如果），这种方式要慎用，用不好的话很有可能导致查询数据不全或查不到数据。

指定节点进行查询：

POST /_search?preference=_only_nodes:zone:stale
{
    "query": {
        "match": {
            "title": "elasticsearch"
        }
    }
}

参考：

https://www.elastic.co/guide/en/elasticsearch/reference/current/search-request-preference.html?q=preference

本章小结

本章我们分两种场景介绍了关于数据的冷热分离和读写分离，以及备选方案手动分配和查询分离。最终目的还是实现集群的有效负载，避免资源的浪费。机架感知的实现其实也是同样的道理，让副本分片分布在不同的机架上。

六、外网访问 ES

在测试环境和生产环境中，Elasticsearch 集群都不会再我们本机上，所以远程连接 Elasticsearch 是必然的。内网还好说，如果是外网的话会涉及到一些问题。本章从两种场景探讨。

访问 AWS

有些公司会把服务器部署在 AWS 上。用过 AWS 的小伙伴都知道，AWS 的网络是分内网和外网的。这个时候如果我们在 AWS 内部访问 Elasticsearch 要指定内网 IP，如果是在外网访问 Elasticsearch，就要指定外网 ip。同时配置文件要配置内网 IP。如果使用主机名访问，服务器 hosts 映射内网 IP，客户端 hosts 映射外网 IP。

## 内网ip或内网主机名
network.host: node-1

访问虚拟机

对于虚拟机中的 Elasticsearch 访问，桥接模式不用说了，IP 和端口都是独立的，直接访问就行了。如果是 NAT 模式，对外只开放物理机的 IP，这个时候要访问 Elasticsearch 需要做如下配置：

elasticsearc.yml

network.host: node-3
http.host: 0.0.0.0

说明：

node-3 在虚拟机 hosts 文件映射虚拟机 IP
node-3 在本地开发机 hosts 文件映射远程物理机的 IP
远程访问需指定虚拟机映射的端口号

还有一种简单粗暴的方法：

network.host: 0.0.0.0

不过这种方式只能启动单个节点。

本章小结

本章我们介绍如何在外网访问 AWS 和虚拟机中的 Elasticsearch。对于本章内容有什么问题可以在读者圈交流。

七、滚动升级集群

集群升级是我们生产上的常见需求了，其实我们不要走入一个误区，这里的集群升级不单单指的是 Elasticsearch 版本的升级，实际上操作系统和硬件系统升级，这些都可以认为是集群升级，这些操作都需要集群机器重启。

我们都知道重启节点有可能会带来分片重新分配操作，那么如果重新分配的数据量比较大的话，集群负担会非常大。所以对于集群升级我们一般有两种选择。

停机升级

顾名思义，把 Elasticsearch 集群所有节点全部停掉，然后该升级版本升级版本，该升级系统升级系统，这些都升级完之后，重启集群就可以了。这种方式固然简单好用，但弊端大家都知道，离线停机是生产上所不允许的。

在线升级

生产上在线升级是我们常用的解决方案，Elasticsearch 可以实现零停机在线升级。下面以升级 Elasticsearch 版本详细介绍：

1. 禁用集群分片分配操作，如果可能最好同时停掉数据的写入和修改请求。

PUT _cluster/settings
{
  "persistent": {
    "cluster.routing.allocation.enable": "none"
  }
}

2. 停止一个节点服务

sudo systemctl stop elasticsearch.service

3. 执行升级操作

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v6.4.2/elasticsearch-analysis-pinyin-6.4.2.zip

注意：

这里自动安装会替换原有的安装包，但配置文件不会变
安装新版本后需要重新安装对应版本的插件

4. 删除插件

../bin/elasticsearch-plugin remove analysis-ik

5. 安装新插件

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.4.2/elasticsearch-analysis-ik-6.4.2.zip

6. 启动服务

sudo systemctl start elasticsearch.service

7. 开启分片分配

PUT /_cluster/settings
{
    "transient" : {
        "cluster.routing.allocation.enable" : "all"
    }
}

8. 至此单个节点升级完毕，等待集群恢复绿色之后，重复上述步骤，以完成所有节点升级。

本章小结

本章我们主要介绍了 Elasticsearch 的升级操作，分停机和在线两种方式。对于本章内容如果有疑问，可以在读者圈交流。

八、线上 reindex

大家都知道，Mapping 里的信息一旦创建是不能更改的，只能是重新建立索引指定新 Mapping。但是在线上重新建索引，对业务是有影响的，不过我们可以通过索引别名也解决这个问题。

索引别名

生产上一般是不直接指定索引库名进行查询的，局限性非常大。会使用别名进行检索。

别名好处：

可以灵活的进行索引库 mapping 的更新、reindex，同时不影响线上业务。（非常重要）
对索引库进行分类，并多个索引库指向一个别名。
一个索引库映射多个别名，通过 filter 和 routing，可以实现只针对索引库中的部分数据进行查询，常用场景是信息权限和性能优化。
冷数据或历史数据复用。
日志类型索引库。

关于索引别名不是本章重点，由于篇幅原因就不过多介绍了，后续出文章的话涉及到这块会详细介绍。

参考：

https://www.elastic.co/guide/en/elasticsearch/reference/6.4/indices-aliases.html

reindex

有了别名之后我们一般都是指定别名进行查询操作（别名只能用来查询），这个时候如果我们需要对某个索引的 mapping 进行修改，就要使用 reindex 来新建索引，并且通过别名机制不影响线上业务操作。

举例：

我们有个 alias：apple，有一个索引库 apple1，API 查询 apple1 索引库指定别名 apple 进行查询。

1. 设置 apple1 的别名为 apple

POST /_aliases
{
    "actions" : [
        { "add" : { "index" : "apple1", "alias" : "apple" } }
    ]
}

2. 建立新 Mapping 的索引库或者模版，创建新索引库 apple2

3. 使用 reindex 接口复制数据到新的索引库

POST _reindex
{
  "source": {
    "index": "apple1"
  },
  "dest": {
    "index": "apple2"
  }
}

参考：

https://www.elastic.co/guide/en/elasticsearch/reference/6.4/docs-reindex.html

4. 设置 apple2 的别名也为 apple

POST /_aliases
{
    "actions" : [
        { "add" : { "index" : "apple2", "alias" : "apple" } }
    ]
}

注意：在第 2 步建立索引时可直接指定 alias，但建议 reindex 之后再进行别名操作，因为一旦别名指向 apple 之后，业务查询的是 apple，这个时候 apple 下是同时有 apple1 和 apple2 两个索引库，会造成数据混乱。

5. 删除 apple1 索引库。

本章小结

本章我们介绍了如何使用 reindex 来复制索引数据到新的索引中，并且通过使用别名来实现线上业务的无缝衔接。关于本章如有疑问，可以在读者圈交流。

九、集群监控

Elasticsearch 的监控工具目前有很多，列举常用的几款：

head，早期的监控工具，功能还算比较全
kopf，也是早期的监控工具，页面风格比 head 耐看
cerebro，在 kopf 加强版，功能基本覆盖需求。
ElasticHD，支持 SQL 转 DSL
kibana，官方组件，不用多说
X-pack，官方组件，6.3.0 以后开源
grafana，与 kibana 差不多，各有利弊

主流的就这些，其他的还有很多就不一一列举了。head 是一款比较早期的工具，功能基本满足需求，就是页面太糙了。

kopf 没用过。
cerebro 是本人一直在使用的一款监控工具，不一定是最好的，只是用着习惯顺手。cerebro 是用 scala 写的，我对源码进行了修改，屏蔽了一些危险操作（如 delete、force merge、上锁等危险操作）。这样就可以让更多的人使用起来并降低风险，如果有需要的可以联系我。
ElasticHD 没用过，高手根本不需要 sql 好嘛，一点不好用。
kibana 不用多说，谁用谁知道。
x-pack6.3.0 版本已经被我破解了，所有功能都可以用（免费），不过生产还是建议使用花点钱吧。x-pack 的 sql 比 elasticsearch-sql 好用多了，monitoring 可以监控到很多性能指标。破解方法也可以联系我。

本章小结

最后一章了，本章介绍了一些主流的监控工具。强烈建议 cerebro、x-pack。

总结

文章到这里就结束了。言尽于此，要说的还有很多，Elasticsearch 的知识还有很多很多。篇幅有限，也写了两天时间了，说是 5000 字的文章写了 14000 字。小弟不才，有哪些没能令您满意的，希望多多指点，您的支持就是我的动力。后续可能还会写一些深度的东西，像原理和优化经验这些。这篇文章比较浅啦。

本文首发于GitChat，未经授权不得转载，转载需与GitChat联系。

拓展阅读：《高可用 Elasticsearch 集群 21 讲》。

150

互动评论

Louis1 年前

希望分享更多ES优化相关的内容

鼓掌

骇1 年前

dynamic=true貌似是可以写入文档吧，并且新曾字段也可以被索引。 dynamic=false是可以写入文档，但新字段不能被索引。 dynamic=strict 才是不能写入文档。不知道是不是这样呢？

鼓掌

桃花惜春风（作者）1 年前

是的，非常感谢指正，是我笔误了。 dynamic=true，是默认值，会根据新出现的字段修改mapping，文档完整信息全部会写入。但不建议这种方式。 dynamic=false，不会根据新字段修改mapping，但是符合mapping部分字段会被写入，新字段会丢失。同样不建议。 dynamic=strict，禁止修改mapping，同时对不符合mapping的文档会插入失败。建议使用。

鼓掌

写点什么...

成为创作者，免费或收费发布内容

开始创作我的创作0

Chat 是什么？了解更多

Chat 是一种全新的阅读/写作互动体验产品。一场 Chat 包含一篇文章和一场为该文章的读者和作者准备的专属线上交流。

关注 GitChat 微信公众号

获得 Chat 邀请
与作者实时互动
限时特惠不错过

创建一场 Chat成为专栏作者说出你的需求

加入我们|常见问题|联系客服

京ICP备16004941号-1京公网安备 11010502038640 号

你可能感兴趣的:(elasticsearch总结)

数据结构【红黑树模拟实现】北方留意尘 C++数据结构数据结构
目录红黑树：基于AVL树改进红黑树的性质红黑树基本结构insert基本结构新增节点的默认颜色为红色节点性质总结情况一:cur为红，p为红，g为黑，u存在且为红情况二:cur为红，p为红，g为黑，u不存在/u存在且为黑(单旋+变色)情况三:cur为红，p为红，g为黑，u不存在/u存在且为黑(双旋+变色)insert代码实现验证是否为红黑树源码链接红黑树：基于AVL树改进AVL树控制平衡因子，严格要求
币圈不设防第三期回顾：中东资本入场，加密市场格局将如何重塑比特币web3区块链
3月14日晚，由TechubNews主办的《币圈不设防》第三期Space活动圆满落幕。本期以“中东资本入股币安背后的逻辑与行业影响”为核心议题，特邀LYSLab投研分析师Veigar、RITDLabs联合创始人Benny、TechubNews运营负责人Sam等嘉宾，共同探讨中东资本的入局对加密行业的深远意义。以下是本期活动的深度总结。一、中东资本为何选择币安？战略布局浮出水面近期，阿布扎比主权基金
AI Agent赛道：昙花一现还是生态革命？6大咖拆解泡沫与未来人工智能比特币区块链web3
作者：CRYPTO币圈不设防币圈不设防第四期Space总结：AIAgent赛道还能火多久？在Web3华语主持人茄哥的主持下，第四期《币圈不设防》围绕“AIAgent赛道还能火多久？”展开深度探讨。本期嘉宾阵容强大，包括Uweb校长于佳宁、TradingBaseAI创始人Mr.Z、BuilderLogEarn、区块链爱好者flyawei、投研博主清风#BTC，以及社区领袖小智。以下是讨论的核心观点总
SpringSecurity——如何获取当前登录用户的信息代码代码快快显灵 springsecurity java 开发语言 SpringSecurity
目录1.直接注入Principal2.直接注入Authentication3.注入UsernamePasswordAuthenticationToken4.通过SecurityContextHolder获取5.使用自定义工具方法总结如何获取更多的用户信息自定义用户实体类如何忽略某些字段（不返回前端）以及规范日期格式登录成功后的处理：在SpringSecurity中，当前登录用户的信息实际上都存储在
SQL Server 2022常见问题软件研究员数据库 sql server
根据本人多年使用数据库的经验，总结SQLServer2022数据库常见问题包含安装、链接、性能等问题，下面简单说下。一、安装失败问题主要是以下问题：1、硬件配置问题sqlServer2022运行的最低硬件配置要求：根据官网公布要求最低1G内存，最低6G可用磁盘空间，处理器速度1.4GHz，x64处理器；显示器Super-VGA(800x600)。注意：在这里我说的是最低配置。2、软件插件问题缺少.
Elasticsearch 搜索引擎原理与实践 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介Elasticsearch是开源分布式搜索引擎，提供搜素、分析、数据可视化等功能。它是一个基于Lucene的全文搜索服务器，能够把结构化或非结构化的数据经过索引生成一个索引库，使其可以被搜索到。在现代Web应用中，搜索功能已经成为不可或缺的一项功能。但是传统上，传统搜索方式需要依赖于数据库查询或者其他复杂的查询接口。而Elasticsearch提供了一种高效、稳
Docker搭建开源Web云桌面操作系统Puter和DaedalOS 没刮胡子 Linux服务器技术 Linux 1024程序员节 puter 云桌面云桌面操作系统 daedalOS web操作系统
文章目录Puter操作系统说明基于Docker启动Puter操作系统拉取镜像运行容器基于Docker-Compose启动Puter操作系统创建目录编写docker-compose.yml运行在本地直接运行puter操作系统puter界面截图puter个人使用总结构建自己的Puter镜像daedalos基于web的操作系统说明技术特点核心功能使用场景基于docker运行daedalos拉取镜像运行容
(python)保障信息安全的加密库-cryptography Marst·Zhang 基础知识实用工具 python
前言cryptography是一个广泛使用的Python加密库，提供了各种加密、哈希和签名算法的实现。它支持多种加密算法，如AES、RSA、ECC等，以及哈希函数（如SHA-256、SHA-384等）和数字签名算法(如DSA、ECDSA等).目录常见用途密码学函数主要功能优点缺点总结常见用途数据加密使用对称加密算法（如AES）对数据进行加密，确保数据在传输或存储过程中的机密性。数字签名生成和验证数
kibana第一次连接elasticsearch出现问题1：Unable to retrieve version information from Elasticsearch nodes. 皮卡兔子屋 elasticsearch docker
问题描述elasticsearch容器正常运行，在启动kibana容器后打开对应连接，出现错误：kibanaserverisnotreadyyet.通过docker命令查看kibana日志：dockerlogskibana显示错误为：[ERROR][elasticsearch-service]UnabletoretrieveversioninformationfromElasticsearchno
【大模型学习路线】从月薪6K到年薪35W，普通二本生转行大模型的逆袭之路：我的500小时崩溃实录与实战秘籍（附保姆级学习路线） AGI大模型学习学习人工智能大模型应用程序员 AI 大模型 AI大模型
摘要：26岁机械专业零基础转大模型，被面试官羞辱“非科班别做梦”，5个月死磕源码，现拿下3个大厂offer。踩过所有新人会踩的坑，总结出普通人高效突围的4个阶段+7个杀手级项目。（文末送自研《大模型避坑指南》+120G学习资料包）一、血泪教训：这些弯路我替你走了（小白必看）2023年3月12日，我在工地上画完第108张CAD图纸后，突然收到大学班群消息：“XX同学入职字节AILab，年薪50W+”
目前常用的机器视觉工具库总结，选一个适合自己的机器视觉库才是最好的。 yuanpan 计算机视觉图像处理 ai AI编程
以下是常用机器视觉工具的总结，包括它们的特点、优点、缺点和是否付费：1.Halcon特点：由MVTec公司开发，专注于工业机器视觉。提供强大的图像处理、模式匹配、OCR和3D视觉功能。优点：高性能，适合复杂的工业应用。提供图形化编程界面（HDevelop），用户友好。支持多种硬件设备（如相机、采集卡）。缺点：付费：价格较高，适合企业级用户。开放性较低，定制化能力有限。学习曲线较高，文档复杂。是否付
【操作系统】Operating System Conceptions第二章知识整理总结 guozhirourou Operating System Conceptions阅读 Operating System Conceptions
小结：这几天我看了《OperatingSystemConceptions》的第二章。第二章先从用户、开发者以及计算机系统的角度开始，展示操作系统所提供的服务，继而讲解了操作系统是如何通过系统调用来为系统提供服务的，阐述一段程序是如何在系统中装入链接以及执行的。同时通过比较和对比整体、分层、微核、模块化和混合策略操作系统的不同设计，向我们展示了macOS、Android、Windows三种不同的操作
Spring MVC +Spring 框架学习总结-入门必学知识点柚子味* Java spring spring mvc java spring mvc
Spring框架是由于软件开发的复杂性而创建的。Spring使用的是基本的JavaBean来完成以前只可能由EJB完成的事情。然而，Spring的用途不仅仅限于服务器端的开发。从简单性、可测试性和松耦合性角度而言，绝大部分Java应用都可以从Spring中受益。spring相关视频教程：https://www.bilibili.com/video/BV1nz4y1d7uySpringMVC是Spr
《Operating System Concepts》阅读笔记：p408-p448 codists 读书笔记操作系统
《OperatingSystemConcepts》学习第34天，p408-p448总结，总计41页。一、技术总结2.page-replacementalgorithmInmemorymanagement,thealgorithmthatchooseswhichvictimframeofphysicalmemorywillbereplacedbyaneedednewframeofdata.(1)FI
《Operating System Concepts》阅读笔记：p272-p285 codists 读书笔记操作系统
《OperatingSystemConcepts》学习第27天，p272-p285总结，总计14页。一、技术总结1.semaphoreAsemaphoreSisanintegervariablethat,apartfrominitialization,isaccessedonlythroughtwostandardatomicoperations:wait()andsignal().2.monit
ES日志分析喝醉酒的小白 elasticsearch 大数据搜索引擎
日志分析总结：核心错误类型日志中高频出现Client.Timeoutexceeded错误，表明向elasticsearch-logging:9200发起的请求（如获取索引状态/_all/_stats、节点状态/nodes/stats）因超时失败，属于网络请求超时问题。可能原因分析Elasticsearch服务异常：检查elasticsearch-logging服务是否正常运行，是否存在崩溃、重启或
在Mac M1/M2芯片上完美安装DeepCTR库：避坑指南与实战验证 ku_code_ku 机器学习 macos 推荐算法推荐系统
让推荐算法在AppleSilicon上全速运行概述作为推荐系统领域的最经常用的明星库，DeepCTR集成了CTR预估、多任务学习等前沿模型实现。但在AppleSilicon架构的Mac设备上，安装过程常因ARM架构适配、依赖库版本冲突等问题受阻。本文通过20+次环境搭建实测，总结出最稳定的安装方案。关键版本说明（2024年验证）组件推荐版本注意事项Python3.10.x向下兼容至3.7，但3.1
解决前后端分离跨域产生的session丢失问题 luckilyil BUG java servlet
目录前言存储用户信息的方式Cookies：Token（令牌）：LocalStorage/SessionStorage：Session：Redis：OAuth/OIDC：本篇文章主要讲使用session会话来存储信息会话机制1.何为一次会话，会话从什么时候开始，从什么时候结束？2.cookies如何保持会话，它的工作流程？3.什么是Session？Session的工作原理：问题出现解决方法总结前言现
基于WebAssembly的浏览器密码套件闲人编程 wasm 服务器易于集成跨平台性密码套件浏览器 WebAssembly
目录一、前言二、WebAssembly与浏览器密码套件2.1WebAssembly技术概述2.2浏览器密码套件的需求三、系统设计思路与架构3.1核心模块3.2系统整体架构图四、核心数学公式与算法证明4.1AES-GCM加解密公式4.2SHA-256哈希函数五、异步任务调度与GPU加速设计5.1异步任务调度5.2GPU加速六、GUI设计与功能模块七、完整代码实现九、代码自查与总结十、总结与展望一、前
我与DeepSeek读《大型网站技术架构》- 总结诺亚凹凸曼架构
文章目录读后感一、总结二、反思三、创新四、展望当代大型网站架构一、架构分层模型二、关键组件与技术选型三、架构演进策略四、架构突破口读后感一、总结架构演化优先于设计大型网站架构不是预先设计的产物，而是通过反复迭代和试错演化形成的。技术选型的核心动机是对业务需求的深刻理解，而非盲目模仿。典型案例包括淘宝架构因业务爆发力被迫转型为分布式系统。开放与协作的价值互联网的开放生态通过API经济（如淘宝Open
QtQML Series - Qt中文乱码解决方案稳定的菜着 #&QT开发数据库 qt
目录系列文章目录前言1.main函数入口设置中文编码2.VisualStudio插件3.如果使用预编译头4.开启UTF-8支持4.1.pro文件4.2MSVC4.3GCC&Clang5.总结系列文章目录系列文章ReadMe前言中文乱码是Qt开发中的常态问题1.main函数入口设置中文编码intmain(){#includeQApplicationa(argc,argv);//设置中文字体a.set
【TypeScript学习】TypeScript基础学习总结二 JAMJAM_NoName typescript 学习前端
主要记录ts中的类、接口与泛型1.类无论是在哪种语言中，类都是面向对象编程(OOP)的一个主要实现方式。能够实现代码更加灵活，更具有结构化。类作用都是提供一个模板，通过类可以创建多个具有相同结构的对象。//类的定义，与对象的声明classStudent{id:stringname:stringage:numberconstructor(id:string,name:string,age:numbe
Kubernetes 资源管理实战：合理配置 CPU 与内存请求和限制 XMYX-0 K8S kubernetes 容器
文章目录Kubernetes资源管理实战：合理配置CPU与内存请求和限制理解Kubernetes中的资源请求与限制资源请求（Requests）资源限制（Limits）单位解析案例分析：20GB服务器与两个服务的内存配置是否有必要设置如此高的内存限制？如何合理配置？补充知识点：监控与自动扩缩容监控工具自动扩缩容（Autoscaling）总结Kubernetes资源管理实战：合理配置CPU与内存请求和
【服务器】使用命令行文本编辑器（如 vim、nano 或 vi）创建文件并编辑 WW、forever 软件安装及编译处理等服务器 vim 运维
【服务器】使用命令行文本编辑器（如vim、nano或vi）创建文件并编辑准备：连接至服务器（如ssh）创建.ncl文件方法1:使用vim创建.ncl文件方法2:使用nano创建.ncl文件确认文件已创建运行.ncl文件总结参考要在服务器中新建.ncl文件（或任何其他文件），你可以通过SSH连接到服务器，然后使用命令行文本编辑器（如vim、nano或vi）创建文件并编辑。以下是具体步骤：准备：连接至
第6章：Dockerfile最佳实践：多阶段构建与镜像优化 DogDog_Shuai docker 容器运维
第6章：Dockerfile最佳实践：多阶段构建与镜像优化作者：DogDog_Shuai阅读时间：约30分钟难度：中级目录1.引言2.Dockerfile基础3.多阶段构建4.镜像优化技术5.最佳实践指南6.总结1.引言Dockerfile是构建Docker镜
数据库设计20条军规：血泪教训换来的实战指南潘多编程数据库
优秀的数据库设计不是炫技，而是用最低的成本规避最痛的坑。在经历过数百次深夜故障复盘后，我总结了这些真正经得起生产环境考验的铁律：一、基础生存法则第三范式是起点不是终点订单表里的收货地址必须拆成独立地址表？先看业务场景：日均10万订单的电商系统，拆分会带来3表关联查询，不拆可能存储冗余。实战解法：高频查询字段适当冗余，低频字段严格范式化。命名规范要强制执行user_order_2023比tbl_us
在控制台中监控 Linux 性能的十种方法小郎碎碎念 Linux运维 linux 运维服务器
对下面的文章内容进行了总结，也是自己mark一下，以后用到可以直接来这里查看https://www.jeffgeerling.com/blog/2025/top-10-ways-monitor-linux-console10个linux系统重用来查看性能的工具（类top）top：用于监控Linux（或包括macOS在内的任何UNIX系统）的资源使用情况，能展示基本的系统指标，如CPU、内存、任务等
目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
【操作系统】双缓冲机制(含原理、优势、实现方式、应用场景) 司六米希嵌入式
双缓冲机制一、双缓冲机制的原理二、双缓冲的典型应用场景三、双缓冲的优势四、双缓冲的实现方式1.硬件级双缓冲2.软件级双缓冲3.性能提升对比五、双缓冲的挑战与解决方案六、总结双缓冲机制是一种通过使用两个缓冲区（BufferA和BufferB）来优化数据传输或处理效率的技术，其核心原理是并行处理与交替切换。以下是详细解析：一、双缓冲机制的原理基本概念：双缓冲区：系统维护两个相同大小的内存区域。分工协作
HTML5！进击2025web蓝桥杯复习之路 Deepsleep. html5 前端 html
#HTML5全面解析##目录1.[HTML5简介](#1-html5-简介)2.[基本标签](#2-基本标签)3.[新特性](#3-新特性)4.[本地存储](#4-本地存储)5.[总结](#5-总结)---##1.HTML5简介HTML5是HTML的第五个主要版本，2014年由W3C正式发布。主要特性包括：-语义化标签-多媒体支持-图形绘制（Canvas/SVG）-本地存储能力-WebWorker
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓