zhangjian_eng

ElasticSearch 基础教程

- 1.概念
- 2.使用场景：
- 3.基本概念
- - 1.NRT
  - 2.Cluster
  - 3.Node
  - 4.Index
  - 5.Type
  - 6.Document
  - 7.Shards & Replicas
- 4.安装和配置
- - 1.集群健康
  - 2.列出所有索引
  - 3.创建索引
  - 4.索引和查询文档
  - 5.删除索引
  - 6.总结：
  - 7.修改文档（重新索引）
  - 8.更新文档
  - 9.删除文档
  - 10.批量处理
- 6.样本数据测试
- 7.Search API
- 8.查询 DSL 语言介绍
- 9.Search DSL match
- 10.Search DSL Filter
- 11.Search DSL Range
- 12.聚合查询

1.概念

Elasticsearch 是一个高度可扩展的开源全文搜索和分析引擎。它使您可以近乎实时地快速存储、搜索和分析大量数据。

ES能做什么？

全文检索（全部字段）、模糊查询（搜索）、数据分析（提供分析语法，例如聚合）

全文检索：检索所有的字段，而不是某个字段

模糊查询：也可以查询所有的字段

参考：https://www.elastic.co/guide/en/elasticsearch/reference/6.0/getting-started.html

2.使用场景：

1.搜索引擎

2.ELK 收集日志，分析日志

3.您运行一个价格警报平台，该平台允许精通价格的客户指定一条规则，例如“我有兴趣购买特定的电子产品，并且我希望在下个月内任何供应商的产品价格低于 X 美元时收到通知” . 在这种情况下，您可以抓取供应商价格，将它们推送到 Elasticsearch 并使用其反向搜索 (Percolator) 功能将价格变动与客户查询进行匹配，并最终在找到匹配项后将警报推送给客户。

4.BI 分析，对大量数据（想想数百万或数十亿条记录）进行快速调查、分析、可视化和提出临时问题。

3.基本概念

1.NRT

Elasticsearch 是一个近实时（ Near RealTime）的搜索平台，从索引文档到可搜索之间存在轻微的延迟（通常为一秒）。

2.Cluster

集群的默认名称是“elasticsearch”，作为自动发现。您可以将logging-dev、logging-stage和logging-prod 用于开发、暂存和生产集群。集群由节点组成。

3.Node

启动时分配给节点的随机唯一标识符 (UUID)，也可以自定义

4.Index

类似于数据库，索引名必须全部小写，数量不限。

5.Type

在 6.0.0 中已弃用。

6.Document

文档是可以建立索引的基本单元。用JSON（JavaScript Object Notation）表示。文档必须分配给一个 type。

7.Shards & Replicas

分片：

1.解决分布式存储问题；

2.解决分布式并行搜索大量数据的问题，提高吞吐量；

3.解决水平扩缩容问题。

4.分片的分布机制及文档聚合返回搜索结果对用户透明（不可见）。

副本：

1.分片、节点发生故障是提供高可用；故副本分片不能和主分片分配在同一节点；

2.搜索在副本上并行执行，增加吞吐量；

注意：

1.可以在创建索引时定义分片和副本数，随时可以修改副本数量，但是不能修改分片数量；

2.默认5个主分片和一个副本，故至少两个节点，一共10个分片

3.每个ES 的分片是一个 Lucene 索引，单个 Lucene 索引可以包含的文档上限是 Integer.MAX_VALUE - 128[LUCENE-5843

4.可以使用_cat/shards 监控分片大小

4.安装和配置

1.ES 安装要求java8 以上，在 [www.elastic.co/downloads]下载

2.config/elasticsearch.yml 默认都是注释的，只满足学习环境，生成环境必须修改path.data、path.logs、network.host 等。

# 集群名称，默认是 elasticsearch，同一个集群互相发现
cluster.name: my-application
# 节点名称
node.name: node-104
# 数据目录，不要用默认的
path.data: /opt/module/elasticsearch/data
# 日志目录，不要用默认的
path.logs: /opt/module/elasticsearch/logs
# 内存锁，设置为 true 即使内存不够同也不用交换区
bootstrap.memory_lock: true
# 还不清楚，后面查
bootstrap.system_call_filter: false
# 对外暴露的 ip
network.host: hadoop104
# 可以做为发现的节点
discovery.zen.ping.unicast.hosts: ["192.168.253.102"]

3.默认的配置文件

# ======================== Elasticsearch Configuration =========================
#
# NOTE: Elasticsearch comes with reasonable defaults for most settings.
#       Before you set out to tweak and tune the configuration, make sure you
#       understand what are you trying to accomplish and the consequences.
#
# The primary way of configuring a node is via this file. This template lists
# the most important settings you may want to configure for a production cluster.
#
# Please consult the documentation for further information on configuration options:
# https://www.elastic.co/guide/en/elasticsearch/reference/index.html
#
# ---------------------------------- Cluster -----------------------------------
#
# Use a descriptive name for your cluster:
#
#cluster.name: my-application
#
# ------------------------------------ Node ------------------------------------
#
# Use a descriptive name for the node:
#
#node.name: node-1
#
# Add custom attributes to the node:
#
#node.attr.rack: r1
#
# ----------------------------------- Paths ------------------------------------
#
# Path to directory where to store the data (separate multiple locations by comma):
#
#path.data: /path/to/data
#
# Path to log files:
#
#path.logs: /path/to/logs
#
# ----------------------------------- Memory -----------------------------------
#
# Lock the memory on startup:
#
#bootstrap.memory_lock: true
#
# Make sure that the heap size is set to about half the memory available
# on the system and that the owner of the process is allowed to use this
# limit.
#
# Elasticsearch performs poorly when the system is swapping the memory.
#
# ---------------------------------- Network -----------------------------------
#
# Set the bind address to a specific IP (IPv4 or IPv6):
#
#network.host: 192.168.0.1
#
# Set a custom port for HTTP:
#
#http.port: 9200
#
# For more information, consult the network module documentation.
#
# --------------------------------- Discovery ----------------------------------
#
# Pass an initial list of hosts to perform discovery when new node is started:
# The default list of hosts is ["127.0.0.1", "[::1]"]
#
#discovery.zen.ping.unicast.hosts: ["host1", "host2"]
#
# Prevent the "split brain" by configuring the majority of nodes (total number of master-eligible nodes / 2 + 1):
#
#discovery.zen.minimum_master_nodes: 
#
# For more information, consult the zen discovery module documentation.
#
# ---------------------------------- Gateway -----------------------------------
#
# Block initial recovery after a full cluster restart until N nodes are started:
#
#gateway.recover_after_nodes: 3
#
# For more information, consult the gateway module documentation.
#
# ---------------------------------- Various -----------------------------------
#
# Require explicit names when deleting indices:
#
#action.destructive_requires_name: true

4.安装步骤

# 下载 （wget、离线也可以）
curl -L -O https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.0.1.tar.gz

# 解压
tar -xvf elasticsearch-6.0.1.tar.gz

# 切换目录
cd elasticsearch-6.0.1/bin

# 前台启动
./elasticsearch
# 后台启动
./elasticsearch -d 
# 记录 pid
./bin/elasticsearch -p pid -d


# 执行集群名称和节点名称启动
./elasticsearch -Ecluster.name=my_cluster_name -Enode.name=my_node_name

# 停止集群
jps | grep Elasticsearch 
kill -SIGTERM 15516
# 或者
kill `cat pid`

5.检查集群 Running

curl -X GET "localhost:9200/?pretty"

# Kibana
GET /

结果：

{
  "name" : "Cp8oag6",
  "cluster_name" : "elasticsearch",
  "cluster_uuid" : "AT69_T_DTp-1qgIJlatQqA",
  "version" : {
    "number" : "6.0.1",
    "build_hash" : "f27399d",
    "build_date" : "2016-03-30T09:51:41.449Z",
    "build_snapshot" : false,
    "lucene_version" : "7.0.1",
    "minimum_wire_compatibility_version" : "1.2.3",
    "minimum_index_compatibility_version" : "1.2.3"
  },
  "tagline" : "You Know, for Search"
}

6.配置

Elasticsearch 有三个配置文件：

elasticsearch.yml 用于配置 Elasticsearch
jvm.options 用于配置 Elasticsearch JVM 设置
log4j2.properties 用于配置 Elasticsearch 日志记录

生产上必须配置一下：

path.data 和 path.logs
cluster.name
node.name
bootstrap.memory_lock
network.host
discovery.zen.ping.unicast.hosts
discovery.zen.minimum_master_nodes
JVM 堆转储路径

path.data设置可以设置为多个路径，在这种情况下，所有路径都将用于存储数据（尽管属于单个分片的文件都将存储在同一数据路径上）

bootstrap.memory_lock JVM 不会被换出到磁盘，这对节点的健康至关重要。实现这一目标的一种方法是将 bootstrap.memory_lock设置设置为true。

一旦提供自定义设置network.host，Elasticsearch 就会假定您正在从开发模式转移到生产模式，并将许多系统启动检查从警告升级为异常。

discovery.zen.ping.unicast.hosts 当需要与其他服务器上的节点形成集群时，必须提供集群中可能处于活动状态且可联系的其他节点的种子列表。

#-XX:HeapDumpPath=/heap/dump/path 在 jvm.options 中，指定具体的文件。

discovery.zen.minimum_master_nodes : 形成集群的最少节点数，避免脑裂，必须大于集群节点总数的 1/2 。

1.集群健康

# 健康检查
curl -X GET "hadoop102:9200/_cat/health?v&pretty"
# Kibana 
GET /_cat/nodes?v

绿色 - 一切都很好（集群功能齐全）
黄色 - 所有数据都可用，但一些副本尚未分配（集群功能齐全）
红色 - 由于某种原因，某些数据不可用（集群部分功能）

**注意：**当集群为红色时，它将继续处理来自可用分片的搜索请求，但您可能需要尽快修复它，因为存在未分配的分片。

# 节点查看
curl -X GET "hadoop102:9200/_cat/nodes?v&pretty"
# Kibana 
GET /_cat/nodes?v

2.列出所有索引

# 列出索引
curl -X GET "hadoop102:9200/_cat/indices?v&pretty"
# Kibana
GET /_cat/indices?v

3.创建索引

创建名称为 customer 的索引。

PUT /customer?pretty
curl -X PUT "hadoop102:9200/customer?pretty&pretty"

GET /_cat/indices?v
curl -X GET "hadoop102:9200/_cat/indices?v&pretty"

# 有 1 个名为 customer 的索引，它有 5 个主分片和 1 个副本（默认值），其中包含 0 个文档。
# 黄色表示有一些副本尚未分配，因为只有一个节点

4.索引和查询文档

如果索引不存在，自动创建。

如果不指定 id，会生成一个默认的文档 id 。

curl -X PUT "hadoop102:9200/customer/doc/1?pretty&pretty" -H 'Content-Type: application/json' -d'
{
  "name": "John Doe"
}
'

# Kabana 中创建
PUT /customer/doc/1?pretty
{
  "name": "John Doe"
}

response：

{
  "_index" : "customer",
  "_type" : "doc",
  "_id" : "1",
  "_version" : 1,
  "result" : "created",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 0,
  "_primary_term" : 1
}

查询结果：

curl -X GET "hadoop102:9200/customer/doc/1?pretty&pretty"# KibanaGET /customer/doc/1?pretty# 结果：{  "_index" : "customer",  "_type" : "doc",  "_id" : "1",  "_version" : 1,  "found" : true,  "_source" : { "name": "John Doe" }}

5.删除索引

DELETE /customer?prettyGET /_cat/indices?vcurl -X DELETE "hadoop102:9200/customer"curl -X GET "hadoop102:9200/_cat/indices?v&pretty"

6.总结：

kibana 访问数据的模式

 < REST动词> /<索引>/<类型>/<ID>

PUT /customer 
PUT / customer/doc/1 { "name" : "John Doe" } 
GET /customer/doc/1 
DELETE /customer

7.修改文档（重新索引）

curl -X PUT "hadoop102:9200/customer/doc/1?pretty&pretty" -H 'Content-Type: application/json' -d'
{
  "name": "Jane Doe"
}
'

# Kibana
PUT /customer/doc/1?pretty
{
  "name": "Jane Doe"
}

8.更新文档

实际上是删除旧的文档，索引新的文档。

curl -X POST "hadoop102:9200/customer/doc/1/_update?pretty&pretty" -H 'Content-Type: application/json' -d'
{
  "doc": { "name": "Jane Doe" }
}
'

# Kibana
POST /customer/doc/1/_update?pretty
{
  "doc": { "name": "Jane Doe" }
}

也可以使用脚本 +5 ，类似于SQL UPDATE-WHERE

curl -X POST "hadoop102:9200/customer/doc/1/_update?pretty&pretty" -H 'Content-Type: application/json' -d'
{
  "script" : "ctx._source.age += 5"
}
'

# Kibana
POST /customer/doc/1/_update?pretty
{
  "script" : "ctx._source.age += 5"
}

9.删除文档

删除 index 比删除所有的文档要高效。

curl -X DELETE "hadoop102:9200/customer/doc/2?pretty&pretty"

# Kibana
DELETE /customer/doc/2?pretty

10.批量处理

1.可以减少网络连接

2.注意：Bulk API 不会因为其中一项操作失败而失败（没有事务），会返回每个操作的状态。

3.索引两个文档的例子

curl -X POST "hadoop102:9200/customer/doc/_bulk?pretty&pretty" -H 'Content-Type: application/json' -d'{"index":{"_id":"1"}}{"name": "John Doe" }{"index":{"_id":"2"}}{"name": "Jane Doe" }'

# Kibana
POST /customer/doc/_bulk?pretty{"index":{"_id":"1"}}{"name": "John Doe" }{"index":{"_id":"2"}}{"name": "Jane Doe" }

4.一个更新第一个文档，删除第二个文档的例子

curl -X POST "hadoop102:9200/customer/doc/_bulk?pretty&pretty" -H 'Content-Type: application/json' -d'{"update":{"_id":"1"}}{"doc": { "name": "John Doe becomes Jane Doe" } }{"delete":{"_id":"2"}}'

# Kibana
POST /customer/doc/_bulk?pretty{"update":{"_id":"1"}}{"doc": { "name": "John Doe becomes Jane Doe" } }{"delete":{"_id":"2"}}

6.样本数据测试

1.准备客户银行帐户信息 ，用 www.json-generator.com/ 生成的，保存在 es data/ 目录下

{
    "account_number":0,
    "balance":16623,
    "firstname":"Bradshaw",
    "lastname":"Mckenzie",
    "age":29,
    "gender":"F",
    "address":"244 Columbus地点",
    "雇主":"Euron",
    "电子邮件":"[email protected]",
    "城市":"Hobucken",
    "状态":"CO"
}

2.导入数据

# 导入数据
curl -H "Content-Type: application/json" -XPOST 'hadoop102:9200/bank/account/_bulk?pretty&refresh' --data-binary "@accounts.json"

# 查看数据
curl 'localhost:9200/_cat/indices?v'
health status index     uuid                    pri rep    docs.count 
green  open   accounts  zTkxOW6dQB6RUJP_n-2hvg   5   1       1000            0      973kb        482.4kb

7.Search API

有两种搜索的方法

1.URL 发送参数

q=*参数指示 Elasticsearch 匹配索引中的所有文档。

sort=account_number:asc参数表示使用account_number每个文档的字段按升序对结果进行排序。

curl -X GET "hadoop102:9200/accounts/_search?q=*&sort=account_number:asc&pretty"

# Kibana
GET /accounts/_search?q=*&sort=account_number:asc&pretty

响应：

{
  "took" : 19,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : 1000,
    "max_score" : null,
    "hits" : [
      {
        "_index" : "accounts",
        "_type" : "doc",
        "_id" : "0",
        "_score" : null,
        "_source" : {
          "account_number" : 0,
          "balance" : 16623,
          "firstname" : "Bradshaw",
          "lastname" : "Mckenzie",
          "age" : 29,
          "gender" : "F",
          "address" : "244 Columbus Place",
          "employer" : "Euron",
          "email" : "[email protected]",
          "city" : "Hobucken",
          "state" : "CO"
        },
        "sort" : [
          0
        ]
      }
      ..... 
      }
    ]
  }
}

took – Elasticsearch 执行搜索的时间（以毫秒为单位）
timed_out – 告诉我们搜索是否超时
_shards – 告诉我们搜索了多少个分片，以及搜索成功/失败的分片数
hits - 搜索结果
hits.total – 符合我们搜索条件的文档总数
hits.hits – 实际搜索结果数组（默认为前 10 个文档）
hits.sort - 结果的排序键（如果按分数排序则丢失）
hits._score并且max_score- 暂时忽略这些字段

2.请求 body 发送数据（推荐）

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'{  "query": { "match_all": {} },  "sort": [    { "account_number": "asc" }  ]}'

# Kibana
GET /accounts/_search{  "query": { "match_all": {} },  "sort": [    { "account_number": "asc" }  ]}

注意：一旦返回搜索结果，Elasticsearch 就完全完成了请求，并且不会维护任何类型的服务器端资源或打开结果中的游标。这与许多其他平台（如 SQL）形成鲜明对比，其中您最初可能会预先获得查询结果的部分子集，然后如果您想获取（或翻阅）其余部分，则必须不断返回服务器使用某种有状态服务器端游标的结果。

8.查询 DSL 语言介绍

query : 查询的定义

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "query": { "match_all": {} }
}
'

# Kibana
GET /bank/_search
{
  "query": { "match_all": {} }
}

size: 查询的数量，默认是10。

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "query": { "match_all": {} },
  "size": 1
}
'

# Kibana
GET /bank/_search
{
  "query": { "match_all": {} },
  "size": 1
}

from:从文档10开始，到19结束，一共10个文档，默认是0。

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "query": { "match_all": {} },
  "from": 10,
  "size": 10
}
'

# Kibana
GET /bank/_search
{
  "query": { "match_all": {} },
  "from": 10,
  "size": 10
}

sort:排序，按照balance 字段降序排序，返回前10个文档

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'{  "query": { "match_all": {} },  "sort": { "balance": { "order": "desc" } }}'

# Kibana
GET /bank/_search{  "query": { "match_all": {} },  "sort": { "balance": { "order": "desc" } }}

9.Search DSL match

_source:搜索部分字段，只搜索 [“account_number”, “balance”] 两个字段。

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'{  "query": { "match_all": {} },  "_source": ["account_number", "balance"]}'

# Kibana
GET /bank/_search {"query": { "match_all": {} },  "_source": ["account_number", "balance"]}

match query:对特定的字段集搜索，示例为account_number = 20 的账户。

不区分大小写

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "query": { "match": { "account_number": 20 } }
}
'

# Kibana
GET /bank/_search
{
  "query": { "match": { "account_number": 20 } }
}

match query:查询 address 中包含 mill 的账户。

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "query": { "match": { "address": "mill" } }
}
'

# Kibana
GET /bank/_search
{
  "query": { "match": { "address": "mill" } }
}

此示例是match的变体( match_phrase)，返回地址中包含短语“mill Lane”的所有帐户：

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "query": { "match_phrase": { "address": "mill lane" } }
}
'

# Kibana
GET /bank/_search
{
  "query": { "match": { "address": "mill lane" } }
}

bool query: 两个 match 的组合。

must: 必须都为真。

此示例组合两个match查询并返回地址中同时包含“mill”和“lane”的所有帐户。

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'{  "query": {    "bool": {      "must": [        { "match": { "address": "mill" } },        { "match": { "address": "lane" } }      ]    }  }}'

# Kibana
GET /bank/_search{  "query": { "match_phrase": { "address": "mill lane" } }}

bool should : 返回 match 中的任何一个为真。

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'{  "query": {    "bool": {      "should": [        { "match": { "address": "mill" } },        { "match": { "address": "lane" } }      ]    }  }}'

# Kibana
GET /bank/_search{  "query": {    "bool": {      "should": [        { "match": { "address": "mill" } },        { "match": { "address": "lane" } }      ]    }  }}

bool must_not: 匹配都为 false 的账户

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'{  "query": {    "bool": {      "must_not": [        { "match": { "address": "mill" } },        { "match": { "address": "lane" } }      ]    }  }}'

# Kibana
GET /bank/_search{  "query": {    "bool": {      "must_not": [        { "match": { "address": "mill" } },        { "match": { "address": "lane" } }      ]    }  }}

复杂组合的例子：

此示例返回 age = 40 但status <> ID 的所有帐户：

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "query": {
    "bool": {
      "must": [
        { "match": { "age": "40" } }
      ],
      "must_not": [
        { "match": { "state": "ID" } }
      ]
    }
  }
}
'

# Kibana 
GET /bank/_search
{
  "query": {
    "bool": {
      "must": [
        { "match": { "age": "40" } }
      ],
      "must_not": [
        { "match": { "state": "ID" } }
      ]
    }
  }
}

10.Search DSL Filter

同下一起。

11.Search DSL Range

_score: 分数是一个数值，文档与指定的搜索查询匹配程度的相对度量。

分数越高，文档越相关，分数越低，文档越不相关。

查询并不总是需要产生分数，特别是当它们仅用于“过滤”文档集时。

filter 不会改变分数。只有 true 和 false。

rangequery: 按值范围过滤文档。这通常用于数字或日期过滤。大于等于，小于等于。

过滤出 balance 大于等于2000且小于等于3000的账户。

curl -X GET "localhost:9200/bank/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "query": {
    "bool": {
      "must": { "match_all": {} },
      "filter": {
        "range": {
          "balance": {
            "gte": 20000,
            "lte": 30000
          }
        }
      }
    }
  }
}
'

# Kibana
GET /bank/_search
{
  "query": {
    "bool": {
      "must": { "match_all": {} },
      "filter": {
        "range": {
          "balance": {
            "gte": 20000,
            "lte": 30000
          }
        }
      }
    }
  }
}

除了match_all，match，bool，和range查询，有很多可用的其他查询类型的

12.聚合查询

首先，此示例按状态对所有帐户进行分组，然后返回按计数降序（也是默认值）排序的前 10 个（默认）状态.

size=0为不显示搜索命中，因为我们只想查看响应中的聚合结果

等同于sql:select state, count (*) FROM accounts group by state order by count (*) desc

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "size": 0,
  "aggs": {
    "group_by_state": {
      "terms": {
        "field": "state.keyword"
      }
    }
  }
}
'

# Kibana
GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_state": {
      "terms": {
        "field": "state.keyword"
      }
    }
  }
}

结果：

{
  "took": 29,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped" : 0,
    "failed": 0
  },
  "hits" : {
    "total" : 1000,
    "max_score" : 0.0,
    "hits" : [ ]
  },
  "aggregations" : {
    "group_by_state" : {
      "doc_count_error_upper_bound": 20,
      "sum_other_doc_count": 770,
      "buckets" : [ {
        "key" : "ID",
        "doc_count" : 27
      }, {
        "key" : "TX",
        "doc_count" : 27
      }, {
        "key" : "AL",
        "doc_count" : 25
      }, {
        "key" : "MD",
        "doc_count" : 25
      }, {
        "key" : "TN",
        "doc_count" : 23
      }, {
        "key" : "MA",
        "doc_count" : 21
      }, {
        "key" : "NC",
        "doc_count" : 21
      }, {
        "key" : "ND",
        "doc_count" : 21
      }, {
        "key" : "ME",
        "doc_count" : 20
      }, {
        "key" : "MO",
        "doc_count" : 20
      } ]
    }
  }
}

在前面的聚合基础上，此示例按州计算平均帐户余额（同样仅针对按降序按计数排序的前 10 个州）：

select count(1) as average_balance, avg(account) as balance group by state limit 10;

average_balance聚合嵌套在group_by_state聚合中。这是所有聚合的通用模式。

可以在聚合中任意嵌套聚合。

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "size": 0,
  "aggs": {
    "group_by_state": {		// 相当于 group by state.keyword
      "terms": {
        "field": "state.keyword"
      },
      "aggs": { 			 // 相当于 count(balance) as average_balance
        "average_balance": {
          "avg": {
            "field": "balance"
          }
        }
      }
    }
  }
}
'

# Kibana
GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_state": {
      "terms": {
        "field": "state.keyword"
      },
      "aggs": {
        "average_balance": {
          "avg": {
            "field": "balance"
          }
        }
      }
    }
  }
}

聚合结果：

{
  "took" : 32,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : 1000,
    "max_score" : 0.0,
    "hits" : [ ]
  },
  "aggregations" : {
    "group_by_state" : {
      "doc_count_error_upper_bound" : 20,
      "sum_other_doc_count" : 770,
      "buckets" : [
        {
          "key" : "ID",
          "doc_count" : 27,
          "average_balance" : {
            "value" : 24368.777777777777
          }
        },
        {
          "key" : "TX",
          "doc_count" : 27,
          "average_balance" : {
            "value" : 27462.925925925927
          }
        },
        {
          "key" : "AL",
          "doc_count" : 25,
          "average_balance" : {
            "value" : 25739.56
          }
        },
        {
          "key" : "MD",
          "doc_count" : 25,
          "average_balance" : {
            "value" : 24963.52
          }
        },
        {
          "key" : "TN",
          "doc_count" : 23,
          "average_balance" : {
            "value" : 29796.782608695652
          }
        },
        {
          "key" : "MA",
          "doc_count" : 21,
          "average_balance" : {
            "value" : 29726.47619047619
          }
        },
        {
          "key" : "NC",
          "doc_count" : 21,
          "average_balance" : {
            "value" : 26785.428571428572
          }
        },
        {
          "key" : "ND",
          "doc_count" : 21,
          "average_balance" : {
            "value" : 26303.333333333332
          }
        },
        {
          "key" : "ME",
          "doc_count" : 20,
          "average_balance" : {
            "value" : 19575.05
          }
        },
        {
          "key" : "MO",
          "doc_count" : 20,
          "average_balance" : {
            "value" : 24151.8
          }
        }
      ]
    }
  }
}

复杂的且套聚合查询

在之前的聚合基础上，让我们现在按降序对平均余额进行排序：

select range_age, gender.keyword, avg(balance) as average_balance from accounts group by range_age, gender.keyword ;

此示例演示了如何按年龄段（20-29、30-39 和 40-49 岁）和gender分组，最后得到每个年龄段、每个性别的平均帐户余额：

curl -X GET "hadoop102:9200/accounts/_search?pretty" -H 'Content-Type: application/json' -d'
{
  "size": 0,
  "aggs": {
    "group_by_age": {
      "range": {
        "field": "age",
        "ranges": [
          {
            "from": 20,
            "to": 30
          },
          {
            "from": 30,
            "to": 40
          },
          {
            "from": 40,
            "to": 50
          }
        ]
      },
      "aggs": {		// 先 avg(balance) as average_balance group by gender.keyword
        "group_by_gender": {  
          "terms": {
            "field": "gender.keyword"
          },
          "aggs": {
            "average_balance": {
              "avg": {
                "field": "balance"
              }
            }
          }
        }
      }
    }
  }
}
'


# Kibana
GET /bank/_search
{
  "size": 0,
  "aggs": {
    "group_by_age": {
      "range": {
        "field": "age",
        "ranges": [
          {
            "from": 20,
            "to": 30
          },
          {
            "from": 30,
            "to": 40
          },
          {
            "from": 40,
            "to": 50
          }
        ]
      },
      "aggs": {
        "group_by_gender": {
          "terms": {
            "field": "gender.keyword"
          },
          "aggs": {
            "average_balance": {
              "avg": {
                "field": "balance"
              }
            }
          }
        }
      }
    }
  }
}

查询结果：

{
  "took" : 34,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : 1000,
    "max_score" : 0.0,
    "hits" : [ ]
  },
  "aggregations" : {
    "group_by_age" : {
      "buckets" : [
        {
          "key" : "20.0-30.0",
          "from" : 20.0,
          "to" : 30.0,
          "doc_count" : 451,
          "group_by_gender" : {
            "doc_count_error_upper_bound" : 0,
            "sum_other_doc_count" : 0,
            "buckets" : [
              {
                "key" : "M",
                "doc_count" : 232,
                "average_balance" : {
                  "value" : 27374.05172413793
                }
              },
              {
                "key" : "F",
                "doc_count" : 219,
                "average_balance" : {
                  "value" : 25341.260273972603
                }
              }
            ]
          }
        },
        {
          "key" : "30.0-40.0",
          "from" : 30.0,
          "to" : 40.0,
          "doc_count" : 504,
          "group_by_gender" : {
            "doc_count_error_upper_bound" : 0,
            "sum_other_doc_count" : 0,
            "buckets" : [
              {
                "key" : "F",
                "doc_count" : 253,
                "average_balance" : {
                  "value" : 25670.869565217392
                }
              },
              {
                "key" : "M",
                "doc_count" : 251,
                "average_balance" : {
                  "value" : 24288.239043824702
                }
              }
            ]
          }
        },
        {
          "key" : "40.0-50.0",
          "from" : 40.0,
          "to" : 50.0,
          "doc_count" : 45,
          "group_by_gender" : {
            "doc_count_error_upper_bound" : 0,
            "sum_other_doc_count" : 0,
            "buckets" : [
              {
                "key" : "M",
                "doc_count" : 24,
                "average_balance" : {
                  "value" : 26474.958333333332
                }
              },
              {
                "key" : "F",
                "doc_count" : 21,
                "average_balance" : {
                  "value" : 27992.571428571428
                }
              }
            ]
          }
        }
      ]
    }
  }
}

你可能感兴趣的:(ElasticSearch,elasticsearch,搜索引擎,全文检索)

一款功能强大的本地数据全文搜索引擎Anytxt Searcher AitTech 搜索引擎
AnytxtSearcher是一款功能强大的本地数据全文搜索引擎，它类似于本地磁盘的Google搜索引擎，是理想的桌面内容搜索工具。以下是关于AnytxtSearcher的详细介绍及使用方法：AnytxtSearcher是什么？AnytxtSearcher内置了一个功能强大的文档解析引擎，该引擎无需安装任何其他软件即可提取常用文档的文本，并结合内置的高速索引系统来存储文本的元数据。用户可以使用An
python tab键自动补全没反应_CentOS下为python命令行添加Tab键自动补全功能 weixin_39741459 python tab键自动补全没反应
难道python命令就真的没办法使用Tab键的自动补全功能么？当然不是了，我们依然可以使用。只不过需要自己动手配置一下。操作系统环境：CentOSrelease6.4x86_32软件版本：Python2.6.6下面我们具体了解配置方法：1、编写一个Tab键自动补全功能的脚本。新手会说不会写怎么办？搜索引擎可以帮助你，关键字(pythontab键自动补全)1、编写一个Tab键自动补全功能的脚本。新手
SeaTunnel 社区月报（5-6 月）：全新功能上线、Bug 大扫除、Merge 之星是谁？ SeaTunnel bug SeaTunnel 开源数据集成大数据
在5月和6月，SeaTunnel社区迎来了一轮密集更新：2.3.11正式发布，新增对Databend、Elasticsearch向量、HTTP批量写入、ClickHouse多表写入等多个连接器能力，全面提升了数据同步灵活性。同时，近100个修复与优化PR合入，涵盖Spark引擎并行性修复、Paimon精度兼容性增强、Mongo-CDCExactlyOnce默认值优化、OracleDDL类型支持补全
Elasticsearch性能调优金字塔：从分片与副本策略构建海量日志分析平台 lingRJ777 Java技术栈应用 java backend elasticsearch spring boot microservices elk
Elasticsearch性能调优金字塔：从分片与副本策略构建海量日志分析平台引言在当前的微服务架构体系中，一个复杂的业务流程往往会横跨数十甚至上百个服务。当线上出现问题时，如何从每天产生的TB级海量日志中快速定位根源，成为衡量系统可观测性的关键。传统的日志聚合方案在面对如此巨大的数据量时，普遍会遇到两大核心挑战：高并发写入瓶颈：数千个服务实例同时产生大量日志，要求日志系统具备极高的写入吞吐能力，
Postman设置Referer头部的作用
设置HTTP请求头中的Referer字段主要有以下作用和意义：‌来源追踪与统计分析‌Referer用于记录用户访问当前页面的来源地址，帮助网站分析流量来源渠道（如搜索引擎、外部链接等），统计不同入口的转化率。例如统计来自谷歌或百度的搜索访问量，优化营销策略‌。‌防盗链保护‌通过检查Referer是否来自白名单域名，可防止其他网站直接盗用图片、视频等静态资源（如CDN加速场景）。若Referer不匹
Elasticsearch分组后排序，并查询组数量 Gzzz__ Elasticsearch elasticsearch java 大数据
项目场景：Elasticsearch分组后，根据分组后的数量排序，并查询分组后的组数量，通过DSL和javaAPI两种方式解决方案：示例：在单据表中，查询2022-01-19当天每个人提交的单据数量，从高到低排序，并查询提交过单据的总人数。期望实现的SQLselectId,count(Id)ascfromuserbillwheretype='bill'andcreateTime>='2022-01
百度颠覆了自己，飞算JavaAI造福了中国程序员！飞算JavaAI开发助手百度
在当今这个科技日新月异的时代，企业纷纷寻求技术突破，以期在激烈的市场竞争中脱颖而出。百度，作为中国互联网行业的领军企业之一，凭借其强大的科技实力和创新能力，在人工智能等多个领域取得了显著成就，并正在逐步颠覆自身的传统形象。百度自成立之初，就将技术创新视为企业的生命线。从最初的搜索引擎技术，到如今的深度学习、自然语言处理、计算机视觉等前沿领域，百度始终走在技术革新的前沿。其自主研发的飞桨深度学习平台
MapReduce01：基本原理和wordCount代码实现冬至喵喵大数据 mapreduce
本篇文章中，笔者记录了自己对于MapReduce的肤浅理解，参考资料主要包括《大数据Hadoop3.X分布式处理实战》和网络视频课程。下文介绍了MapReduce的基本概念、运行逻辑以及在wordCount代码示例。一、MapReduce概述1.概述google为解决其搜索引擎中的大规模网页数据的并行化处理问题，设计了MapReduce，在发明MapReduce之后首先用其重新改写了搜索引擎中we
ES 和 lucene 的区别是什么？晚夜微雨问海棠呀 elasticsearch lucene 大数据
Elasticsearch(ES)和Lucene都是用于全文搜索和分析的工具，但它们在功能和使用场景上有一些重要的区别：基础与角色：Lucene是一个开源的信息检索软件库，提供了一个高性能、全功能的文本搜索引擎。它是许多搜索应用的核心，包括Elasticsearch。Elasticsearch是一个分布式搜索和分析引擎，构建在Lucene之上。它不仅提供了Lucene的所有功能，还增加了分布式计算
Lucence 和 Elasticsearch 的区别? 码出财富 elasticsearch 大数据搜索引擎
Lucene和Elasticsearch都是在信息检索和文本处理领域中广泛使用的工具，它们的主要区别如下：概念和定位Lucene：是一个基于Java的全文检索库，它提供了一套强大的底层索引和搜索功能的API。Lucene更像是一个工具包，开发人员可以基于它来构建自己的搜索应用程序，需要深入了解搜索的底层原理和算法，对开发者的技术要求较高。Elasticsearch：是一个基于Lucene的分布式搜
AI取代人类？不，真正淘汰你的是“不会用AI”的人 zhuzhi 人工智能 chatgpt
“AI会让人类失业吗？”——这个问题在过去几年被反复讨论。ChatGPT的爆火、MidJourney颠覆设计行业、自动驾驶取代司机……似乎AI正在“抢走”人类的工作。但真相是：AI不会取代所有人，但它会取代那些不会使用AI的人。未来10年，职场竞争不再是“人类VSAI”，而是**“会用AI的人”VS“不用AI的人”**。就像20年前互联网刚普及时，会用搜索引擎的人比只会翻书的人效率高10倍；今天，
Cache与DB的数据一致性（缓存更新设计模式和操作顺序）
description:总结Cache与DB的数据一致性相关内容。缓存一致性的三个障碍当对主数据库的更改未反映在缓存中时更新缓存结果时出现延迟当缓存节点之间不一致时如何设计缓存更新模式？首先，提出我阅读相关文章时遇到的疑惑。当我使用搜索引擎（百度orGoogle）去搜索缓存与数据库的数据一致性如何保证时,我会看到三种结果：仅讲解先操作数据库or先操作缓存（最多）讲解四种缓存更新策略模式将上述两者结
2023年JAVA面试题【Redis/Elasticsearch】 GJH-JAVA java redis elasticsearch
1.什么是Redis？Redis是一个使用C语言写成的，开源的高性能key-value非关系缓存数据库。它支持存储的value类型相对更多，包括string(字符串)、list(链表)、set(集合)、zset(sortedset--有序集合)和hash（哈希类型）。Redis的数据都基于缓存的，所以很快，每秒可以处理超过10万次读写操作，是已知性能最快的Key-ValueDB。Redis也可以实
后端Spring Data Elasticsearch的集群故障恢复 AI大模型应用实战 spring elasticsearch java ai
后端SpringDataElasticsearch的集群故障恢复关键词：SpringDataElasticsearch、集群故障恢复、分布式系统、故障处理、数据一致性摘要：本文围绕后端SpringDataElasticsearch的集群故障恢复展开深入探讨。首先介绍了相关背景，包括目的范围、预期读者等。接着阐述了核心概念与联系，详细讲解了核心算法原理及具体操作步骤，并结合数学模型和公式进行说明。通
SeaTunnel 社区月报（5-6 月）：全新功能上线、Bug 大扫除、Merge 之星是谁？数据库
在5月和6月，SeaTunnel社区迎来了一轮密集更新：2.3.11正式发布，新增对Databend、Elasticsearch向量、HTTP批量写入、ClickHouse多表写入等多个连接器能力，全面提升了数据同步灵活性。同时，近100个修复与优化PR合入，涵盖Spark引擎并行性修复、Paimon精度兼容性增强、Mongo-CDCExactlyOnce默认值优化、OracleDDL类型支持补全
elasticsearch 9200登录接口 leijmdas elasticsearch
嗯，关于Elasticsearch通过9200端口的登录接口，本质是启用安全认证后对HTTP请求的身份验证机制。以下是核心要点及操作指南：一、认证方式基础认证（用户名+密码）访问http://localhost:9200时会弹出登录框，需输入用户名和密码。默认超级用户：elastic，首次安装后密码需通过命令生成：./bin/elasticsearch-reset-password-uelasti
Springboot整合Elasticsearch及常用方法大全水木石画室 spring boot elasticsearch jenkins
SpringBoot整合Elasticsearch是企业级开发中常见的需求，用于实现高效的全文检索、日志分析等功能。以下是整合的核心步骤和常用方法大全，涵盖从基础配置到高级操作的完整流程。一、环境准备与依赖配置1.环境要求Elasticsearch：需先安装并启动（建议7.10+或8.x版本，与SpringDataElasticsearch兼容）。SpringBoot：推荐2.7.x或3.x版本（
一款wordperss AI免费插件自动内容生成+前端AI交互+文章批量采集 Linkreate 前端人工智能 wordpress wordpressAI插件 wordpress免费插件 wordpress自动发文自动发文源码
一款LinkreatewordperssAI自动内容生成+前端AI会话窗口交互+文章批量采集免费插件1.SEO优化文章生成关键词驱动的内容生成：用户可以输入关键词或长尾关键词，插件会根据这些关键词生成高质量的SEO优化文章。文章结构清晰，语言自然流畅，符合SEO标准，能够有效提升网站内容的搜索引擎排名。自定义文章长度和要求：用户可以根据需要指定文章的长度（字数）以及对文章的额外要求，例如内容风格、
如何在宝塔面板中配置SSL证书？奔跑吧邓邓子高效运维 ssl 服务器网络协议
提示：“奔跑吧邓邓子”的高效运维专栏聚焦于各类运维场景中的实际操作与问题解决。内容涵盖服务器硬件（如IBMSystem3650M5）、云服务平台（如腾讯云、华为云）、服务器软件（如Nginx、Apache、GitLab、Redis、Elasticsearch、Kubernetes、Docker等）、开发工具（如Git、HBuilder）以及网络安全（如挖矿病毒排查、SSL证书配置）等多个方面。无论
导师要求一天完成综述，我7分钟搞定——打造一个全本地DeepResearch助手小洛~·~ 人工智能深度学习 chatgpt gpt AI写作
1.项目背景LocalDeepResearcher是一个本地化运行的AI研究助手，旨在通过结合大语言模型（LLM）和搜索工具，实现自动化深度研究并生成结构化报告。该项目由LangChainAI开发，支持本地模型（例如通过Ollama运行的deepseek-r1:7b）和云端模型（例如Claude、GPT），并集成了多种搜索引擎（如Tavily、DuckDuckGo）。其本地优先的设计确保了数据隐私
如何向AI提问？人邮异步社区人工智能 AI编程程序员大模型
如何向AI提问？让我们从DeepSeek开始入手。DeepSeek不是一个单纯的搜索引擎，更不是一个单纯听你指令的、只会执行命令的“机器人”。如果只是把它单纯当作高级搜索、当作执行命令的机器人，就严重低估了它的价值。DeepSeek能帮我们完成如下工作：DeepSeek的这几个功能是什么？结合DeepSeekApp界面，我们详细介绍一下几个常用的功能。上传文件：除了采用文字交互方式，用户也可以上传
推荐几本人工智能方面的书（入门级）人邮异步社区人工智能深度学习神经网络
以下推荐几本适合入门人工智能的书籍，帮助你逐步建立基础知识和理解：一、数学基础类《数学之美》推荐理由：深入浅出地讲解了自然语言处理与搜索方向的数学原理，对于理解算法背后的数学逻辑非常有帮助。本书的章节名称，有“统计语言模型”“谈谈中文分词”“贾里尼克和现代语言处理”“布尔代数和搜索引擎”“信息指纹及其应用”等，似乎太过专业，实际上高中和大学低年级的同学们都能看得懂，当然本书因此也可以称得上是“高级
linux安装elasticsearch-head（快速，详细） Dyansts linux elasticsearch 运维 npm centos
前提见此文章https://blog.csdn.net/rj2012001/article/details/121816878?spm=1001.2014.3001.55011.下载zip格式在elasticsearch文件夹wgethttps://codeload.github.com/mobz/elasticsearch-head/zip/refs/heads/master2.解压zip文件u
Elasticsearch（ES）聚合思静鱼 #elasticsearch elasticsearch jenkins 大数据
Elasticsearch（ES）的聚合（Aggregation）功能类似于SQL中的GROUPBY+聚合函数（如COUNT、AVG、SUM），是进行统计分析的核心机制。聚合（Aggregation）概述Elasticsearch的聚合分为三大类：类别说明Metric聚合计算数值（如：count、avg、sum、max、min）Bucket聚合类似于SQL的GROUPBY，把文档分类Pipelin
LOGO SEO优化码哥DFS 前端 html css
1.logo里面首先放一个h1标签，目的是为了提权，告诉搜索引擎，这个地方很重要。2.h1里面再放一个链接，可以返回首页的，把logo的背景图片给链接即可。3.为了搜索引擎收录我们，我们链接里面要放文字(网站名称)，但是文字不要显示出来。方法1:text-indent移到盒子外面(text-indent:-9999px),然后overflow:hidden。方法2:直接给font-size:0;就
【Elasticsearch】most_fields、best_fields、cross_fields 的区别与用法 G皮T elasticsearch 大数据搜索引擎 multi_match best_fields most_fields cross_fields
most_fields、best_fields、cross_fields的区别与用法1.核心区别概述2.详细解析与用法2.1best_fields（最佳字段匹配）2.2most_fields（多字段匹配）2.3cross_fields（跨字段匹配）3.对比案例3.1使用best_fields搜索3.2使用most_fields搜索3.3使用cross_fields搜索4.选型建议1.核心区别概述这
Python爬虫实战：研究difflib库相关技术 ylfhpy 爬虫项目实战 python 爬虫 easyui 开发语言前端 difflib
1.引言1.1研究背景与意义在信息爆炸的数字时代，互联网每天产生海量文本内容。据统计，全球新闻网站日均发布文章超过300万篇，社交媒体平台产生的文本信息量更以亿级单位增长。这种信息过载带来了内容同质化、抄袭剽窃等问题，给新闻媒体行业、学术研究领域和搜索引擎优化等带来了挑战。文本相似度分析作为自然语言处理的重要分支，能够有效识别内容间的相似程度，具有重要的应用价值：新闻媒体行业：通过检测新闻抄袭和重
信息检索简介——文本处理、搜索引擎、数据挖掘、机器学习、推荐系统等 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介2005年8月17日至9月3日在美国加利福尼亚州伯克莱纳举行了SIGIR国际会议（中文全称“计算机信息retrieval国际会议”），这是信息检索领域的顶级会议之一。该会议由ACM主办，主题涵盖了包括文本处理、搜索引擎、数据挖掘、机器学习、推荐系统等多个热门方向。此次会议是第一次将信息检索作为一个学科，并取得重大突破。本文试图对SIGIR进行一个完整的介绍，阐述
BaiduSitemap - Typecho站点地图生成与多搜索引擎推送插件独立开发者阿乐原创 javascript 云计算自动化大数据数据分析
文章目录BaiduSitemap-Typecho站点地图生成与多搜索引擎推送插件✨功能特点插件架构核心模块文件结构安装方法方法一：手动安装方法二：Git克隆⚙️配置说明站点地图基本设置搜索引擎配置百度搜索引擎必应（Bing）搜索引擎谷歌（Google）搜索引擎使用指南站点地图访问手动操作站点地图包含内容高级功能图片索引优化推送状态监控技术实现详解站点地图生成流程搜索引擎推送机制缓存机制❓常见问题站
【企业研发】ELK开发 flyair_China django python 后端
一、ElasticSearchElasticsearch作为当前最流行的全文检索引擎之一，在众多领域展现出强大的搜索和分析能力。1.1、全文检索与精准检索的差异Elasticsearch提供两种主要的查询方式：全文检索匹配检索(Full-textMatchQuery)和精准匹配检索(ExactMatchQuery)，它们在处理查询词和索引数据时有显著区别。1.精准匹配检索(ExactMatchQu
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr