学nm个锤子

Elasticsearch入门使用篇

一，搜索的概念和软件的安装

1.什么是搜索

搜索：计算机根据用户输入的关键词进行匹配，从已有的数据库中摘录出相关的记录反馈给用户。

常见的全网搜索引擎，有百度、谷歌这样搜索网站。

除此，搜索技术在垂直领域也有广泛的使用，比如淘宝、京东搜索商品，万芳、知网搜索期刊，CSDN中搜索问题贴。也都是基于海量数据的搜索。

以电商网站为例，展示搜索功能的使用

2.对比传统关系型数据库和搜索

1）传统关系型数据库

弊端：库存量单位

对于传统的关系型数据库对于关键词的查询，只能逐字逐行的匹配，性能非常差。

匹配方式不合理，比如搜索“小密手机”，如果用like进行匹配，根本匹配不到。但是考虑使用者的用户体验的话，除了完全匹配的记录，还应该显示一部分近似匹配的记录，至少应该匹配到“手机”。

而且，模糊查询存在like关键字，会使索引失效。

2）专业全文索引引擎

全文搜索引擎目前主流的索引技术就是倒排索引的方式。

传统的保存数据的方式

	记录→单词

而倒排索引的保存数据的方式

	单词→记录

例如：搜索“华为手机”

数据库保存数据如下：

搜索时只能匹配一条id为2的数据

商品ID	商品标题	商品价格
1	小米手机	1999
2	华为手机	4999
3	小米电视	2999
4	…	…

搜索引擎基于分词技术构建倒排索引！存储数据如下：

分词	文档ID	文档
小米	1,3	Document->[{1,小米手机,1999},{3,小米电视,2999}]
华为	2	Document->[{2,华为手机,4999}]
手机	1,2	Document->[{1,小米手机,1999},{2,华为手机,4999}]
电视	3	Document->[{3,小米电视,2999}]
…

用户搜索时，会把搜索的关键词也进行分词，会把“华为手机”分词分成：华为和手机两个词。

这样的话，先用【华为】进行匹配，得到id为2的文档ID，再用【手机】进行匹配，得到id为1,2的文档ID。

那么全文索引通常，还会根据匹配程度进行打分，显然2号记录能匹配的次数更多。所以显示的时候以评分进行排序的话，2号记录会排到最前面。

3.ElasticSearch

Elaticsearch，简称为es， es是一个开源的高扩展的分布式全文检索引擎。

它可以近乎实时的存储、检索数据；本身扩展性很好，可以扩展到上百台服务器，处理PB级别的数据。

ES可以使用Java开发，并使用Lucene作为其核心来实现所有索引和搜索的功能，但是它的目的是通过简单的RESTful API来隐藏Lucene的复杂性，从而让全文搜索变得简单。

4.`Lucene`与`ElasticSearch`

咱们之前讲的处理分词，构建倒排索引等等，都是这个叫lucene做的。那么，能不能说这个Lucene就是搜索引擎呢？还不能。

Lucene只是一个提供全文搜索功能类库的核心工具包，而真正使用它还需要一个完善的服务框架搭建起来进行应用。

目前市面上流行的搜索引擎软件，主流的就两款：Elasticsearch和Solr,这两款都是基于Lucene搭建的，可以独立部署启动的搜索引擎服务软件。由于内核相同，所以两者除了服务器安装、部署、管理、集群以外，对于数据的操作修改、添加、保存、查询等等都十分类似。

5.`ElasticSearch`对比`Solr`

	ElasticSearch	Solr
管理方式	自身带有分布式协调管理功能	利用 Zookeeper 进行分布式管理
数据格式	仅支持json文件格式	支持更多格式的数据
功能与拓展	本身更注重于核心功能，高级功能多由第三方插件提供	官方提供的功能更多
表现	在处理实时搜索应用时效率明显低于 ElasticSearch	Solr 在传统的搜索应用中表现好于 ElasticSearch

6.软件的介绍与安装

1）服务器

解压就可以使用。启动命令：elasticsearch.bat

2）客户端工具

解压就可以使用，只需要修改配置文件的少量配置。

配置文件位置：G:\es\kibana-6.8.1-windows-x86_64\config\kibana.yml

3）中文分词插件

只需要把它解压到G:\es\elasticsearch-6.8.1\plugins\ik就可以使用。注意压缩包不能放在该目录下。

二， ElasticSearch相关概念(术语)

Elasticsearch是面向文档型数据库，一条数据在这里就是一个文档，用JSON作为文档序列化的格式，比如下面这条用户数据：

{
    "name" :     "John",
    "sex" :      "Male",
    "age" :      25,
    "birthDate": "1990/05/01",
    "about" :    "I love to go rock climbing",
    "interests": [ "sports", "music" ]
}

用Mysql这样的数据库存储就会容易想到建立一张User表，有balabala的字段等，在ElasticSearch里这就是一个文档，当然这个文档会属于一个User的类型，各种各样的类型存在于一个索引当中。这里有一份简易的将Elasticsearch和关系型数据术语对照表:

Elasticsearch	索引(Index)	类型(Type)	文档(Documents)	字段(Fields)

关系数据库(MySQL)	数据库(DataBase)	表(Table)	行(Rows)	列(Columns)

1.索引

一个索引就是一个拥有几分相似特征的文档的集合。

Elasticsearch索引的精髓：一切设计都是为了提高搜索的性能。

2.类型Type

在一个索引中，你可以定义一种或多种类型。

一个类型是你的索引的一个逻辑上的分类/分区，其语义完全由你来定。通常，会为具有一组共同字段的文档定义一个类型。

3.字段Field

相当于是数据表的字段，对文档数据根据不同属性进行的分类标识。

4.映射 mapping

mapping是处理数据的方式和规则方面做一些限制，如：某个字段的数据类型、默认值、分析器、是否被索引等等。

这些都是映射里面可以设置的，其它就是处理ES里面数据的一些使用规则设置也叫做映射，按着最优规则处理数据对性能提高很大，因此才需要建立映射，并且需要思考如何建立映射才能对性能更好。

5.文档 document

一个文档是一个可被索引的基础信息单元。

比如：你可以拥有某一个客户的文档，某一个产品的一个文档，当然，也可以拥有某个订单的一个文档。文档以JSON（Javascript Object Notation）格式来表示，而JSON是一个到处存在的互联网数据交互格式。

在一个index/type里面，你可以存储任意多的文档。注意，尽管一个文档，物理上存在于一个索引之中，文档必须被索引/赋予一个索引的type。

6.接近实时

ElasticSearch是一个接近实时（Near Real Time，简称NRT）的搜索平台。这意味着，从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟（通常是1秒以内）。

三，`ElasticSearch`的客户端操作

客户端工具：发送http请求(RESTful风格**)操作：**9200端口

	使用**Postman**发送请求直接操作

	使用**ElasticSearch-head-master**图形化界面插件操作

	使用Elastic**官方**数据可视化的平台**Kibana**进行操作【推荐】

Java代码操作：9300端口

	`Elasticsearch`提供的`Java API `客户端进行操作

	`Spring Data ElasticSearch` 持久层框架进行操作

1.创建索引库

PUT /shopping

在kibana中，不用写地址和端口，/shopping是简化写法，真实请求地址是：

http://127.0.0.1:9200/shopping

响应结果

#! Deprecation: the default number of shards will change from [5] to [1] in 7.0.0; if you wish to continue using the default of [5] shards, you must manage this on the create index request or with an index template
{
  "acknowledged" : true,
  "shards_acknowledged" : true,
  "index" : "shopping"
}

“acknowledged” : true, 代表操作成功

“shards_acknowledged” : true, 代表分片操作成功

“index” : “shopping” 表示创建的索引库名称

注意：创建索引库的分片数默认5片，在7.0.0之后的ElasticSearch版本中，默认1片；

重复添加：报错，已经存在

2.查看所有索引

GET /_cat/indices?v

表头的含义（查看帮助信息：GET /_cat/indices?help）

health	当前服务器健康状态： green(集群完整) yellow(单点正常、集群不完整) red(单点不正常)
status	索引打开、关闭状态
index	索引名
uuid	索引统一编号
pri	主分片数量
rep	副分片数量
docs.count	可用文档数量
docs.deleted	文档删除状态(逻辑删除，段合并时被清理)
store.size	主分片和副分片整体占空间大小
pri.store.size	主分片占空间大小

3.查看某个索引

GET /shopping

响应结果

{
  "shopping" : {
    "aliases" : { },
    "mappings" : { },
    "settings" : {
      "index" : {
        "creation_date" : "1586587411462",
        "number_of_shards" : "5",
        "number_of_replicas" : "1",
        "uuid" : "VCl1hHsJQDe2p2dn46o0NA",
        "version" : {
          "created" : "6080199"
        },
        "provided_name" : "shopping"
      }
    }
  }
}

内容解释

{
  "shopping【索引库名】" : {
    "aliases【别名】" : { },
    "mappings【映射】" : { },
    "settings"【索引库设置】 : {
      "index【索引】" : {
        "creation_date【创建时间】" : "1586587411462",
        "number_of_shards【索引库分片数】" : "5",
        "number_of_replicas【索引库副本数】" : "1",
        "uuid【唯一标识】" : "VCl1hHsJQDe2p2dn46o0NA",
        "version【版本】" : {
          "created" : "6080199"
        },
        "provided_name【索引库名称】" : "shopping"
      }
    }
  }
}

4.删除索引

DELETE /shopping

响应结果

{
  "acknowledged" : true
}

5.类型及映射操作

1）创建类型映射

有了索引库，等于有了数据库中的database。

接下来就需要建索引库(index)中的类型(type)了，类似于数据库(database)中的表(table)。创建数据库表需要设置字段名称，类型，长度，约束等；索引库也一样，在创建索引库的类型时，需要知道这个类型下有哪些字段，每个字段有哪些约束信息，这就叫做映射(mapping)。

给shopping这个索引库添加了一个名为product的类型，并且在类型中设置了4个字段：

title：商品标题

subtitle: 商品子标题

images：商品图片

price：商品价格

put /shopping/product/_mapping
{
  "properties":{
    "title":{
      "type":"text",
      "analyzer":"ik_max_word"
    },
    "subtitle":{
      "type":"text",
      "analyzer":"ik_max_word"
    },
    "images":{
      "type":"keyword",
      "index":false
    },
    "price":{
      "type":"float",
      "index":true
    }
  }
}

响应结果

{
  "acknowledged" : true
}

类型名称：就是前面将的type的概念，类似于数据库中的表

字段名：任意填写，下面指定许多属性，例如：title、subtitle、images、price

type：类型，Elasticsearch中支持的数据类型非常丰富，说几个关键的：

①String类型，又分两种：

text：可分词

keyword：不可分词，数据会作为完整字段进行匹配

②Numerical：数值类型，分两类

基本数据类型：long、interger、short、byte、double、float、half_float

浮点数的高精度类型：scaled_float

③Date：日期类型

④Array：数组类型

⑤Object：对象

index：是否索引，默认为true，也就是说你不进行任何配置，所有字段都会被索引。

true：字段会被索引，则可以用来进行搜索

false：字段不会被索引，不能用来搜索

store：是否将数据进行独立存储，默认为false

原始的文本会存储在**_source**里面，默认情况下其他提取出来的字段都不是独立存储的，是从_source里面提取出来的。当然你也可以独立的存储某个字段，只要设置"store": true即可，获取独立存储的字段要比从_source中解析快得多，但是也会占用更多的空间，所以要根据实际业务需求来设置。

analyzer：分词器，这里的ik_max_word即使用ik分词器

2）查看类型映射

GET /shopping/product/_mapping

响应结果

{
  "shopping" : {
    "mappings" : {
      "product" : {
        "properties" : {
          "images" : {
            "type" : "keyword",
            "index" : false
          },
          "price" : {
            "type" : "float"
          },
          "subtitle" : {
            "type" : "text",
            "analyzer" : "ik_max_word"
          },
          "title" : {
            "type" : "text",
            "analyzer" : "ik_max_word"
          }
        }
      }
    }
  }
}

3）创建索引库同时进行映射配置（常用）

PUT /shopping2
{
  "settings": {},
  "mappings": {
    "product":{
      "properties": {
        "title":{
          "type": "text",
          "analyzer": "ik_max_word"
          
        },
        "subtitle":{
          "type": "text",
          "analyzer": "ik_max_word"
        },
        "images":{
          "type": "keyword",
          "index": false
        },
        "price":{
          "type": "float",
          "index": true
        }
      }
    }
  }
}

响应结果

{
  "acknowledged" : true,
  "shards_acknowledged" : true,
  "index" : "shopping2"
}

4）【文档操作】【基本CURD操作】

1.新建文档

POST /shopping/product
{
    "title":"小米手机",
    "images":"http://www.gulixueyuan.com/xm.jpg",
    "price":3999.00
}

响应结果

{
  "_index" : "shopping",
  "_type" : "product",
  "_id" : "indGaHEB1ahbZ0SRrXt3",
  "_version" : 1,
  "result" : "created",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 0,
  "_primary_term" : 1
}

响应结果解释

{
  "_index【索引库】" : "shopping",
  "_type【类型】" : "product",
  "_id【主键id】" : "indGaHEB1ahbZ0SRrXt3",
  "_version【版本】" : 1,
  "result【操作结果】" : "created",
  "_shards【分片】" : {
    "total【总数】" : 2,
    "successful【成功】" : 1,
    "failed【失败】" : 0
  },
  "_seq_no" : 0,
  "_primary_term" : 1
}

可以看到结果显示为：created，是创建成功了。另外，需要注意的是，在响应结果中有个_id字段，这个就是这条文档数据的唯一标识，以后的增删改查都依赖这个id作为唯一标示。可以看到id的值为：indGaHEB1ahbZ0SRrXt3，这里我们新增时没有指定id，所以是ES帮我们随机生成的id。

多创建几条语句

POST /shopping/product/2
{
    "title":"华为手机",
    "images":"http://www.gulixueyuan.com/hw.jpg",
    "price":4999.00
}
 
POST /shopping/product/3
{
    "title":"小米电视",
    "images":"http://www.gulixueyuan.com/xmds.jpg",
    "price":5999.00
}

2.查看文档

GET /shopping/product/indGaHEB1ahbZ0SRrXt3

响应结果

{
  "_index" : "shopping",
  "_type" : "product",
  "_id" : "indGaHEB1ahbZ0SRrXt3",
  "_version" : 1,
  "_seq_no" : 0,
  "_primary_term" : 1,
  "found" : true,
  "_source" : {
    "title" : "小米手机",
    "images" : "http://www.gulixueyuan.com/xm.jpg",
    "price" : 3999.0
  }
}

响应结果解释

{
  "_index【索引库】" : "shopping",
  "_type【类型】" : "product",
  "_id【主键id】" : "indGaHEB1ahbZ0SRrXt3",
  "_version【版本】" : 1,
  "_seq_no" : 0,
  "_primary_term" : 1,
  "found【查询结果】" : true,
  "_source【源文档信息】" : {
    "title" : "小米手机",
    "images" : "http://www.gulixueyuan.com/xm.jpg",
    "price" : 3999.0
  }
}

_source：源文档信息，所有的数据都在里面。

_id：这条文档的唯一标示

found：查询结果，返回true代表查到，false代表没有

3.自定义ID新建文档

POST /shopping/product/1
{
    "title":"小米手机",
    "images":"http://www.gulixueyuan.com/xm.jpg",
    "price":3999.00
}

响应结果

{
  "_index" : "shopping",
  "_type" : "product",
  "_id" : "1",
  "_version" : 1,
  "result" : "created",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 1,
  "_primary_term" : 1
}

主键id变为指定的id

4.修改文档

请求url不变，请求体变化，会将原有数据内容覆盖。

POST /shopping/product/1
{
    "title":"华为手机",
    "images":"http://www.gulixueyuan.com/hw.jpg",
    "price":4999.00
}

响应结果

{
  "_index" : "shopping",
  "_type" : "product",
  "_id" : "1",
  "_version" : 2,
  "result" : "updated",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 2,
  "_primary_term" : 1
}

可以看到result结果是：updated，使用GET /shopping/product/1查询，发现数据被更新。

5.根据id修改某一个字段

POST /shopping/product/1/_update
{ 
  "doc": {
    "price":3000.00
  } 
}

响应结果：

{
  "_index" : "shopping",
  "_type" : "product",
  "_id" : "1",
  "_version" : 2,
  "result" : "updated",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 8,
  "_primary_term" : 1
}

可以看到result结果是：updated，使用GET /shopping/product/1查询，发现数据被更新。

6.删除一条文档

删除一个文档不会立即从磁盘上移除，它只是被标记成已删除（逻辑删除）。

Elasticsearch会在段合并时（磁盘碎片整理）进行删除内容的清理。

DELETE /shopping/product/1

响应结果

{
  "_index" : "shopping",
  "_type" : "product",
  "_id" : "1",
  "_version" : 3,
  "result" : "deleted",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 3,
  "_primary_term" : 1
}

可以看到result结果是：deleted，数据被删除。如果删除不存在的文档，result：not_found

例如：DELETE /shopping/product/11主键不存在

{
  "_index" : "shopping",
  "_type" : "product",
  "_id" : "11",
  "_version" : 1,
  "result" : "not_found",
  "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
  },
  "_seq_no" : 0,
  "_primary_term" : 1
}

7.根据条件删除文档

POST /shopping/product/_delete_by_query
{
  "query":{
    "match":{
      "title":"手机"
    }
  }
}

响应结果

{
  "took" : 33,
  "timed_out" : false,
  "total" : 2,
  "deleted" : 2,
  "batches" : 1,
  "version_conflicts" : 0,
  "noops" : 0,
  "retries" : {
    "bulk" : 0,
    "search" : 0
  },
  "throttled_millis" : 0,
  "requests_per_second" : -1.0,
  "throttled_until_millis" : 0,
  "failures" : [ ]
}

响应结果解释

{
  "took【耗时】" : 33,
  "timed_out【是否超时】" : false,
  "total【总数】" : 2,
  "deleted【删除总数】" : 2,
  "batches" : 1,
  "version_conflicts" : 0,
  "noops" : 0,
  "retries" : {
    "bulk" : 0,
    "search" : 0
  },
  "throttled_millis" : 0,
  "requests_per_second" : -1.0,
  "throttled_until_millis" : 0,
  "failures" : [ ]
}

5）请求体查询【基本查询】

1.请求体查询

Elasticsearch基于JSON提供完整的查询DSL来定义查询。

DSL（Domain Specific Language）：领域特定语言

2.基础数据

POST /shopping/product/1
{
    "title":"小米手机",
    "images":"http://www.gulixueyuan.com/xm.jpg",
    "price":3999.00
}
 
POST /shopping/product/2
{
    "title":"华为手机",
    "images":"http://www.gulixueyuan.com/hw.jpg",
    "price":4999.00
}
 
POST /shopping/product/3
{
    "title":"小米电视",
    "images":"http://www.gulixueyuan.com/xmds.jpg",
    "price":5999.00
}

3.基本查询

1）查询所有（match_all）

GET /shopping/_search
{
  "query": {
    "match_all": {}
  }
}

GET  /{索引库}/_search
{
    "query":{
        "查询类型":{
            "查询条件":"查询条件值"
        }
    }
}

“query”：这里的query代表一个查询对象，里面可以有不同的查询属性

“查询类型”：例如：match_all(代表查询所有)， match，term ， range 等等

“查询条件”：查询条件会根据类型的不同，写法也有差异

2)匹配查询（match）

GET /shopping/_search
{
  "query": {
    "match": {
      "title": "小米手机"
    }
  }
}

在上面的案例中，不仅会查询到电视，而且与小米相关的都会查询到。

某些情况下，我们需要更精确查找，我们希望这个关系变成and，可以这样做：

GET /shopping/_search
{
  "query": {
    "match": {
      "title": {
        "query": "小米手机",
        "operator": "and"
      }
    }
  }
}

3）多字段匹配查询(multi_match)

multi_match与match类似，不同的是它可以在多个字段中查询。

# 请求方法：GET
#fields属性：设置查询的多个字段名称
GET /shopping/_search
{
  "query": {
    "multi_match": {
        "query": "小米",
        "fields": ["title","subtitle"]
    }
  }
}

4) 关键词精确查询(term)

term查询，精确的关键词匹配查询，不对查询条件进行分词。

# 请求方法：GET
GET /shopping/_search
{
  "query": {
    "term": {
      "title": {
        "value": "小米"
      }
    }
  }
}

5) 多关键词精确查询(terms)

terms 查询和 term 查询一样，但它允许你指定多值进行匹配。

如果这个字段包含了指定值中的任何一个值，那么这个文档满足条件，类似于mysql的in

# 请求方法：GET
GET /shopping/_search
{
  "query": {
    "terms": {
      "price": [3999,5999]
    }
  }
}

6）【请求体查询】【结果过滤】

1.指定查询条件

默认情况下，ElasticSearch在搜索的结果中，会把文档中保存在_source的所有字段都返回。

如果我们只想获取其中的部分字段，我们可以添加_source的过滤

# 请求方法：GET
GET /shopping/_search
{
  "_source": ["title","price"],  
  "query": {
    "terms": {
      "price": [3999]
    }
  }
}

2. 过滤指定字段：includes和excludes

我们也可以通过：

includes：来指定想要显示的字段

excludes：来指定不想要显示的字段

# 请求方法：GET
GET /shopping/_search
{
  "_source": {
    "includes": ["title","price"]
  },  
  "query": {
    "terms": {
      "price": [3999]
    }
  }
}
 
GET /shopping/_search
{
  "_source": {
    "excludes": ["images"]
  },  
  "query": {
    "terms": {
      "price": [3999]
    }
  }
}

7）【请求体查询】【高级查询】

1. 布尔组合(bool)

bool把各种其它查询通过must（必须）、must_not（必须不）、should（应该）的方式进行组合

# 请求方法：GET
GET /shopping/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "title": "小米"
          }
        }
      ],
      "must_not": [
        {
          "match": {
            "title": "电视"
          }
        }
      ],
      "should": [
        {
          "match": {
            "title": "手机"
          }
        }
      ]
    }
  }
}

2. 范围查询（range）

range 查询找出那些落在指定区间内的数字或者时间。range查询允许以下字符：

操作符	说明
gt == (greater than)	大于>
gte == (greater than equal)	大于等于>=
lt == (less than)	小于<
lte == (less than equal)	小于等于<=

# 请求方法：GET
GET /shopping/_search
{
  "query": {
    "range": {
      "price": {
        "gte": 2500,
        "lte": 4000
      }
    }
  }
}

3.模糊查询

返回包含与搜索字词相似的字词的文档。

编辑距离是将一个术语转换为另一个术语所需的一个字符更改的次数。这些更改可以包括：

更改字符（box → fox）

删除字符（black → lack）

插入字符（sic → sick）

转置两个相邻字符（act → cat）

为了找到相似的术语，fuzzy查询会在指定的编辑距离内创建一组搜索词的所有可能的变体或扩展。然后查询返回每个扩展的完全匹配。

通过fuzziness修改编辑距离。一般使用默认值AUTO，根据术语的长度生成编辑距离。

0…2

必须完全匹配

3…5

允许一次编辑

允许进行两次编辑

GET /shopping/_search
{
  "query": {
    "fuzzy": {
      "title": {
        "value": "ccple"
      }
    }
  }
}

 
GET /shopping/_search
{
  "query": {
    "fuzzy": {
      "title": {
        "value": "ccple",
        "fuzziness": 2
      }
    }
  }
}

8）【请求体查询】【查询排序】

1.单字段排序

sort 可以让我们按照不同的字段进行排序，并且通过order指定排序的方式。desc降序，asc升序。

# 请求方法：GET
GET /shopping/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "price": {
        "order": "desc"
      }
    }
  ]
}

2.多字段排序

假定我们想要结合使用 price和 _score（得分）进行查询，并且匹配的结果首先按照价格排序，然后按照相关性得分排序：

# 请求方法：GET
GET /shopping/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "price": {
        "order": "desc"
      }
    },
    {
      "_score":{
        "order": "desc"
      }
    }
  ]
}

9）【请求体查询】【高亮查询】

在进行关键字搜索时，搜索出的内容中的关键字会显示不同的颜色，称之为高亮。

高亮查询请求

ElasticSearch可以对查询内容中的关键字部分，进行标签和样式(高亮)的设置。

在使用match查询的同时，加上一个highlight属性：

pre_tags：前置标签

post_tags：后置标签

fields：需要高亮的字段

title：这里声明title字段需要高亮，后面可以为这个字段设置特有配置，也可以空

# 请求方法：GET
GET /shopping/_search
{
  "query": {
    "match": {
      "title": "华为"
    }
  },
  "highlight": {
    "pre_tags": "",
    "post_tags": "",
    "fields": {
      "title": {}
    }
  }
}

10）【请求体查询】【分页查询】

from：当前页的起始索引，默认从0开始。 from = (pageNum - 1) * size

size：每页显示多少条

# 请求方法：GET
GET /shopping/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "price": {
        "order": "desc"
      }
    },
    {
      "_score":{
        "order": "desc"
      }
    }
  ],
  "from": 0,
  "size": 2
}

四，`ElasticSearch`集群

1.相关概念

1.单点故障问题

单台服务器，往往都有最大的负载能力，超过这个阈值，服务器性能就会大大降低甚至不可用。单点的elasticsearch也是一样，那单点的es服务器存在哪些可能出现的问题呢？

单台机器存储容量有限

单服务器容易出现单点故障，无法实现高可用

单服务的并发处理能力有限

所以，为了应对这些问题，我们需要对elasticsearch搭建集群

集群中节点数量没有限制，大于等于2个节点就可以看做是集群了。一般出于高性能及高可用方面来考虑集群中节点数量都是3个以上。

2.集群的相关概念

1）集群cluster

一个集群就是由一个或多个节点组织在一起，它们共同持有整个的数据，并一起提供索引和搜索功能。一个集群由一个唯一的名字标识，这个名字默认就是elasticsearch。这个名字是重要的，因为一个节点只能通过指定某个集群的名字，来加入这个集群。

2)节点node

一个节点是集群中的一个服务器，作为集群的一部分，它存储数据，参与集群的索引和搜索功能。

一个节点可以通过配置集群名称的方式来加入一个指定的集群。

默认情况下，每个节点都会被安排加入到一个叫做elasticsearch的集群中，这意味着，如果你在你的网络中启动了若干个节点，并假定它们能够相互发现彼此，它们将会自动地形成并加入到一个叫做elasticsearch的集群中。

3) 分片和复制 shards&replicas

一个索引可以存储超出单个节点硬件限制的大量数据。比如，一个具有10亿文档的索引占据1TB的磁盘空间，而任一节点都没有这样大的磁盘空间；或者单个节点处理搜索请求，响应太慢。为了解决这个问题，ElasticSearch提供了将索引划分成多份的能力，这些份就叫做分片。当你创建一个索引的时候，你可以指定你想要的分片的数量。每个分片本身也是一个功能完善并且独立的“索引”，这个“索引”可以被放置到集群中的任何节点上。

分片很重要，主要有两方面的原因：

1）允许你水平分割/扩展你的内容容量。

2）允许你在分片（潜在地，位于多个节点上）之上进行分布式的、并行的操作，进而提高性能/吞吐量。

2.集群搭建

1.准备三台elasticsearch服务器

2.修改每台服务器配置

修改每台服务器对应的\config\elasticsearch.yml配置文件

1）node1节点：

#节点1的配置信息：
#集群名称，保证唯一
cluster.name: my-elasticsearch
#默认为true。设置为false禁用磁盘分配决定器。
cluster.routing.allocation.disk.threshold_enabled: false
#节点名称，必须不一样
node.name: node-1
#必须为本机的ip地址
network.host: 127.0.0.1
#服务端口号，在同一机器下必须不一样
http.port: 9201
#集群间通信端口号，在同一机器下必须不一样
transport.tcp.port: 9301
#设置集群自动发现机器ip集合
discovery.zen.ping.unicast.hosts: ["127.0.0.1:9301","127.0.0.1:9302","127.0.0.1:9303"]

2）node2节点

#节点2的配置信息：
#集群名称，保证唯一
cluster.name: my-elasticsearch
#默认为true。设置为false禁用磁盘分配决定器。
cluster.routing.allocation.disk.threshold_enabled: false
#节点名称，必须不一样
node.name: node-2
#必须为本机的ip地址
network.host: 127.0.0.1
#服务端口号，在同一机器下必须不一样
http.port: 9202
#集群间通信端口号，在同一机器下必须不一样
transport.tcp.port: 9302
#设置集群自动发现机器ip集合
discovery.zen.ping.unicast.hosts: ["127.0.0.1:9301","127.0.0.1:9302","127.0.0.1:9303"]

3）node3节点

#节点3的配置信息：
#集群名称，保证唯一
cluster.name: my-elasticsearch
#默认为true。设置为false禁用磁盘分配决定器。
cluster.routing.allocation.disk.threshold_enabled: false
#节点名称，必须不一样
node.name: node-3
#必须为本机的ip地址
network.host: 127.0.0.1
#服务端口号，在同一机器下必须不一样
http.port: 9203
#集群间通信端口号，在同一机器下必须不一样
transport.tcp.port: 9303
#设置集群自动发现机器ip集合
discovery.zen.ping.unicast.hosts: ["127.0.0.1:9301","127.0.0.1:9302","127.0.0.1:9303"]

3.启动各个节点服务器

先清理掉之前数据：删除elasticsearch-cluster\node*\data目录下的nodes目录

双击elasticsearch-cluster\node*\bin\elasticsearch.bat

启动三个节点

3.集群测试

安装ES插件ElasticSearch-head

将插件拖入到谷歌浏览器

更多工具，拓展程序

服务器运行状态：

Green

所有的主分片和副本分片都已分配。你的集群是 100% 可用的。

yellow

所有的主分片已经分片了，但至少还有一个副本是缺失的。不会有数据丢失，所以搜索结果依然是完整的。不过，你的高可用性在某种程度上被弱化。如果 更多的 分片消失，你就会丢数据了。把 yellow 想象成一个需要及时调查的警告。

red

至少一个主分片（以及它的全部副本）都在缺失中。这意味着你在缺少数据：搜索只能返回部分数据，而分配到这个分片上的写入请求会返回一个异常。

五，ElasticSearch编程操作

1创建工程，引入坐标

    <properties>
        <maven.compiler.source>1.8maven.compiler.source>
        <maven.compiler.target>1.8maven.compiler.target>
    properties>
    <dependencies>
        <dependency>
            <groupId>org.elasticsearchgroupId>
            <artifactId>elasticsearchartifactId>
            <version>5.6.8version>
        dependency>
        <dependency>
            <groupId>org.elasticsearch.clientgroupId>
            <artifactId>transportartifactId>
            <version>5.6.8version>
        dependency>
        <dependency>
            <groupId>org.apache.logging.log4jgroupId>
            <artifactId>log4j-to-slf4jartifactId>
            <version>2.9.1version>
        dependency>
        <dependency>
            <groupId>org.slf4jgroupId>
            <artifactId>slf4j-apiartifactId>
            <version>1.7.24version>
        dependency>
        <dependency>
            <groupId>org.slf4jgroupId>
            <artifactId>slf4j-simpleartifactId>
            <version>1.7.21version>
        dependency>
        <dependency>
            <groupId>log4jgroupId>
            <artifactId>log4jartifactId>
            <version>1.2.12version>
        dependency>
        <dependency>
            <groupId>junitgroupId>
            <artifactId>junitartifactId>
            <version>4.12version>
        dependency>
    dependencies>

2.创建索引index

步骤：
1）创建一个Java工程
2）添加jar包，添加maven的坐标
3）编写测试方法实现创建索引库
1、创建一个Settings对象，相当于是一个配置信息。主要配置集群的名称。
2、创建一个客户端Client对象
3、使用client对象创建一个索引库
4、关闭client对象

    @Test
    public void test() throws Exception {
        Settings setting = Settings.builder()
                .put("cluster.name", "my-application")
                .build();
        TransportClient client = new PreBuiltTransportClient(setting);
        client.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));
        client.admin().indices().prepareCreate("index_db").get();
        client.close();
    }

3.创建映射mapping

步骤：
1）创建一个Settings对象
2）创建一个Client对象
3）创建一个mapping信息，应该是一个json数据，可以是字符串，也可以是XContextBuilder对象
4）使用client向es服务器发送mapping信息
5）关闭client对象

    @Test
    public void test2()throws Exception{
        Settings setting = Settings.builder()
                .put("cluster.name", "my-application")
                .build();
        TransportClient client = new PreBuiltTransportClient(setting);
        client.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));
        XContentBuilder builder= XContentFactory.jsonBuilder()
                .startObject()
                    .startObject("t_user")
                        .startObject("properties")
                            .startObject("name")
                                .field("type","text")
                                .field("analyzer","ik_max_word")
                                .field("store",true)
                        .endObject()
                            .startObject("age")
                                .field("type","integer")
                                .field("index",true)
                                .field("store",true)
                        .endObject()
                            .startObject("email")
                                .field("type","text")
                                .field("analyzer","ik_max_word")
                                .field("store",true)
                            .endObject()
                        .endObject()
                    .endObject()
                .endObject();
        client.admin().indices().preparePutMapping("index_db").setType("t_user").setSource(builder).get();
        builder.close();
        client.close();
        //GET /index_db/t_user/_mapping
    }

4.创建文档

步骤：
1）创建一个Settings对象
2）创建一个Client对象
3）创建一个文档对象，创建一个json格式的字符串，或者使用XContentBuilder
4）使用Client对象吧文档添加到索引库中
5）关闭client

4.1通过XContentBuilder

    @Test
    public void test4() throws Exception{
        // 创建Client连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-application").build();
        TransportClient client = new PreBuiltTransportClient(settings)
                .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));

        //创建文档信息
        XContentBuilder builder = XContentFactory.jsonBuilder()
                .startObject()
                .field("name", "尹会东")
                .field("age", 23)
                .field("email",
                        "[email protected]")
                .endObject();

        // 建立文档对象
        /**
         * 参数一blog1：表示索引对象
         * 参数二article：类型
         * 参数三1：建立id
         */
        client.prepareIndex("index_db", "t_user", "1").setSource(builder).get();

        //释放资源
        client.close();
    }

4.2使用Jackson转换实体

实体类

/**
 * @author yinhuidong
 * @createTime 2020-06-04-0:26
 */
public class User {

    private Integer id;
    private String name;
    private Integer age;
    private String email;

    public User() {
    }

pom.xml

<dependency>
    <groupId>com.fasterxml.jackson.coregroupId>
    <artifactId>jackson-coreartifactId>
    <version>2.8.1version>
dependency>
<dependency>
    <groupId>com.fasterxml.jackson.coregroupId>
    <artifactId>jackson-databindartifactId>
    <version>2.8.1version>
dependency>
<dependency>
    <groupId>com.fasterxml.jackson.coregroupId>
    <artifactId>jackson-annotationsartifactId>
    <version>2.8.1version>
dependency>

测试

    @Test
//创建文档(通过实体转json)
    public void test5() throws Exception{
        // 创建Client连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-application").build();
        TransportClient client = new PreBuiltTransportClient(settings)
                .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));

        // 描述json 数据
        //{id:xxx, title:xxx, content:xxx}
        User user = new User(2,"张三",20,"[email protected]");

        ObjectMapper objectMapper = new ObjectMapper();

        // 建立文档
        client.prepareIndex("index_db", "t_user", user.getId().toString())
                .setSource(objectMapper.writeValueAsString(user).getBytes(), XContentType.JSON).get();

        //释放资源
        client.close();
    }

5.查询文档操作

1、根据id搜索
QueryBuilder queryBuilder = QueryBuilders.idsQuery().addIds("1", "2");
2、根据Term查询（关键词）
QueryBuilder queryBuilder = QueryBuilders.termQuery("title", "北方");
3、QueryString查询方式（带分析的查询）
QueryBuilder queryBuilder = QueryBuilders.queryStringQuery("速度与激情").defaultField("title");
查询步骤：
1）创建一个Client对象
2）创建一个查询对象，可以使用QueryBuilders工具类创建QueryBuilder对象。
3）使用client执行查询
4）得到查询的结果。
5）取查询结果的总记录数
6）取查询结果列表
7）关闭client

5.1关键词查询

    @Test
    public void testTermQuery() throws Exception{
        //1、创建es客户端连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-application").build();
        TransportClient client = new PreBuiltTransportClient(settings)
                .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));

        //2、设置搜索条件
        SearchResponse searchResponse = client.prepareSearch("index_db")
                .setTypes("t_user")
                .setQuery(QueryBuilders.termQuery("name", "张三")).get();

        //3、遍历搜索结果数据
        SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象
        System.out.println("查询结果有：" + hits.getTotalHits() + "条");
        Iterator<SearchHit> iterator = hits.iterator();
        while (iterator.hasNext()) {
            SearchHit searchHit = iterator.next(); // 每个查询对象
            System.out.println(searchHit.getSourceAsString()); // 获取字符串格式打印
            //System.out.println("t_user:" + searchHit.getSource().get("t_user"));
        }

        //4、释放资源
        client.close();

    }

5.2字符串查询

    @Test
    public void testStringQuery() throws Exception{
        //1、创建es客户端连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-application").build();
        TransportClient client = new PreBuiltTransportClient(settings)
                .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));

        //2、设置搜索条件
        SearchResponse searchResponse = client.prepareSearch("index_db")
                .setTypes("t_user")
                .setQuery(QueryBuilders.queryStringQuery("尹会东")).get();

        //3、遍历搜索结果数据
        SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象
        System.out.println("查询结果有：" + hits.getTotalHits() + "条");
        Iterator<SearchHit> iterator = hits.iterator();
        while (iterator.hasNext()) {
            SearchHit searchHit = iterator.next(); // 每个查询对象
            System.out.println(searchHit.getSourceAsString()); // 获取字符串格式打印
        }

        //4、释放资源
        client.close();

    }

5.3 使用文档ID查询文档

    @Test
    public void testIdQuery() throws Exception {
        Settings settings = Settings.builder().put("cluster.name", "my-application").build();
        TransportClient client = new PreBuiltTransportClient(settings)
                .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));
        //client对象为TransportClient对象
        SearchResponse response = client.prepareSearch("index_db")
                .setTypes("t_user")
                //设置要查询的id
                .setQuery(QueryBuilders.idsQuery().addIds("1"))
                //执行查询
                .get();
        //取查询结果
        SearchHits searchHits = response.getHits();
        //取查询结果总记录数
        System.out.println(searchHits.getTotalHits());
        Iterator<SearchHit> hitIterator = searchHits.iterator();
        while(hitIterator.hasNext()) {
            SearchHit searchHit = hitIterator.next();
            //打印整行数据
            System.out.println(searchHit.getSourceAsString());
        }
    }

6.查询文档分页操作

6.1批量插入数据

    @Test
//批量插入100条数据
    public void test9() throws Exception{
        // 创建Client连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-application").build();
        TransportClient client = new PreBuiltTransportClient(settings)
                .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));

        ObjectMapper objectMapper = new ObjectMapper();

        for (int i = 1; i <= 100; i++) {
            // 描述json 数据
            User article = new User(2+i,"李四",25,"[email protected]");
                      // 建立文档
            client.prepareIndex("index_db", "t_user", article.getId().toString())
                    .setSource(objectMapper.writeValueAsString(article).getBytes(),XContentType.JSON).get();
        }

        //释放资源
        client.close();
    }

6.2 分页查询

在client对象执行查询之前，设置分页信息。
然后再执行查询

 //执行查询
SearchResponse searchResponse = client.prepareSearch("index_hello")
            .setTypes("article")
            .setQuery(queryBuilder)
            //设置分页信息
            .setFrom(0)
            //每页显示的行数
            .setSize(5)
            .get();

分页需要设置两个值，一个from、size
from：起始的行号，从0开始。
size：每页显示的记录数

    @Test
    //分页查询
    public void test10() throws Exception {
        // 创建Client连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-application").build();
        TransportClient client = new PreBuiltTransportClient(settings)
                .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));

        // 搜索数据
        SearchRequestBuilder searchRequestBuilder = client.prepareSearch("index_db").setTypes("t_user")
                .setQuery(QueryBuilders.matchAllQuery());//默认每页10条记录

        // 查询第2页数据，每页20条
        //setFrom()：从第几条开始检索，默认是0。
        //setSize():每页最多显示的记录数。
        searchRequestBuilder.setFrom(0).setSize(5);
        SearchResponse searchResponse = searchRequestBuilder.get();

        SearchHits hits = searchResponse.getHits(); // 获取命中次数，查询结果有多少对象
        System.out.println("查询结果有：" + hits.getTotalHits() + "条");
        Iterator<SearchHit> iterator = hits.iterator();
        while (iterator.hasNext()) {
            SearchHit searchHit = iterator.next(); // 每个查询对象
            System.out.println(searchHit.getSourceAsString()); // 获取字符串格式打印
            System.out.println("id:" + searchHit.getSource().get("id"));
            System.out.println("title:" + searchHit.getSource().get("title"));
            System.out.println("content:" + searchHit.getSource().get("content"));
            System.out.println("-----------------------------------------");
        }

        //释放资源
        client.close();
    }

7.查询结果高亮显示

（1）高亮的配置
1）设置高亮显示的字段
2）设置高亮显示的前缀
3）设置高亮显示的后缀
（2）在client对象执行查询之前，设置高亮显示的信息。
（3）遍历结果列表时可以从结果中取高亮结果。

    @Test
    //高亮查询
    public void test11() throws Exception{
        // 创建Client连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-application").build();
        TransportClient client = new PreBuiltTransportClient(settings)
                .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));

        // 搜索数据
        SearchRequestBuilder searchRequestBuilder = client
                .prepareSearch("index_db").setTypes("t_user")
                .setQuery(QueryBuilders.termQuery("name", "张三"));

        //设置高亮数据
        HighlightBuilder hiBuilder=new HighlightBuilder();
        hiBuilder.preTags("");
        hiBuilder.postTags("");
        hiBuilder.field("title");
        searchRequestBuilder.highlighter(hiBuilder);

        //获得查询结果数据
        SearchResponse searchResponse = searchRequestBuilder.get();

        //获取查询结果集
        SearchHits searchHits = searchResponse.getHits();
        System.out.println("共搜到:"+searchHits.getTotalHits()+"条结果!");
        //遍历结果
        for(SearchHit hit:searchHits){
            System.out.println("String方式打印文档搜索内容:");
            System.out.println(hit.getSourceAsString());
            System.out.println("Map方式打印高亮内容");
            System.out.println(hit.getHighlightFields());

            System.out.println("遍历高亮集合，打印高亮片段:");
            Text[] text = hit.getHighlightFields().get("t_user").getFragments();
            for (Text str : text) {
                System.out.println(str);
            }
        }

        //释放资源
        client.close();
    }

六，Spring Data ElasticSearch

1.Spring Data ElasticSearch 简介

1）什么是Spring Data

Spring Data是一个用于简化数据库访问，并支持云服务的开源框架。其主要目标是使得对数据的访问变得方便快捷，并支持map-reduce框架和云计算数据服务。 Spring Data可以极大的简化JPA的写法，可以在几乎不用写实现的情况下，实现对数据的访问和操作。除了CRUD外，还包括如分页、排序等一些常用的功能。

Spring Data的官网：http://projects.spring.io/spring-data/

2）什么是SpringDataElasticSearch

Spring Data ElasticSearch 基于 spring data API 简化 elasticSearch操作，将原始操作elasticSearch的客户端API 进行封装。Spring Data为Elasticsearch项目提供集成搜索引擎。Spring Data Elasticsearch POJO的关键功能区域为中心的模型与Elastichsearch交互文档和轻松地编写一个存储库数据访问层。

官方网站：http://projects.spring.io/spring-data-elasticsearch/

2.Spring Data ElasticSearch 入门案例

1）创建普通java工程，导入相关坐标

        
        <dependency>
            <groupId>org.elasticsearchgroupId>
            <artifactId>elasticsearchartifactId>
            <version>6.8.1version>
        dependency>
        <dependency>
            <groupId>org.elasticsearch.clientgroupId>
            <artifactId>transportartifactId>
            <version>6.8.1version>
        dependency>
        <dependency>
            <groupId>org.springframework.datagroupId>
            <artifactId>spring-data-elasticsearchartifactId>
            <version>3.2.0.RELEASEversion>
            <exclusions>
                <exclusion>
                    <groupId>org.elasticsearch.plugingroupId>
                    <artifactId>transport-netty4-clientartifactId>
                exclusion>
            exclusions>
        dependency>

2）创建Spring配置文件，引入SpringDataElasticSearch名称空间


<beans xmlns="http://www.springframework.org/schema/beans"
       xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
       xmlns:context="http://www.springframework.org/schema/context"
       xmlns:elasticsearch="http://www.springframework.org/schema/data/elasticsearch"
       xsi:schemaLocation="
		http://www.springframework.org/schema/beans 
		http://www.springframework.org/schema/beans/spring-beans.xsd
		http://www.springframework.org/schema/context 
		http://www.springframework.org/schema/context/spring-context.xsd
		http://www.springframework.org/schema/data/elasticsearch
		http://www.springframework.org/schema/data/elasticsearch/spring-elasticsearch-1.0.xsd
		">

beans>

3）编写实体类

/**
 * @author yinhuidong
 * @createTime 2020-06-04-0:26
 */
public class User {

    private Integer id;
    private String name;
    private Integer age;
    private String email;
....
}

4）编写Mapper层

/**
 * @author yinhuidong
 * @createTime 2020-06-04-10:32
 */
@Repository
public interface UserMapper extends ElasticsearchRepository<User,Integer> {
    
}

5）编写服务层

public interface UserService {

    void save(User user);
}

@Service
public class UserServiceImpl implements UserService {

    @Autowired
    private UserMapper mapper;
    @Override
    public void save(User user) {
        mapper.save(user);

    }
}

6）编写Spring的配置文件

	
	<elasticsearch:repositories base-package="com.example.mapper"/>

	
	<context:component-scan base-package="com.example.service"/>

	
	
	<elasticsearch:transport-client id="client" cluster-nodes="127.0.0.1:9300" cluster-name="my-application"/>


	
	<bean id="elasticsearchTemplate" class="org.springframework.data.elasticsearch.core.ElasticsearchTemplate">
		<constructor-arg name="client" ref="client">constructor-arg>
	bean>

7）配置实体类

基于spring data elasticsearch注解配置索引、映射和实体的关系

//文档对象，索引信息，文档类型
@Document(indexName = "index_db",type = "t_user")
public class User {

    @Id//文档主键，唯一标识 (是否存储，是否分词，类型)
    @Field(store = true,type = FieldType.Keyword,index = false)
    private Integer id;
    //analyzer = "ik_max_word" 指定分词器
    @Field(store = true,type = FieldType.Text,analyzer = "ik_max_word")
    private String name;
    @Field(store = true,type = FieldType.Integer)
    private Integer age;
    @Field(store = true,type = FieldType.Text,analyzer = "ik_max_word")
    private String email;
}

注解解释

@Document(indexName="index_db",type="t_user")：
    indexName：索引的名称（必填项）
    type：索引的类型
@Id：主键的唯一标识
@Field(index=true,analyzer="ik_max_word",store=true,searchAnalyzer="ik_smart",type = FieldType.text)
    index：是否设置分词
    analyzer：存储时使用的分词器
    searchAnalyze：搜索时使用的分词器
    store：是否存储
    type: 数据类型

8）测试

@RunWith(SpringJUnit4ClassRunner.class)
@ContextConfiguration(locations = "classpath:applicationContext.xml")
public class TestSpring {

    @Autowired
    private ElasticsearchTemplate template;
    @Autowired
    private UserService service;

    @Test
    public void test(){
        //创建索引
        template.createIndex(User.class);
        //创建映射
        template.putMapping(User.class);
    }

    @Test
    public void test2(){
        service.save(new User(1,"尹会东",23,"[email protected]"));
    }
}

3.SpringDataElasticSearch基本操作

服务层代码

public interface UserService {

    //保存
    void save(User user);
    //删除
    void remove(User user);
    //查询全部
    Iterable<User>findAll();
    //分页查询
    Page<User>findByPage(Pageable pageable);
}

@Service
public class UserServiceImpl implements UserService {

    @Autowired
    private UserMapper mapper;
    @Override
    public void save(User user) {
        mapper.save(user);

    }

    @Override
    public void remove(User user) {
        mapper.delete(user);
    }

    @Override
    public Iterable<User> findAll() {
        return mapper.findAll();
    }

    @Override
    public Page<User> findByPage(Pageable pageable) {
        return mapper.findAll(pageable);
    }
}

测试类

/**
 * @author yinhuidong
 * @createTime 2020-06-04-10:54
 */
@RunWith(SpringJUnit4ClassRunner.class)
@ContextConfiguration(locations = "classpath:applicationContext.xml")
public class TestSpring {

    @Autowired
    private ElasticsearchTemplate template;
    @Autowired
    private UserService service;

    @Test
    public void test(){
        //创建索引
        template.createIndex(User.class);
        //创建映射
        template.putMapping(User.class);
    }

    @Test
    public void test2(){
        service.save(new User(5,"赵六",23,"[email protected]"));
    }

    @Test
    public void test3(){
        service.remove(new User(1,"尹会东",23,"[email protected]"));
    }
    @Test
    public void test4(){
        Iterable<User> iterable = service.findAll();
        iterable.forEach(System.out::println);
    }
    @Test
    public void test5(){
        //Pageable pageable = PageRequest.of(1,10);
        service.findByPage(new Pageable() {
            @Override
            public int getPageNumber() {
                return 0;
            }

            @Override
            public int getPageSize() {
                return 2;
            }

            @Override
            public long getOffset() {
                return 0;
            }

            @Override
            public Sort getSort() {
                return null;
            }

            @Override
            public Pageable next() {
                return null;
            }

            @Override
            public Pageable previousOrFirst() {
                return null;
            }

            @Override
            public Pageable first() {
                return null;
            }

            @Override
            public boolean hasPrevious() {
                return false;
            }
        }).forEach(System.out::println);
    }
}

4.常用查询命名规则与测试

关键字	命名规则	解释	示例
and	findByField1AndField2	根据Field1和Field2获得数据	findByTitleAndContent
or	findByField1OrField2	根据Field1或Field2获得数据	findByTitleOrContent
is	findByField	根据Field获得数据	findByTitle
not	findByFieldNot	根据Field获得补集数据	findByTitleNot
between	findByFieldBetween	获得指定范围的数据	findByPriceBetween
lessThanEqual	findByFieldLessThan	获得小于等于指定值的数据	findByPriceLessThan

mapper

@Repository
public interface UserMapper extends ElasticsearchRepository<User,Integer> {
    //根据名字查询
    List<User> findByName(String name);
    //根据名字查询并分页
    Page<User> findByName(String name, Pageable pageable);
}

service

    //根据名字查询
    List<User> findByName(String name);
    //根据名字查询并分页
    Page<User>findByName(String name,Pageable pageable);

serviceimpl

    @Override
    public List<User> findByName(String name) {
        return mapper.findByName(name);
    }

    @Override
    public Page<User> findByName(String name, Pageable pageable) {

        return mapper.findByName(name,pageable);
    }

Test

    @Test
    public void test6(){
        service.findByName("尹会东").forEach(System.out::println);
    }
    @Test
    public void test7(){
        PageRequest request = PageRequest.of(0, 3);
        service.findByName("三",request).forEach(System.out::println);
    }

public Sort getSort() {
return null;
}

        @Override
        public Pageable next() {
            return null;
        }

        @Override
        public Pageable previousOrFirst() {
            return null;
        }

        @Override
        public Pageable first() {
            return null;
        }

        @Override
        public boolean hasPrevious() {
            return false;
        }
    }).forEach(System.out::println);
}

}


### 4.常用查询命名规则与测试

| 关键字        | 命名规则              | 解释                       | 示例                  |
| ------------- | --------------------- | -------------------------- | --------------------- |
| and           | findByField1AndField2 | 根据Field1和Field2获得数据 | findByTitleAndContent |
| or            | findByField1OrField2  | 根据Field1或Field2获得数据 | findByTitleOrContent  |
| is            | findByField           | 根据Field获得数据          | findByTitle           |
| not           | findByFieldNot        | 根据Field获得补集数据      | findByTitleNot        |
| between       | findByFieldBetween    | 获得指定范围的数据         | findByPriceBetween    |
| lessThanEqual | findByFieldLessThan   | 获得小于等于指定值的数据   | findByPriceLessThan   |

#### mapper

```java
@Repository
public interface UserMapper extends ElasticsearchRepository {
    //根据名字查询
    List findByName(String name);
    //根据名字查询并分页
    Page findByName(String name, Pageable pageable);
}

service

    //根据名字查询
    List<User> findByName(String name);
    //根据名字查询并分页
    Page<User>findByName(String name,Pageable pageable);

serviceimpl

    @Override
    public List<User> findByName(String name) {
        return mapper.findByName(name);
    }

    @Override
    public Page<User> findByName(String name, Pageable pageable) {

        return mapper.findByName(name,pageable);
    }

Test

    @Test
    public void test6(){
        service.findByName("尹会东").forEach(System.out::println);
    }
    @Test
    public void test7(){
        PageRequest request = PageRequest.of(0, 3);
        service.findByName("三",request).forEach(System.out::println);
    }

你可能感兴趣的:(中间件,搜索引擎,elasticsearch)

oceanbase与mysql性能对比_金融业分布式数据库:TDSQL、HotDB、OceanBase等原理、POC性能对比及选择是...... 高中物理宋老师
本帖最后由Amygo于2020-3-1501:33编辑1、分布式的实现，是通过中间件实现分布式，还是源码级别引入分布式算法实现的？解答：(1)分布式数据库是至少由计算节点、存储节点、管理平台、备份还原程序四个部分组成，从数据库系统理论知识上说分成：全局自治和场地自治，也粗略认为：全局可理解为计算节点、场地可理解为存储节点(2)这个问题的标题“中间件实现分布式还是源码级别引入分布式算法”这个说法存在
后端框架模块化 GIS程序媛—椰子后端
后端框架的模块化设计旨在简化开发流程、提高可维护性，并通过分层解耦降低复杂性。以下是常见的后端模块及其在不同语言（Node.js、Java、Python）中的实现方式：目录1.路由（Routing）2.中间件（Middleware）3.数据库与ORM（models）4.迁移（Migration）5.服务层（ServiceLayer）6.配置管理（Configuration）7.依赖注入（DI）8.
Redis缓存中间件（非关系型数据库）小狼人发JO酸奶缓存 redis 中间件
最近一段时间整理了关于一些知识的总结，其中就拿出Redis来说说，其他的整理的有些杂还在梳理，相信不久就会和大家见面，期待ne.......，不废话了，开始！Redis作为非关系型数据库，终是要涉及到持久化的，毕竟缓存可没落地，很可能丢失的。Redis持久化主要为：RDB全量持久，AOF增量持久：RDB耗时长非实时记录应配合AOF使用，从而避免停机大量丢失数据。Redis重启时：RDB重构内存+A
Dify - 架构、部署、扩展与二次开发指南花千树-010 AIGC 架构 AIGC prompt embedding llama gpt agi
本文详细解析Dify的架构、部署流程、高可用中间件的独立部署方法，以及二次开发流程，帮助开发者更高效地管理和扩展Dify。1.本地DEMO部署安装Docker，执行下面脚本，可能需要配置镜像。gitclonehttps://github.com/langgenius/dify.gitcddifycddockercp.env.example.envdockercomposeup-d1.Dify部署后
亿级分布式系统架构演进实战（一）- 总体概要 power-辰南 java技术架构师成长专栏高并发分布式系统微服务架构设计 springcloud
前言不说废话，这次分享是某500强企业真实亿级流量业务中台技术架构演进过程实战。核心目标构建一个兼具高性能、高可用、强一致性的分布式系统，支撑亿级流量场景下的稳定运行。演进路线大纲阶段一：横向扩展（应对万级QPS）核心目标：突破单机性能瓶颈，建立弹性基础[Nginx]/|\[App1][App2][App3]←无状态服务集群\|/[DBProxy]←读写分离中间件/\[Master]←写节点[Sl
自动驾驶中间件技术辨析：ROS、Apex.Grace、DDS、AutoSAR和AutoSAR Adaptive 赛卡自动驾驶中间件人工智能
在自动驾驶技术的演进中，中间件作为连接硬件、操作系统与应用软件的核心枢纽，其安全性、实时性和可扩展性至关重要。当前市场上主流的中间件技术包括ROS/ROS2、Apex.Grace（Apex.OS）、DDS、AutoSAR（经典平台CP）和AutoSARAdaptive（自适应平台AP）。这些技术各有特点，但也存在交叉与互补。本文将从功能定位、技术架构、安全认证和应用场景等方面，深入分析它们的联系与
ElasticSearch Java查询实现详解当牛作馬 ElasticSearch使用 elasticsearch java jenkins
文章目录前言一、环境准备二.连接到ElasticSearch三.实现各种查询1匹配查询（MatchQuery）2术语查询（TermQuery）3范围查询（RangeQuery）4复合查询（BoolQuery）5.术语聚合（TermsAggregation）5.平均值聚合（AvgAggregation）6.最大值聚合（MaxAggregation）与最小值聚合（MinAggregation）7.日期
【运维的七种武器】搞技术的季运维
最近项目陆续增加，相应的运维方面压力逐步攀升，经常出现打包和发布失败的情况，给交付团队带来困扰。运维技术是随着软件技术的发展同步发展起来的，当前复杂的软件技术架构对运维的稳定和高效带了了很大挑战。一、运维平台发展史：1.第一阶段，以专业化网管工具为代表，包括网络设备、主机、数据库、中间件、存储等进行专业监控管理的各种专业化工具。2.第二阶段，以ITIL流程化管理为代表的综合网管，通过事件、服务、流
从 0 到 1 构建 Python 分布式爬虫，实现搜索引擎全攻略七七知享 Python python 分布式爬虫搜索引擎算法程序人生网络爬虫
从0到1构建Python分布式爬虫，实现搜索引擎全攻略在大数据与信息爆炸的时代，搜索引擎已然成为人们获取信息的关键入口。你是否好奇，像百度、谷歌这般强大的搜索引擎，背后是如何精准且高效地抓取海量网页数据的？本文将带你一探究竟，以Python为工具，打造属于自己的分布式爬虫，进而搭建一个简易搜索引擎，完整呈现从底层代码编写到系统搭建的全过程。通过本文的实践，我们成功打造了Python分布式爬虫，并以
消息中间件：RabbitMQ、Kafka 和 Redis如何选择？一文让您了解！写bug如流水架构设计 rabbitmq kafka redis 中间件
RabbitMQ、Kafka和Redis是三种常见的消息中间件，它们各自具有不同的特点和适用的场景。以下是对它们使用场景及选择的分析：1.RabbitMQRabbitMQ是一个基于AMQP（AdvancedMessageQueuingProtocol）的消息队列系统，主要用于消息传递和任务分发，具有可靠的消息传递机制。使用场景：复杂的路由机制：RabbitMQ支持多种交换器类型（如fanout、d
消息中间件选型: kafka与rabbitmq的对比 HS_Henry 消息中间件 rabbitmq kafka 消息中间件选型
RabbitMQ总结_陈海龙的格物之路-CSDN博客https://blog.csdn.net/chl87783255/article/details/122606212kafka总结_陈海龙的格物之路-CSDN博客kafka，仅支持拉取的分布式流式平台。本文从简介、使用场景、设计、实现四个方面阐述kafka。https://blog.csdn.net/chl87783255/article/de
RabbitMQ 与 Kafka：消息中间件的终极对比与选型指南海上彼尚 node.js rabbitmq kafka 分布式 node.js
引言在分布式系统架构中，消息中间件是异步通信的核心组件。RabbitMQ和Kafka作为两大主流技术，常被开发者拿来比较。本文深入解析两者的设计哲学、性能差异和典型场景，助你做出精准技术选型。目录引言一、核心设计差异1.定位与数据模型二、性能与架构对比1.吞吐量与延迟2.集群与扩展三、功能特性对决1.消息可靠性2.消息路由四、典型场景与选型决策1.优先选择Kafka的场景2.优先选择RabbitM
sc命令在windows上将elasticsearch和kibana自动作为服务开机启动 windowselastic
sc是Windows自带的命令行工具，用于管理服务。1.创建服务：打开命令提示符，运行以下命令：sccreateElasticsearchbinPath="D:\elasticsearch\bin\elasticsearch.bat"start=auto2.启动服务：创建后，启动服务：scstartElasticsearch亲测可用
jieba库词频统计_jieba分词器（应用及字典的补充）及文档高频词提取实战袁圆园建建 jieba库词频统计
jieba分词器是Python中最好的中文分词组件，本文讲解一下jieba分词器及其应用。1、jieba分词器的分词模式jieba分词器提供了三种常用的分词模式1、精确模式：将句子按照最精确的方法进行切分，适合用于进行文本分析；2、全模式：将句子当中所有可以成词的词语都扫描出来，分词速度很快但容易产生歧义；3、搜索引擎模式：在精确模式分词的基础上，将长的句子再次进行切分，提高召回率，适用于搜索引擎
【存储中间件】Redis核心技术与实战（六）：Redis的设计与实现（缓存淘汰算法、过期策略与惰性删除）道友老李 #Redis核心技术与实战架构师进阶-存储中间件缓存中间件 redis
文章目录Redis的设计与实现缓存淘汰算法maxmemoryNoevictionvolatile-lruvolatile-ttlvolatile-randomallkeys-lruallkeys-randomLRU算法近似LRU算法LFU算法为什么Redis要缓存系统时间戳过期策略和惰性删除过期惰性删除lazyfree个人主页：道友老李欢迎加入社区：道友老李的学习社区Redis的设计与实现缓存淘汰
ActiveMQ z小天才b ActiveMQ java-activemq activemq spring boot
一、ActiveMQ概述1.1什么是ActiveMQ？ActiveMQ是Apache软件基金会开发的一个开源消息中间件，它完全支持JMS（Java消息服务）规范，并提供了高可用性、高性能和可扩展性。ActiveMQ允许不同的应用程序通过消息传递进行异步通信，从而实现系统解耦。1.2ActiveMQ核心特性多协议支持：支持OpenWire、STOMP、AMQP、MQTT等多种协议持久化：支持多种持久
从0到1：小白也能轻松上手的高清电影搜索引擎网站制作指南计算机学长网站制作搜索引擎前端服务器
引言在互联网飞速发展的当下，在线观影已成为人们日常娱乐不可或缺的一部分。据相关数据显示，2024年网络视频用户规模达到了惊人的规模，如此庞大的用户群体，对电影资源的需求自然也是水涨船高。然而，面对海量的电影资源，如何快速、准确地找到自己心仪的高清电影，却成了许多影迷的一大难题。各大视频平台资源分散，想要观看不同的电影，往往需要在多个平台之间来回切换，而且还可能面临付费门槛、广告干扰等问题。这时，一
vue中js简单创建一个事件中心/中间件/eventBus 星月前端 javascript vue.js 前端
vue中js简单创建一个事件中心/中间件/eventBus目录结构如下：eventBus.jsclasseventBus{constructor(){this.events={};}//监听事件on(event,callback){if(!this.events[event]){this.events[event]=[];}this.events[event].push(callback);}//
探索 Tavily Search API：为 AI 提供快速准确的搜索结果 nseejrukjhad 人工智能 python 开发语言
引言在当今的技术时代，AI代理（如大型语言模型）日益需要实时、准确和事实性强的搜索结果。TavilySearchAPI就是为此而生的。这篇文章将介绍如何将TavilySearchAPI集成为一个检索器，使开发者可以在应用中快速获取所需信息。此外，我们将讨论这一集成过程中的挑战及其解决方案。主要内容1.TavilySearchAPI简介TavilySearchAPI是一个专门为AI代理设计的搜索引擎
使用 Tavily 搜索 API 获取实时精确搜索结果 fgayif python 数据库开发语言
技术背景介绍Tavily搜索API是一个专为AI代理（如大型语言模型）而设计的搜索引擎。它能够快速提供实时、准确且事实性强的搜索结果。这使得Tavily成为可以嵌入到AI应用中的理想工具，提升信息获取的效率和准确性。核心原理解析Tavily搜索API提供了异步的原生调用方式，可以返回包括标题、URL、内容和答案在内的数据。API可以根据需求设置不同的搜索深度和结果数量。通过与其他语言模型（如Ope
暗链威胁与检测方法之Screaming Frog SEO Spider qq_39541626 黑帽研究 windows
尖叫青蛙，网站暗链检测方法网站暗链是指那些隐藏在网页上，对普通用户不可见或难以察觉的超链接。这些链接可能被故意设置为与背景颜色相同、使用极小的字体、或通过CSS技巧使其隐藏，从而在视觉上对用户隐藏。暗链通常用于不良的SEO实践，如操纵搜索引擎排名，或链接到恶意网站。这种做法可能导致网站在搜索引擎中被降级或罚款，损害网站的可信度和用户体验为了解决网站暗链，一次性筛选所有暗链买了一个软件Screami
3月TIOBE编程语言排行：Python稳居榜首，C++和Java市场份额稳步上升朱公子的Note 编程语言 python c++java TIOBE编程语言排行
TIOBE编程语言排行榜是一个基于全球程序员数量、课程数量和第三方供应商数量的指标，旨在反映编程语言的流行度。根据TIOBEIndex，它每月更新一次，计算方法基于搜索引擎（如Google、Bing、Wikipedia等）的查询结果，涵盖专业开发者的兴趣和需求。需要注意的是，TIOBE指数不代表“最佳”编程语言或代码量最多的语言，而是反映语言在开发者社区中的热度。2025年3月的排行榜特别提到Py
巨人学术搜索官网入口，免费参考文献论文及学术搜索引擎黄豆匿zlib 学习方法
巨人学术搜索自2024年上线以来，迅速成为学术界不可或缺的重要工具，尤其受到研究人员、教师及学生的青睐。这款专注于学术领域的专业搜索引擎，覆盖了自然科学、人文科学、社会科学等多个学科领域，整合了国内外众多主流数据库，包括维普、万方、Elsevier、WebofScience等，为用户提供了期刊论文、学位论文、专利、图书、预印本等多种类型资源的精准检索服务。与普通搜索引擎相比，巨人学术搜索的优势在于
Elasticsearch 介绍：分布式搜索与分析引擎吱屋猪_ elasticsearch
在如今大数据时代，企业和开发者面临着前所未有的数据量和实时性要求。为了能够高效地处理、存储和查询这些数据，Elasticsearch作为一种强大的分布式搜索引擎，已经成为了很多组织和开发者的首选解决方案。1.什么是Elasticsearch？Elasticsearch是一个开源的、基于ApacheLucene构建的全文搜索引擎。它提供了高效的搜索功能，并且非常适合处理大量数据，尤其是在需要快速搜索
https证书获取的方法及好处
获取HTTPS证书的多种方法及其优势✨在现代互联网环境中，HTTPS已成为保障网站安全的基本标准。获取HTTPS证书不仅能提升网站的安全性，还能增强用户信任度和提升搜索引擎排名。本文将详细介绍获取HTTPS证书的几种常见方法及其各自的优势，并通过图表和流程图帮助理解其工作原理。获取HTTPS证书的方法️1.购买商业证书购买商业证书是获取HTTPS证书的传统方式，适用于需要高信任度和额外保障的企业和
泛目录程序：2025快云站群程序的SEO优化功能云惠科技大数据泛目录
快云站群程序的SEO优化功能围绕搜索引擎算法设计，具体包含以下核心模块：1.关键词智能布局密度检测与优化：自动分析内容关键词密度，建议合理区间（2%-8%），避免堆砌或遗漏；多词策略支持：可针对单篇内容设置主关键词+长尾词组合，覆盖更多搜索场景；标题/摘要自动生成：根据关键词智能生成高点击率的标题和Meta描述，提升搜索展示效果。2.内链自动化系统内容关联推荐：基于语义分析，自动在文章中插入相关内
《壹起航：15 年助力中国工厂海外获客，开启全球化新篇》 yiqijianzhan 人工智能大数据
在全球化的汹涌浪潮中，无数中国工厂渴望在海外市场一展宏图。然而，一系列棘手的问题摆在他们面前：怎样成功塑造品牌形象？怎样稳定获取询盘？怎样合理控制营销成本？壹起航，凭借15年深厚的行业积累，整合外贸建站、搜索引擎优化（SEO）以及海外短视频营销等多元服务，为中国工厂开辟出一条轻松拓展海外市场、赢得更多精准订单的便捷之路。一、外贸独立站——企业出海的关键起点在海外市场这片广阔天地里，企业官网不仅是展
获取网站流量的方法有哪些？ liuliangpuzi 互联网流量运营数据搜索引擎百度大数据
不同流量源的比例反映了网站所有者不同的管理策略和网站的发展阶段。那么，网站流量来源都有哪些？接下来小编就跟大家浅析下网站流量来源的三大途径，一起来看看吧！1、直接访问来源搜索引擎源和外部链源依赖于外部，因此通常存在较大的不确定性，如搜索引擎算法调整、业务模型调整、策略监管等，这可能会使网站的流量从每天数十万IP急剧下降到数千。对于小型商业站来说，从搜索引擎获取流量是一种更经济实惠、廉价的选择，但对
Nodejs模块：使用Helmet 增强Web应用安全性 ohn.yu Nodejs javascript node.js
Helmet是一个Node.js中间件，主要用于增强Web应用的安全性。它通过设置各种HTTP响应头，帮助你的应用抵御多种常见的Web漏洞攻击，例如跨站脚本攻击(XSS)、点击劫持(Clickjacking)、内容嗅探攻击(ContentSniffing)等。1.什么是Helmet？为什么使用Helmet？Helmet本身并不是一个"银弹"，不能解决所有的安全问题，但它提供了一个简单有效的方式来设
Springboot启动失败：解决「org.yaml.snakeyaml.error.YAMLException」报错全记录 -天凉好秋- spring boot java idea visual studio code
##关键字Java、Springboot、vscode、idea、nacos启动失败、YAMLException、字符集配置---##背景环境###项目架构-**框架**：SSM（Spring+SpringMVC+MyBatis）-**中间件**：Nacos（配置管理+服务发现）-**配置存储**：Nacos中存储了Springboot的配置，包括：数据库连接信息、Redis连接信息、服务配置等。
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

Elasticsearch入门使用篇

一，搜索的概念和软件的安装

1.什么是搜索

2.对比传统关系型数据库和搜索

1）传统关系型数据库

2）专业全文索引引擎

3.ElasticSearch

4.Lucene与ElasticSearch

5.ElasticSearch对比Solr

6.软件的介绍与安装

1）服务器

2）客户端工具

3）中文分词插件

二， ElasticSearch相关概念(术语)

1.索引

2.类型Type

3.字段Field

4.映射 mapping

5.文档 document

6.接近实时

三，ElasticSearch的客户端操作

1.创建索引库

2.查看所有索引

3.查看某个索引

4.删除索引

5.类型及映射操作

1）创建类型映射

2）查看类型映射

3） 创建索引库同时进行映射配置（常用）

4）【文档操作】【基本CURD操作】

1.新建文档

2.查看文档

3.自定义ID新建文档

4.修改文档

5.根据id修改某一个字段

6.删除一条文档

7.根据条件删除文档

5）请求体查询【基本查询】

1.请求体查询

2.基础数据

3.基本查询

1）查询所有（match_all）

2)匹配查询（match）

3） 多字段匹配查询(multi_match)

4) 关键词精确查询(term)

5) 多关键词精确查询(terms)

6）【请求体查询】【结果过滤】

1.指定查询条件

2. 过滤指定字段：includes和excludes

7）【请求体查询】【高级查询】

1. 布尔组合(bool)

2. 范围查询（range）

3.模糊查询

8）【请求体查询】【查询排序】

1.单字段排序

2.多字段排序

9）【请求体查询】【高亮查询】

10）【请求体查询】【分页查询】

四，ElasticSearch集群

1.相关概念

1.单点故障问题

2.集群的相关概念

1）集群cluster

2)节点node

3) 分片和复制 shards&replicas

2.集群搭建

1.准备三台elasticsearch服务器

2.修改每台服务器配置

1）node1节点：

2）node2节点

3）node3节点

3.启动各个节点服务器

3.集群测试

安装ES插件ElasticSearch-head

服务器运行状态：

五，ElasticSearch编程操作

1创建工程，引入坐标

2.创建索引index

3.创建映射mapping

4.创建文档

4.`Lucene`与`ElasticSearch`

5.`ElasticSearch`对比`Solr`

三，`ElasticSearch`的客户端操作

3）创建索引库同时进行映射配置（常用）

3）多字段匹配查询(multi_match)

四，`ElasticSearch`集群

1）什么是Spring Data