elasticsearch的概念与基本操作

一、es索引的基本操作

1、文档

es官方文档

2、常用操作

  • 访问es(GET请求)

    192.168.56.101:9200
    
  • 查看es健康状态(GET请求)

    192.168.56.101:9200/_cluster/health
    
  • 创建索引(PUT请求)

    • 请求地址(新增索引index_01)
    192.168.56.101:9200/index_01
    
    • 请求参数
    {
        "settings": {
            "index": {
                "number_of_shards": "2",
                "number_of_replicas": "0"
            }
        }
    }
    
  • 删除索引(DELETE请求)

    删除索引index_01

    192.168.56.101:9200/index_01
    
  • 查看所有索引(GET请求)

    192.168.56.101:9200/_cat/indices?v
    
  • 查看单个索引(GET请求)

    192.168.56.101:9200/index_01
    

3、索引的mappings映射

  • 创建(PUT请求)

    创建索引 index_mapping,并添加属性realnameusernamerealname可以呗索引,username不能被索引

    192.168.56.101:9200/index_mapping
    
    {
        "mappings": {
            "properties": {
                "realname": {
                    "type": "text",
                    "index": true
                },
                "username": {
                    "type": "keyword",
                    "index": false
                }
            }
        }
    }
    

    index:默认true,设置为false的话,那么这个字段就不会被索引

  • 查看分词效果(GET请求)

    为刚创建的索引 index_mapping中的属性字段realname添加值,并查看分词效果,以下是GET请求路径和GET请求参数

    • 请求
    192.168.56.101:9200/index_mapping/_analyze
    
    {
        "field": "realname",
        "text": "落尘的秋"
    }
    
    • 结果
    {
        "tokens": [
            {
                "token": "落",
                "start_offset": 0,
                "end_offset": 1,
                "type": "",
                "position": 0
            },
            {
                "token": "尘",
                "start_offset": 1,
                "end_offset": 2,
                "type": "",
                "position": 1
            },
            {
                "token": "的",
                "start_offset": 2,
                "end_offset": 3,
                "type": "",
                "position": 2
            },
            {
                "token": "秋",
                "start_offset": 3,
                "end_offset": 4,
                "type": "",
                "position": 3
            }
        ]
    }
    
  • 为已经存在的索引添加mappings

    为 index_01 添加 mappings

    • 请求(POST)
    192.168.56.101:9200/index_01/_mapping
    
    • json参数
    {
        "properties": {
            "name": {
                   "type": "long"
            }
        }
    }
    

    注:某个属性一旦被建立,就不能修改了,但是可以新增额外属性

二、es的数据类型

1、基本数据类型

  • text, keyword, string
  • long, integer, short, byte
  • double, float
  • boolean
  • date
  • object
  • 数组不能混,类型一致

2、字符串

  • text

    文字类需要被分词被倒排索引的内容,比如商品名称商品详情商品介绍,使用text。

  • keyword

    不会被分词,不会被倒排索引,直接匹配搜索,比如订单状态用户qq微信号手机号等,这些精确匹配,无需分词。

三、文档相关

1、基本操作

  • 添加文档

    创一个临时索引 index_doc,往这个索引中添加文档(类似于数据库中添加一条数据),对一个文档进行全量更新也是一样的方式,即为替换

    • 请求(POST)
192.168.56.101:9200/index_doc/_doc/1

说明:index_doc(索引名称)/_doc(添加文档请求固定写法)/1(文档id,可以不写,会自动生成)

  • 参数
{
    "id": 1001,
    "name": "job-1",
    "desc": "this is a good job, 这是一个好工作!",
    "create_date": "2022-10-22"
}
  • 注意

    • 如果索引没有手动建立mappings,那么当插入文档数据的时候,会根据文档类型自动设置属性类型。这个就是es的动态映射,帮我们在index索引库中去建立数据结构的相关配置信息。

    • “fields”: {“type”: “keyword”}
      对一个字段设置多种索引模式,使用text类型做全文检索,也可使用keyword类型做聚合和排序

    • “ignore_above” : 256
      设置字段索引和存储的长度最大值,超过则被忽略

  • 文档删除(DELETE)

    192.168.56.101:9200/index_doc/_doc/100
    

    说明:index_doc(索引名称)/_doc(说明要删除的时一个文档)/1(文档id,指明要删除的文档)

    这种删除是逻辑删除不是物理删除

  • 全量更新doc(POST)

    整个doc中source信息会被新的数据完全替换掉

    192.168.56.101:9200/index_doc/_doc/2
    
    {
        "doc": {
            "name" : "好工作"
        }
    }
    
  • 更新某个字段信息

    只更新name

```
192.168.56.101:9200/index_test/_update/2
```

```json
{
    "doc": {
        "name" : "好工作"
    }
}
```
  • 更新文档

    每次修改后version都会进行修改

    • 请求(POST)
  • 查询某个索引的特定的文档信息(GET)

    查询结构包含所有的source信息

    192.168.56.101:9200/index_doc/_doc/2(文档id信息)
    
  • 查询某个索引的所有文档信息(GET)

    192.168.56.101:9200/index_doc/_doc/_search
    
  • 查询某个索引下特定文档中的特定信息(GET)

    只查看id,name信息,属性之间用“,”隔开

    192.168.56.101:9200/index_doc/_doc/2?_source=id,name
    
  • 查询某个索引下所有文档中的特定信息(GET)

    192.168.56.101:9200/index_doc/_doc/_search?_source=id,name
    
  • 判断文档是否存在(HEAD)

    192.168.56.101:9200/index_doc/_doc/2
    

    判断返回的状态吗status,200表示存在,404表示不存在

2、元数据

数据结构说明

  • _index:文档数据所属那个索引,理解为数据库的某张表即可。
  • _type:文档数据属于哪个类型,新版本使用_doc
  • _id:文档数据的唯一标识,类似数据库中某张表的主键。可以自动生成或者手动指定。
  • _score:查询相关度,是否契合用户匹配,分数越高用户的搜索体验越高。
  • _version:版本号。
  • _source:文档数据,json格式。

3、文档乐观锁控制

?if_seq_no={数值}&if_primary_term={数值

  • 插入新的数据

    POST /my_doc/_doc
    {
        "id": 1010,
        "name": "imooc-1010",
        "desc": "imoocimooc!",
        "create_date": "2019-12-24"
    }
    # 此时 _version 为 1
    
  • 修改数据

    POST    /my_doc/_doc/{_id}/_update
    {
        "doc": {
            "name": "修改测试"
        }
    }
    # 此时 _version 为 2
    
  • 模拟两个客户端操作同一个文档数据,_version都携带为一样的数值

    # 操作1
    POST    /my_doc/_doc/{_id}/_update?if_seq_no={数值}&if_primary_term={数值}
    {
        "doc": {
            "name": "操作1"
        }
    }
    
    # 操作2
    POST    /my_doc/_doc/{_id}/_update?if_seq_no={数值}&if_primary_term={数值}
    {
        "doc": {
            "name": "操作2"
        }
    }
    

你可能感兴趣的:(elasticsearch的概念与基本操作)