本文记录ES的名词、配置、API等的介绍。
能预先确定数据的结构。
无法确定数据的结构,如文档、html等。
半径查找、矩形查找、空间查找等
ES最擅长从海量数据中检索少量相关数据,但不擅长单次查询大量数据。
ES是OLAP系统,侧重于海量数据的检索,而写入实时性并不是很高,默认1秒,1秒是ES缓冲区Buffer的刷新间隔时间。
ES是以写入实时性去换取数据检索的性能
ES写入实时性不高,对于数据保持强一致性的场景并不适用,需要具有ACID特性的数据库来支持,如MYSQL。
一个节点就是一个ES实例,是一个ES进程。
角色是节点的重要属性。
常见的角色有:
ES共有11个角色
具体可查看ES官方文档
角色配置
对节点的角色配置,可区分不同节点功能
在没有配置节点配置时,默认拥有全部角色
node.roles: [角色1, 角色2, ...]
在ES中的索引类似于MYSQL的表,并不是用来快速查询的数据结构。
使用Kibana中新建索引
## 索引规范
## 字母全部小写
## 多个单词用下划线,不使用驼峰或帕斯卡 text_index
PUT product
索引组成部分
相当于MYSQL中一条数据,因为ES中数据是以JSON格式储存的。
创建一个文档
http://192.168.8.125:9200/product/_doc/1
其中product为索引,_doc为类型,在7版本以后没有类型的概念,也就是索引下类型唯一,1为文档id。
分片就是将索引分成若干块,而且分片是无限复制的
http://192.168.8.125:9200
http://192.168.8.125:9200/_cat/nodes
http://192.168.8.125:9200/_cat/health
http://192.168.8.125:9200/_cat/master
http://192.168.8.125:9200/_cat/indices
语法 GET请求
http://192.168.8.125:9200/_search
http://192.168.8.125:9200/<索引名>/_search
可选参数:
创建语法 PUT请求
http://192.168.8.125:9200/<索引名称>
可选参数:
{
"aliases": {
"NAME": {}
},
"mappings": {},
"settings": {
"number_of_shards": 1, #主分片数量
"number_of_replicas": 1 #每个主分片副分片数量
...
}
}
更新settings语法 PUT请求
http://192.168.8.125:9200/index_text/_settings
可选参数:
{
"number_of_replicas": 3
...
}
删除语法 DELETE请求
http://192.168.8.125:9200/index_text
索引创建成功后,以下属性不可变
重建语法 POST请求
http://192.168.8.125:9200/_reindex
可选参数:
{
"source": {
"index": "text_index"
},
"dest": {
"index": "text_index_new"
}
}
只复制数据,不复制结构
以上操作为写操作,均发生在Primary Shard(主分片),当操作对象为数据流时,op_type必须为 create
在text_create索引下以create方式插入一条id为1内容是个JSON字符串的文档
PUT text_create/_doc/1?op_type=create
{
"name":"smz"
}
或
PUT text_create/_create/1
{
"name":"smz"
}
第一次则成功创建
{
"_index": "text_create",
"_id": "1",
"_version": 1,
"result": "created",
"_shards": {
"total": 2,
"successful": 1,
"failed": 0
},
"_seq_no": 0,
"_primary_term": 1
}
如果存在则报错
{
"error": {
"root_cause": [
{
"type": "version_conflict_engine_exception",
"reason": "[1]: version conflict, document already exists (current version [1])",
"index_uuid": "CF5tWqwITRG1Lk77yHJELw",
"shard": "0",
"index": "text_create"
}
],
"type": "version_conflict_engine_exception",
"reason": "[1]: version conflict, document already exists (current version [1])",
"index_uuid": "CF5tWqwITRG1Lk77yHJELw",
"shard": "0",
"index": "text_create"
},
"status": 409
}
在text_create索引下以index方式插入一条id为1内容是个JSON字符串的文档
PUT text_create/_doc/1?op_type=index
{
"name":"smz"
}
第一次则成功创建
{
"_index": "text_create",
"_id": "2",
"_version": 1,
"result": "created",
"_shards": {
"total": 2,
"successful": 1,
"failed": 0
},
"_seq_no": 1,
"_primary_term": 1
}
如果存在则全量覆盖
{
"_index": "text_create",
"_id": "2",
"_version": 2,
"result": "updated",
"_shards": {
"total": 2,
"successful": 1,
"failed": 0
},
"_seq_no": 2,
"_primary_term": 1
}
不指定id则系统自动生成,且该方法只能使用POST请求
该API查出来的数据只会查出源字段,不会查出元字段(系统字段)。
语法如下
GET text_create/_source/1
{
"name": "smz"
}
与_doc API组合
GET text_create/_doc/1?_source=false
{
"_index": "text_create",
"_id": "1",
"_version": 1,
"_seq_no": 0,
"_primary_term": 1,
"found": true
}
GET text_create/_doc/1?_source=true
{
"_index": "text_create",
"_id": "1",
"_version": 1,
"_seq_no": 0,
"_primary_term": 1,
"found": true,
"_source": {
"name": "smz"
}
}
在更新操作时会使源数据字段全都呗覆盖,所以采用update API来处理更新某个字段
语法如下
POST text_create/_update/1
{
"doc": {
"name":"smz2"
}
}
批量查询出符合条件的,可以跨索引。
语法如下
GET _mget
{
"docs": [
{
"_index": "product",
"_id": "1"
},
{
"_index": "text_create",
"_id": "1"
}
]
}
GET text_create/_mget
{
"docs": [
{
"_id": "1"
},
{
"_id": "2"
}
]
}
GET text_create/_mget
{
"ids": [
1,
2
]
}
必须为两行形式,第一行为操作对应的对象,第二行为操作内容
批量添加,create可以更换为index,与上文单独一条添加的效果一样。
语法如下
POST _bulk
{"create":{"_index":"text_create","_id":"1"}}
{ "name":"smz2"}
{"create":{"_index":"text_create","_id":"2"}}
{ "name":"smz2"}
{"create":{"_index":"text_create","_id":"3"}}
{ "name":"smz2"}
批量更新。
POST text_create/_bulk
{"update":{"_id":"1"}}
{"doc":{"name": "smz_bulk"}}
{"update":{"_id":"2"}}
{"doc":{"name": "smz_bulk"}}
批量删除。
POST _bulk
{"delete":{"_index": "text_create","_id":"3"}}
{"delete":{"_index": "text_create","_id":"2"}}
该API可以根据不同条件来执行操作。
语法如下
POST text_create/_delete_by_query
{
"query": {
...
}
}
本文记录ES的名词、配置、API的基本用法等。