Leohahah

Elasticsearch基本操作

在学习Elasticsearch的过程中想找一些可以系统的描述es操作的文章，但是官网没有中文页面，ES中文指南的排版和翻译又很突兀和不协调，因此决定自己看一遍官方的maunal总结一下,由于没时间把所有章节全部翻一遍，所以写一篇学习笔记以便完成初步的学习。

概念总览：

在描述ES的基本操作之前，首先来介绍几个概念：

Relational DB -> Databases -> Tables -> Rows -> Columns
Elasticsearch -> Indices   -> Types  -> Documents -> Fields

以上是早期的官方文档贴出的一个概念介绍图，其含义不用多说，其实ES更适合与MongoDB类比：

MongoDB       -> DBs       -> Collections -> Documents -> Fields
Elasticsearch -> Indices   -> Types       -> Documents -> Fields

ES里的Index可以看做一个库，Documents相当于表的行，而Types相当于表。

但是Types的概念将会被逐渐弱化并可能在未来版本中删除，而在Elasticsearch 6中，一个index下已经只能包含一个type了，因此可以将index理解为一个表，types意如其名仅用于展示一个document所属的分类，实际上在本文对ES进行操作时由于index和type的一对一关系，许多时候查询document已经只需要指定index而无需再指定type了。

本文使用Elasticsearch 6.5.4和Kibana 6.5.4下的环境进行演示。

一、Kibana命令行操作

使用Kibana操作ES是当前最简单的一种方式，且提供命令补全、index名称补全等便捷的功能。同时console界面的小扳手点进去还有和官方手册里一样的“copy as CURL”选择，将选中的命令copy之后粘贴到linux中就会转换为curl命令的格式，对于想要了解curl直接操作ES的同学是很有帮助的。

我个人并不建议直接使用curl操作ES，因为很多时候需要自己设置header，麻烦且低效。

Elasticsearch官方操作手册地址：https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html

这里参考官网的reference手册对内置API进行详细梳理，由于官方手册的介绍方式不适用于我这种新手，我只能打乱顺序学习，本部分的介绍基本遵循学习传统数据库的流程，主要分为以下7个部分：

Note：本文所有命令都是在Kibana console操作的，关于Kibana的安装配置和使用，参考《Kibana安装配置》一文。

1.数据结构搭建

结构的搭建主要包含index的创建和删除、查询等等，types无需创建。

#创建名为test的index，两种写法等同，名字不能包含特殊字符，只能小写，不能以-, _, +开头，不能超过255字节。
PUT test
PUT /test --PUT /test的本质是PUT http://ip:9200/test，kibana做了优化因此写不写之前的/无所谓
#当然你还可以直接插入一条数据，index会自动被创建
PUT leo/dramas/1
{
  "name":"权力的游戏"
}
#查看创建好的index的详细信息
GET leo
#删除index
DELETE leo
#查询当前所有的index,这里调用了_cat的API
GET _cat/indices

上图为我测试创建的多个indices，每列的列名分别是：

health status index uuid pri rep docs.count docs.deleted store.size pri.store.size
--其中pri表示number of shards，rep表示number of replicas，新建的index health为yellow的原因是我只有一台服务器因此未能创建replica。

在使用GET 查看index详细信息时可以看到，每个index下都有一个名为mapping的属性，这个属性用于描述当前type下的大致field有哪些，当然也别忘了在6.5.4版本里一个index下只有一种type了。

2.增

即向ES插入数据：

#插入单条数据，用PUT或POST都可以
PUT test/books/1 
{"name":"《阿Q正传》","price":100}
PUT test/books/2
{"name":"《钢铁是怎样炼成的》","price":200}
PUT test/books/3
{"name":"《西游记》","price":300}

插入多条数据，目前只能用_bulk API来实现，index表示新插入数据，create同理，在python的index()方法中op_type=create表示如果index不存在那么直接创建index并插入数据，而op_type=index表示向已存在的index中插数据，此外还可以一起bulk delete、update等操作。

PUT test/books/_bulk
{ "index":{"_id":4}}
{"name":"《围城》","price":101}
{ "index":{"_id":5}}
{"name":"《格林童话》","price":108}
}
#如果你不想设置主键_id，那么可以直接置空，系统会创建默认主键，写法如下：
PUT test/books/_bulk
{ "index":{}}
{"name":"《围城》","price":101}
{ "index":{}}
{"name":"《格林童话》","price":108}

注意插入数据时如果指定的_id已经存在,那么新插入的数据会直接替换原ID的数据。

查看下插入的数据：

GET test/books/_search
{"query":{"match_all":{}}}
GET test/books/_search
{"query":{"match":{"_id":1}}}
GET test/_search
{"query":
  {"range":
    {"price":
      {"lte":1000}
    }
  }
}

index下也有_search API因此这里你也可以省略books直接查询整个index所有types下的记录，实际上在6版本中由于types概念的弱化（一个index只能有一种type）许多查询都可以直接不写type名了。
这里的query和range以及lte都是DSL关键字，其实query只相当于模糊查询或全文搜索。关于查询，更系统的DSL（domain specific language）关键字及示例会在第5部分“查”补充。

3.删

记录的删除通常由2个API，直接DELETE和POST _delete_by_query完成，示例如下：

#DELETE只能根据ID进行删除，本例中删除的是系统自定义的ID因此比较奇怪。
DELETE test/books/_mbEdGgBH8b_BYBmOW-C
#_delete_by_query API允许你删除符合query条件的记录,其query body与上边的查询过滤的query body规则一样。
POST test/_delete_by_query
{"query":
  {"range":
    {"price":
      {"lte":1000}
    }
  }
}
#其实删除、修改和查询还涉及到多版本控制的概念，这个概念在传统数据库中已经很熟悉了，就是为了保证数据一致性的。
#关于版本控制的内容会在第6部分“版本控制”补充。

4.改

记录更新也是2个API，_update和_update_by_query,前者根据ID进行更新，后者可以更新指定的query结果。此外你还可以不使用这两个API直接像新插入数据那样更新数据，只是此时你的body部分必须包含所有的fields了，否则操作完毕后你会发现document只剩下你所更新的那几个fields，其他的全没了。

至于为什么删除使用DELETE命令，而更新只能用_update的API，只是因为ES是RESTFUL风格的，http的指令有DELETE但并没有UPDATE关键字。

更新涉及到版本控制以便维护数据一致性，其实分为两个操作：get和reindex，大致步骤是：首先取到相应的document，然后执行更新script，最后返回执行的结果。至于具体的多版本控制机制将在第6部分解释。

更新涉及的DSL语言也与其他操作很不一样：

#_update API，表示将id为5的document的price改为100
POST test/books/5/_update
{"script":
  {"source":"ctx._source.price=params.price",
   "lang":"painless",
   "params":{
     "price":100
    }
  }

这里的script，source，lang，params都是DSL关键字，lang=painless表示使用painless脚本语言来编写script来完成。
ctx我暂理解为当前事务，ctx._source表示当前定位的document，params表示本次更新用到的数据，source则表示更新操作，通俗来讲就是用params的数据+source的操作一起完成更新。

#如果只是简单的增加新field和删除field那么格式就比较简单：
POST test/books/5/_update
{
  "script":"ctx._source.booktype='少儿童话'"
}
POST test/books/5/_update
{
  "script":"ctx._source.remove('少儿童话')"
}
#此外ctx._source或ctx._source.还有很多其他的方法和属性，这里贴一个官网的示例来作出引申，更多的示例慢慢实践吧。
POST test/_doc/1/_update
{
    "script" : {
        "source": "if (ctx._source.tags.contains(params.tag)) { ctx.op = 'delete' } else { ctx.op = 'none' }",
        "lang": "painless",
        "params" : {
            "tag" : "green"
        }
    }
}

这个示例的含义就是：对于id=1的document，如果tags包含green字符，那么删掉这个document，否则不操作。至于contains是模糊匹配还是精确匹配，有兴趣的可以花几十秒做个测试。

5.查

前4个部分的示例中已经有许多查询的示例了，这里在之前的基础上介绍一些比较复杂的查询，首先来了解一个DSL的概念：

DSL：Domain Specific Language，ES提供一种基于JSON的查询语言，这种查询语言包含两种子句模式：

1.Leaf query clauses

2.Compound query clauses --常用的就是bool组合查询

好吧，其实这里介绍这两个概念对理解复杂查询毫无作用，我只是照搬下官方手册，防止某天顿悟时找不到概念，接下来再看两个DSL的概念：

Query一般来说包含两各部分：query context 或 filter context：

举例来说：

GET /_search
{
  "query": { 
    "bool": { 
      "must": [
        { "match": { "title":   "Search"        }}, 
        { "match": { "content": "Elasticsearch" }}  
      ],
      "filter": [ 
        { "term":  { "status": "published" }}, 
        { "range": { "publish_date": { "gte": "2015-01-01" }}} 
      ]
    }
  }
}

这个例子的query就包含了所有2种context，并使用了bool组合查询，可以看到bool是最外围的关键字，must与filter并行。
bool组合查询的子关键字主要包含must,must_not,should，分别对应AND、NOT、OR三种逻辑运算，此外还有一个filter子关键字。
--filter与must:match的区别：
参考：https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-bool-query.html
1.must:match会为匹配到的每个记录打分，称作scoring，表示匹配程度,查询的结果按打分进行排序。
2.filter与must:match基本一致，唯一的区别是其结果不参与打分，相当于一个再过滤。

到这里DSL的4个概念就介绍完了，是的全部介绍完了。官网总共也就这几行，更多关于关键字的具体应用需要到特定的页面且也通常都是一个简单的示例完事，因此只能靠日常实践了。

介绍完DSL那么回到实际应用中来，用于查询的API一般也是2种：直接通过GET index/doc_type/doc_id获取，以及_search API

#GET获取比较简单，只要有id就可以了，没id请使用_search API
GET test/books/1
#_search API是查询使用的核心API，包含诸如聚合、排序、集群查询、explain API等等等等，这里只贴个官方链接和一个示例算啦，重在实践掌握。
https://www.elastic.co/guide/en/elasticsearch/reference/current/search.html
POST /twitter/_search?routing=kimchy
{
    "query": {
        "bool" : {
            "must" : {
                "query_string" : {
                    "query" : "some query string here"
                }
            },
            "filter" : {
                "term" : { "user" : "kimchy" }
            }
        }
    }
}
#这里的?routing=kimchy是指在集群中查询时可以指定名为kimchy的shard。

6.版本控制

Versionning，在官网中暂未找到独立的说明页面，只找到2篇古老的博客，分别是2011年和2013年的，地址如下：

https://www.elastic.co/blog/versioning

https://www.elastic.co/blog/elasticsearch-versioning-support

第一篇：

内容显示versioning是由elasticsearch在0.15版本引入的新特性”乐观并发控制“引申出来的，只介绍了每个document都会有个由系统控制自增的_version属性，并未对版本控制机制作出细节解释。

不过既然是乐观并发控制我们可以参考传统RDBMS数据库中的乐观锁来理解，即数据库服务器会自动进行document快照存储以便实现事务一致性，接下来看下第二篇博客（实际上看完第二篇博客，里边也确实介绍了乐观锁定）。

第二篇：

以一个经典的丢失更新示例来描述下乐观并发控制的必要性：

#首先造一条数据
PUT bank_account/shanghai/1
{
  "name":"leo",
  "deposit":100
}
GET bank_account/shanghai/1
#如下为插入的数据，可以看到_version属性值为1
{
  "_index" : "bank_account",
  "_type" : "shanghai",
  "_id" : "1",
  "_version" : 1,
  "found" : true,
  "_source" : {
    "name" : "leo",
    "deposit" : 100
  }
}
#如果这时候两个商户同时要从我账户里扣1块钱，结果就是两家同时取到我账户余额为100，各扣了一元并把99的余额写入ES，这显然是错的。因此ES推出了versioning特性。

对于index中的每条记录都会有一个_version的属性，其取值范围为：[1,2^63)，插入数据时默认的_version都是1，每次对这个document进行修改或删除操作都会使其+1，这个过程是由ES自己控制的。

总结一下Versioning的工作机制其实是这样的，我们以一个投票计数案例为例，1表示球员的ID，每次有人为id=1的球员投票都将投票计数votes+1：

POST NBA/all_star_votes/1/_update?retry_on_conflict=5
{"script":"ctx._source.votes += 1"}

1.首先查询到你要更新的documents。

2.然后进行version check，记下你查询到的documents的_version。

3.更新时指定_version=<第二步中查到的version>

4.ES server端收到更新请求后开始进行冲突检测，如果发现有人在这期间成功投了票（那么_version就会变化），那么直接返回一个http的409 conflict错误码，如果可以更新那么自然返回200 ok就好。

5.如果你显式的设置了retry_on_conflict参数，那么步骤四的表现还会有所变化：在发现记录被更改后，server端会尝试根据scripts将votes+1，然后将_version也+1，然后使用新的_version值和votes值进行更新，如果再次冲突那么重复之前的操作直到成功更新或达到retry_on_conflict的重复次数。

以上操作据官方手册说是节省了频繁获取/释放锁的开销，versioning特性并非强制开启的，只有你指定了version参数或者retry_on_conflict参数时，ES才会启用versioning特性为你进行version check和冲突检测。因此对于类似投票计数这种field的更新你可以开启versionging特性，对于不规则的并发更新你可以弃用此特性直接使用程序队列或者干脆用关系型数据库存储数据，对于存款更新这种不规则并发更新的金融场景，并发请求之间不可能每次都增减相同的金额，使用retry_on_conflict显然是无效的，这种场景用关系型数据库显然更安全。

当然对于delete操作来说versioning的表现又有所不同，因为如果一个系统频繁的进行数据的删除，那么保存大量的旧version会导致资源迅速被耗尽，因此对于delete的记录ES的默认保存version的时间是1min，这被称作GC（垃圾回收），你可以通过修改index.gc_deletes参数来扩大此超时时间。

PS:官网没说update操作留下的旧version是否也会被定期清除，这个可以试验来验证，插入一条数据多次更新后进行指定_version的查询即可验证，这里节省时间懒的测了。

7.集群操作

集群操作这里省略，会写在单独的集群搭建笔记中。

二、Python接口操作

你可以使用Python内置的REST API：requests module来进行es的操作，但是es提供了一种更加贴近elasticsearch概念体系的API：elasticsearch-py，因此这里使用elasticsearch-py来进行演示。

elasticsearch API详述：https://elasticsearch-py.readthedocs.io/en/master/api.html

Note：为与Python语言兼容，避免出现关键字冲突，使用from_代替from，doc_type代替type参数。且为保持一致性和安全性，本接口推荐使用关键字传参，不建议使用位置传参。

先来一个简单的演示示例：

# -*- coding: utf-8 -*-
from elasticsearch import Elasticsearch
es = Elasticsearch(hosts='http://10.0.1.49:9200/')
es.delete_by_query(index="test",doc_type="books",body={"query": { "match_all":{}}})
#这里的id=1/2在进入ES后就变为了默认主键，查询时不能用id来查，而是要用_id。当然这里的主键概念其实是借用了mongo或其他传统关系型数据库的概念，方便理解而已。
es.index(index="test", doc_type="books",id=1,body={"name": "《钢铁是怎样炼成的》","price":100})
es.index(index="test", doc_type="books",id=2,body={"name": "《狂人日记》","price":200})
# res=es.search(index="test",doc_type="books",body={"query": {"match_all": {}}})
# print(res)
res=es.search(index="test",
              doc_type="books",
              body={"query":
                        {"range":
                             {"price":
                                  { "lt":400}
                              }
                         },
                    "sort":{
                        "_id":
                            {}
                            # {"order":"desc"}
                            }
                    }
              )
print("%d documents found" % res['hits']['total'])
for doc in res['hits']['hits']:
    print("%s) %s" % (doc['_id'], doc['_source']['name']))

这里边涉及到一些基础的method，这些method的详细参数和用法都可以在上边贴出的elasticsearch API详述网址中找到。

elasticsearch module包含CatClient, ClusterClient, IndicesClient, IngestClient, NodesClient, SnapshotClient and TasksClient等7个client子类以及一些其他暂无需介绍的类，此外还有一个底层访问接口Elasticsearch类，你能且也只能通过Elasticsearch来访问前述的7种接口。

定义Elasticsearch class的部分相关代码为：

......
from ..transport import Transport
from .indices import IndicesClient
from .ingest import IngestClient
from .cluster import ClusterClient
from .cat import CatClient
from .nodes import NodesClient
from .remote import RemoteClient
from .snapshot import SnapshotClient
from .tasks import TasksClient
class Elasticsearch(object):
    def __init__(self, hosts=None, transport_class=Transport, **kwargs):
        """
        :arg transport_class: :class:`~elasticsearch.Transport` subclass to use.
        """
        self.transport = transport_class(_normalize_hosts(hosts), **kwargs)
        # namespaced clients for compatibility with API names
        self.indices = IndicesClient(self)
        self.ingest = IngestClient(self)
        self.cluster = ClusterClient(self)
        self.cat = CatClient(self)
        self.nodes = NodesClient(self)
        self.remote = RemoteClient(self)
        self.snapshot = SnapshotClient(self)
        self.tasks = TasksClient(self)
......

另一种通俗的解释方式就是：

当你定义了一个Elasticsearch实例后，会衍生N种诸如IndicesClient、IngestClient等实例，你可以根据自己的需求通过调用Elasticsearch的属性来获取这些实例，进而调用他们的各种method，这些属性值可以是__init__方法中任意属性，调用这些属性后你就可以使用这些属性实例的特有method了，这些client子类实例的属性可以在上边贴出的网址里学习，这里只简略贴一下核心接口类Elasticsearch的相关解释：

class elasticsearch.Elasticsearch(hosts=None, transport_class=, **kwargs)

hosts参数使用RESTFUL风格定义，即URL格式，类似上边的'http://10.0.1.49:9200/'

除此之外你还可以使用SSL协议创建连接，其参数官网并未单独列出，但可以通过其SSL连接示例获知使用方式。

此class全部的method包含：

bulk(**kwargs)
clear_scroll(**kwargs)
count(**kwargs)
create(**kwargs)
delete(**kwargs)
delete_by_query(**kwargs)
delete_script(**kwargs)
exists(**kwargs)
exists_source(**kwargs)
explain(**kwargs)
field_caps(**kwargs)
get(**kwargs)
get_script(**kwargs)
get_source(**kwargs)
index(**kwargs)
info(**kwargs)
mget(**kwargs)
msearch(**kwargs)
msearch_template(**kwargs)
mtermvectors(**kwargs)
ping(**kwargs)
put_script(**kwargs)
reindex(**kwargs)
reindex_rethrottle(**kwargs)
render_search_template(**kwargs)
scroll(**kwargs)
search(**kwargs)
search_shards(**kwargs)
search_template(**kwargs)
termvectors(**kwargs)
update(**kwargs)
update_by_query(**kwargs)

git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
ElasticSearch查询超过10000条（1000页）时出现Result window is too large的问题王月亮17
问题当ES数据量较大，使用分页查询超过10000条（1000页）时，出现如下错误：Cannotexecutejestaction,responsecode:500,error:{"root_cause":[{"type":"query_phase_execution_exception","reason":"Resultwindowistoolarge,from+sizemustbelesstha
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
（k8s）Kubernetes 从0到1容器编排之旅道不贱卖，法不轻传 kubernets kubernetes 容器云原生
一、引言在当今数字化的浪潮中，Kubernetes如同一艘强大的航船，引领着容器化应用的部署与管理。它以其卓越的灵活性、可扩展性和可靠性，成为众多企业和开发者的首选。然而，要真正发挥Kubernetes的强大威力，仅仅掌握基本操作是远远不够的。本文将带你深入探索Kubernetes使用过程中的奇技妙法，为你开启一段优雅的容器编排之旅。二、高级资源管理之精妙艺术1.资源配额与限制：雕琢资源之美•Ku
Java高并发编程详解系列-深入理解Thread构造 nihui123 高并发 Java高并发 Java 高并发
上篇分享中主要是对线程的基本概念和基本操作做了一个分享，同时提出了两种常用的创建多线程的方法，当然在后期的分享中也会提及到更多的创建线程的方式，到后期的分享的时候再说。这次主要是深入的理解一下Thread的构造函数，通过构造函数对于Thread有一个更加深入的了解。这里首先提供一个JDK1.6的ThreadAPI截图线程命名规范从源码分析可以看到在Thread类中默认提供了线程的命名方式，这个
FloatActionButton 使用 yuzhiyi_宇
FloatActionButton(简称FAB)是负责显示界面基本操作的圆形按钮，其提供的最好是高频率的操作。使用FloatActionButton继承自ImageView，具备ImageView的全部属性。xml布局代码属性作用android:srcFAB中显示的图标app:layout_anchor设置FAB的锚点，即以该控件为参考app:layout_anchorGravityFAB相对锚点
CTF——web方向学习攻略一则孤庸 CTF 网络安全 CTF
1计算机基础操作系统：熟悉Linux命令，方便使用Kali。网络技术：HCNA、CCNA。编程能力：拔高项，有更好。2web应用HTTP协议：必须掌握web开发框架web安全测试3数据库数据库基本操作SQL语句数据库优化4刷题
python数组的基本操作迟遇3 python 开发语言
一.创建数组arr:list[int]=[0]*8num1:list[int]=[1,5,9,8,6]二.访问元素1.指定访问（通过索引（下标））defrandom_a(nums:list[int])->int:returnnums[2]print(random_a(arr))2.随机访问(会访问不同的元素)defrandom_access(nums:list[int])->int:"""随机访问
Elasticsearch7.7.0 配置用户名和密码 i0208 Elasticsearch
配置用户和密码需要在配置文件中开启x-pack验证,修改config目录下面的elasticsearch.yml文件，在里面添加如下内容,并重启ES[root@localhostesuser]#vim/opt/es/elasticsearch-7.7.0/config/elasticsearch.ymlxpack.security.enabled:truexpack.license.self_ge
elasticsearch数据迁移之elasticdump 迷茫运维路 elasticsearch 中间件 elasticsearch linux 运维
系列文章目录第一章es集群搭建第二章es集群基本操作命令第三章es基于search-guard插件实现加密认证第四章es常用插件文章目录系列文章目录前言一、elasticdump是什么？二、安装elasticdump工具1.离线安装2.在线安装三、elasticdump相关参数四、使用elasticdump进行数据备份五、使用elasticdump进行数据恢复前言在企业实际生产环境中,避免不了要对
在生产环境中部署Elasticsearch：最佳实践和故障排除技巧——聚合与搜索（三）不会编程的小孩子 elasticsearch 大数据搜索引擎
#在生产环境中部署Elasticsearch：最佳实践和故障排除技巧——聚合与搜索（三）前言文章目录前言-聚合和分析-执行聚合操作-1.使用JavaAPI执行聚合操作-2.使用CURL命令执行聚合操作-1.使用JavaAPI执行度量操作-2.使用CURL命令执行度量操作-使用缓存-调整分片大小和数量-使用搜索建议-结论-节点发现-负载均衡-故障转移-结论-访问控制-加密-身份验证-结论-RESTA
Elasticsearch Java API 的使用（22）—实现桶聚合迷途码界 Elasticsearch Java API 桶聚合
分组聚合使用terms实现分组集合publicclassEsTermsAggthrowsUnknownHostException{publicvoidTermsAgg(TransportClientclient){AggregationBuilderagg=AggregationBuilders.terms("terms").field("agg");SearchResponseresponse=
Elasticsearch之bool查询 cyt涛 java elasticsearch 大数据搜索引擎 bool 布尔查询全文检索
bool查询是Elasticsearch中最常用的复合查询类型，允许将多个查询组合在一起。它通过逻辑操作符（如must、should、must_not和filter）来构建复杂的查询条件，从而满足多条件匹配、逻辑与（AND）、或（OR）、非（NOT）的查询需求。bool查询主要由四个部分组成：must：必须满足的条件（类似于SQL中的AND）。should：应该匹配的条件（类似于SQL中的OR）。
linux查看git log目录,git得一些常用命令！廖宝华 linux查看git log目录
.Git基本操作查看状态：1.gitstatus：查看工作区、暂存区的状态1.1.Onbranchmaster#默认在master(主干)分支上1.2Nocommitsyet#当前没有任何的提交1.3nothingtocommit(create/copyfilesanduse"gitadd"totrack)没有什么需要提交的(创建/复制文件，使用“gitadd”命令可追踪，也就是用git去管理文件
【ShuQiHere】深入浅出栈（Stack）数据结构：从基本操作到实现 ShuQiHere 数据结构 java 算法
【ShuQiHere】引言在计算机科学中，栈（Stack）是一种极为常见的抽象数据类型（AbstractDataType,ADT），它在表达式求值、递归调用、内存管理等领域得到了广泛应用。栈是一种遵循**后进先出（LastInFirstOut,LIFO）**原则的数据结构，这意味着最后进入栈的元素会最先被取出。理解栈的工作原理，是学习更多复杂算法和数据结构的基础。这就好比你在往一个箱子里放东西，最
flutter开发多端平台应用的探索上（基本操作）夏目艾拉 flutter 设计模式 java android
前言Flutter是一个跨平台的开发框架，它允许开发者使用相同的代码库来构建iOS、Android、Web和桌面应用程序。最近想了想，自己一直在用flutter开发特定端的应用，但是对于其他端的端特性case，如桌面端的菜单、多窗口、鼠标事件，需要怎么处理还没什么概念，本文旨在简单探索这方面的内容。正文首先就是判断平台了，可以通过如下方式import'dart:io'showPlatform;vo
Elasticsearch 安装哒哒-blog Elasticsearch elasticsearch jenkins 大数据
下载安装elasticsearch下载链接运行：bin\elasticsearch.bat设置密码：.\bin\elasticsearch-setup-passwordsinteractive这边设置密码遇到一个坑PSG:\elasticsearch-8.8.1>.\bin\elasticsearch-setup-passwordsinteractiveFailedtoauthenticateus
MyBatis Plus 实战详解 Aries263 redis 分布式数据库
一、引言MyBatisPlus（简称MP）是MyBatis的增强工具，旨在简化开发、提高效率。它保留了MyBatis的强大功能，并在其基础上进行了扩展和优化，提供了强大的CRUD操作、配置选项、条件构造器等功能。本文将详细介绍MyBatisPlus的安装、配置、基本操作以及分页和条件查询的使用。二、安装与配置1.添加依赖首先，在Maven项目的pom.xml中添加MyBatisPlus的依赖。以下
【数据结构】基础学习 weixin_44329069 速成课系列数据结构学习 java
线性数据结构1.链表（LinkedList）链表是一种线性数据结构，每个节点包含数据和指向下一个节点的引用（即指针）。1.链表的基本操作（Java中的LinkedList类）LinkedList是Java标准库中的一个双向链表实现。我们将通过一些插入、删除和获取操作来演示其使用。importjava.util.LinkedList;publicclassLinkedListExample{publ
华为VRP系统基本操作 ZZZCY2003 华为
简介：VRP是VersatileRoutingPlatform的简称，它是华为公司数据通信产品的通用网络操作系统。目前，在全球各地的网络通信系统中，华为设备几乎无处不在，因此，学习了解VRP的相关知识对于网络通信技术人员来说就显得尤为重要。VRP系统提供了丰富的命令行视图，包括用户视图、系统视图、接口视图等，用户可以通过相应的命令进入不同的视图进行配置和管理。例如，system-view命令可以进
JDBC使用晚睡早起₍˄·͈༝·͈˄*₎◞ ̑̑ java java
7.2创建JDBC应用7.2.1创建JDBC应用程序的步骤使用JDBC操作数据库中的数据包括6个基本操作步骤：（1）载入JDBC驱动程序：首先要在应用程序中加载驱动程序driver，使用Class.forName()方法加载特定的驱动程序，每种数据库管理系统的驱动程序不同，由数据库厂商提供。（2）定义连接URL，建立数据库连接对象：通过DriverManager类的getConnection()方
Docker启动Elasticsearch(挂载数据、配置文件、插件) 程序员迪迦项目实战 Java elasticsearch docker
Docker启动Elasticsearch拉取镜像dockerpullelasticsearch:7.4.2修改配置文件mkdir-p/mydata/elasticsearch/configmkdir-p/mydata/elasticsearch/data/mkdir-p/mydata/elasticsearch/pluginsecho"http.host:0.0.0.0">>/mydata/el
docker部署elasticsearch 大大陈· elasticsearch docker 大数据
docker部署es1.简单启动2.配置文件3.安装es步骤1.简单启动#"discovery.type=single-node"标识单机启动dockerrun-d--nameelasticsearch-p9200:9200-p9300:9300-e"discovery.type=single-node"elasticsearch:tag#如果没有上面的标识，是集群启动，不这样做会报错#但是这样启
Docker安装elasticsearch和kibana viego1999 elasticsearch docker 大数据
1、首先拉取elasticsearch镜像dockerpullelasticsearch:7.9.12、创建docker挂载的目录我这里将docker环境下挂在的目录统一放在了/dockerdata目录下mkdir-p/dockerdata/elasticsearch/configmkdir-p/dockerdata/elasticsearch/datamkdir-p/dockerdata/ela
Docker部署单点es Javaismymorning ES学习笔记 docker elasticsearch
前言该笔记是根据B站上黑马SpringCloud学习总结的一、ES是什么？Elasticsearch是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸缩性，能使数据在生产环境变得更有价值二、Docker部署ES步骤1.创建网络因为还要部署Kibana，实现es和Kibana关联，创建一个网络Kibana是为
oracle用户管理 sinat_38878030
第二章Oracle用户管理【目标】1.掌握用户的创建、删除、修改2.掌握基本的权限管理3.了解数据字典及基本操作【内容】一、用户的创建、删除、修改u创建用户语法：createuser用户名identifiedby密码;注：在oracle中创建用户只能由管理员或者具有管理员的权限的用户创建。案例：新建用户abc新建的用户是没有任何权限的，包括连接数据库的权限。新创建的用户是没有任何权限的，直接登录会
【数据结构】算法的时间复杂度和空间复杂度熙曦Sakura 数据结构算法数据结构
算法效率如何衡量一个算法的好坏首先要思考一个问题：如何衡量一个算法的好坏呢？比如对于以下斐波那契数列：longlongFib(intN){if(N0;--end){intexchange=0;for(size_ti=1;ia[i]){Swap(&a[i-1],&a[i]);exchange=1;}}if(exchange==0)break;}}基本操作执行最好N次，最坏执行了(N*(N+1)/2次
MySQL同步数据到Elasticsearch 运维小雅 elasticsearch mysql 大数据
背景随着平台的业务日益增多，基于数据库的全文搜索查询速度较慢，已经无法满足需求。所以，决定基于Elasticsearch做一个全文搜索平台，支持业务相关的搜索需求。那么第一个问题就是：如何从MySQL同步数据到Elasticsearch？解决方案一：基于Logstash同步数据该方案上次有详细说明过，这里就简单描述一下。Logstash同步数据流程图：优点：1、组件少，只需要Logstash就可以
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL

Elasticsearch基本操作

你可能感兴趣的:(Elasticsearch基本操作)