Elasticsearch(ES)入门学习

文章目录

  • 前言
  • 一、Elasticsearch是什么?
  • 二、基本概念
    • 2.1 索引(indices)
    • 2.2 类型(type)
    • 2.3 文档(document)
    • 2.4 字段(field)
  • 三、集群基础概念
    • 3.1 cluster (集群)
    • 3.2 shards (分片)
    • 3.3 replicas(副本)
  • 总结


前言

Elasticsearch 是一个实时的分布式搜索分析引擎,它能让你以前所未有的速度和规模,去探索你的数据。 它被用作全文检索、结构化搜索、分析以及这三个功能的组合


以下是本篇文章正文内容,主要介绍Elasticsearch的一些基本概念和用法

一、Elasticsearch是什么?

Elasticsearch 是一个开源的搜索引擎,建立在一个全文搜索引擎库 Apache Lucene™ 基础之上。 Lucene 可以说是当下最先进、高性能、全功能的搜索引擎库—​无论是开源还是私有。

Elasticsearch 也是使用 Java 编写的,它的内部使用 Lucene 做索引与搜索。 它提供一套简单的 RESTful API 隐藏了 Lucene 的复杂性,使全文检索变得简单。

二、基本概念

2.1 索引(indices)

indices是index的复数,代表许多的索引。index类似于传统关系数据库中的一个数据库 ,是一个存储关系型文档的地方。在一个集群中,可以定义任意多的索引。

2.2 类型(type)

类型是模拟mysql中的table概念,一个索引库下可以有不同类型的索引,比如商品索引,订单索引,其数据格式不同。不过这会导致索引库混乱,因此7.0以后的版本移除了这个概念

2.3 文档(document)

存入索引库原始的数据。比如每一条商品信息,就是一个文档。相当于数据库里的一行数据
一个文档是一个可被索引的基础信息单元。比如,你可以拥有某一个客户的文档,某一个产品的一个文档,当然,也可以拥有某个订单的一个文档。文档以json格式来表示

2.4 字段(field)

文档中的属性。相当于数据库中的列

三、集群基础概念

es集群部署图:下面逐一介绍
Elasticsearch(ES)入门学习_第1张图片

3.1 cluster (集群)

如上图:cluster代表一个es集群。集群中有三个节点node1、node2、node3。其中master代表node1为主节点。这个主节点是可以通过选举产生的,主从节点是对于集群内部来说的。
es的一个概念就是去中心化,字面上理解就是无中心节点,这是对于集群外部来说的,因为从外部来看es集群,在逻辑上是个整体,你与任何一个节点的通信和与整个es集群通信是等价的。

3.2 shards (分片)

shards代表索引分片,es可以把一个完整的索引分成多个分片,这样的好处是可以把一个大的索引拆分成多个,分布到不同的节点上。构成分布式搜索。分片的数量只能在索引创建前指定,并且索引创建后不能更改。解决了数据水平扩展,将数据分布到集群内全部节点上
如上图:P0 和P1代表索引数据分成了两个分片。绿色边框的代表是主分片,灰色边框代表是分片副本

3.3 replicas(副本)

replicas:代表索引副本,es可以设置多个索引的副本。

副本的作用

  • 提高系统的容错性,当某个节点某个分片损坏或丢失时可以从副本中恢复
  • 提高es的查询效率,es会自动对搜索请求进行负载均衡。

如上图:P0主分片有两个副本R0(灰色边框)P1主分片有两个副本R1(灰色边框)

总结

本文仅仅简单介绍了Elasticsearch的一些基本概念,接下来的会详细介绍Elasticsearch的基本命令和实际使用

你可能感兴趣的:(Elasticsearch,elasticsearch,搜索引擎,全文检索,java,分布式)