9、ES高频面试题

1、什么是倒排索引

倒排索引是搜索引擎的核心,它是一种像数据结构一样的散列图,可将用户从单词导向文档或网页。主要目标是快速从数百万文件中查找数据

倒排索引主要体现在文档的保存和查询流程中

  • 保存文档时,会先根据文档进行分词,然后使用分好的词条作为key进行排序,然后将文档的标识作为value进行存储

  • 查询文档时,也会先对查询关键字进行分词,然后根据分好的词条直接定位相关文档,再做结果的合并

2、ES中的查询关键字有哪些

在ES中用于声明查询条件的关键字主要有:

  • match_all:查询所有

  • match、multi_match:全文检索

  • term:精准词条查询

  • range:范围查询

  • bool、must、must_not、should、filter:复合查询

还有一些跟地理位置、相关性算分相关的

3、ES中字符串类型有几个

ES有两个字符串类型,分别是:keyword 和 Text,他们两个的区别主要是在分词方面

  • keyword类型的字符串是不会分词的,直接根据字符串内容建立倒排索引
  • Text类型的字符串在保存到ES时会先分词,然后根据分词后的内容建立倒排索引

4、ES中query和filter的区别

query和filter都可以实现ES中的查询,区别是

  • query查询操作不仅仅会进行查询,还会计算分值,用于确定相关度
  • filter查询操作仅判断是否满足查询条件,不会计算任何分值,也不会关心返回的排序问题,同时,filter查询的结果可以被缓存,提高性能。

5、如何保证ES和MySQL的数据一致性

保证MySQL和ES数据一致性的方式有很多,下面列举几个:

  1. 同步双写:程序在向MySQL写入数据之后,立即将数据写入ES中。这种方法可以确保数据的实时同步,但可能会增加系统的复杂性和延迟。
  2. 异步消息:程序在在向MySQL写入数据之后,向MQ中投递消息,ES相关程序监听MQ,获取数据,写入ES
  3. canel监听:使用canel监听MySQL的binlog,当发现写入操作后,立即读取内容,写入ES
  4. logstatsh:使用logstatsh将MySQL中的数据实时传输给ES

你可能感兴趣的:(Java面试题,elasticsearch,搜索引擎,es)