六十四、Elasticsearch内核原理-再谈倒排索引

1、倒排索引,是适合用于进行搜索的

2、倒排索引的结构
(1)包含这个关键词的document list

(2)包含这个关键词的所有document的数量:IDF(inverse document frequency)

(3)这个关键词在每个document中出现的次数:TF(term frequency)

(4)这个关键词在这个document中的次序

(5)每个document的长度:length norm

(6)包含这个关键词的所有document的平均长度

3、倒排索引不可变的好处

(1)不需要锁,提升并发能力。避免锁的问题

(2)数据不变,一直保存在os cache中,只要cache内存足够

(3)filter cache一直驻留在内存,因为数据不变

(4)可以压缩,节省CPU和IO开销

4、倒排索引不可变的坏处

每次都要重新构建整个索引。

若有兴趣,欢迎来加入群,【Java初学者学习交流群】:458430385,此群有Java开发人员、UI设计人员和前端工程师。有问必答,共同探讨学习,一起进步!
欢迎关注我的微信公众号【Java码农社区】,会定时推送各种干货:


qrcode_for_gh_577b64e73701_258.jpg

你可能感兴趣的:(六十四、Elasticsearch内核原理-再谈倒排索引)