作者简介:王哥,CSDN2022博客总榜Top100、博客专家
技术交流:定期更新Java硬核干货,不定期送书活动
王哥多年工作总结:Java学习路线总结, 点击 突击面试
数十万人的面试选择: 面试说人话系列《面试1v1》
我是 javapub,一名 Markdown
程序员从,八股文种子选手。
面试官: 嗨,欢迎来到我们的面试!今天我们将聊一聊ElasticSearch集群架构、索引和分片。你对这些有了解吗?
候选人: 当然!ElasticSearch就像是一群小伙伴组成的团队,一起合作来处理海量数据。索引就像是我们的图书馆,每本书都有一个唯一的编号,方便我们快速找到需要的信息。而分片就像是把一本大书分成多个小册子,每个人负责一部分,这样我们可以并行处理数据。
面试官: 很形象的比喻!那么,ElasticSearch集群是如何工作的呢?
候选人: 嗯,ElasticSearch集群就像是一个大家庭,由多个节点组成。每个节点都有自己的角色,有的是主节点,有的是数据节点。主节点负责协调整个集群的工作,而数据节点则负责存储和处理数据。
面试官: 很好!那么,索引是如何创建和管理的呢?
候选人: 好问题!创建索引就像是在图书馆里开辟一个新的区域,我们可以给它起个名字,比如"books"。然后,我们可以定义这个索引的字段,比如书名、作者、出版日期等。这样,我们就可以根据这些字段来搜索和过滤数据了。
面试官: 非常清楚!那么,分片是如何工作的呢?
候选人: 嗯,分片就像是把一本大书分成多个小册子,每个分片都是一个独立的存储单元。当我们往索引中添加数据时,ElasticSearch会根据一定的规则将数据均匀地分配到不同的分片上。这样,我们可以并行处理数据,提高性能和可扩展性。
面试官: 很棒!你对ElasticSearch集群架构、索引和分片的解释非常清晰。有没有什么源码方面的知识可以分享一下?
候选人: 当然!让我给你展示一段简单的源码,来说明一下分片的工作原理:
public class Shard {
private String shardId;
private List<Document> documents;
public Shard(String shardId) {
this.shardId = shardId;
this.documents = new ArrayList<>();
}
public void addDocument(Document document) {
documents.add(document);
}
public List<Document> search(String keyword) {
List<Document> results = new ArrayList<>();
for (Document document : documents) {
if (document.contains(keyword)) {
results.add(document);
}
}
return results;
}
}
这段代码模拟了一个分片的实现。我们可以看到,每个分片都有一个唯一的shardId,以及一个存储文档的列表。当我们添加文档时,它会被存储在对应的分片中。而当我们搜索关键字时,它会遍历分片中的文档,找到匹配的结果并返回。
面试官: 太棒了!你不仅解释得很清楚,还给出了源码示例。这对于刚入行的技术人员来说非常有帮助。谢谢你的分享!
最近我在更新《面试1v1》系列文章,主要以场景化的方式,讲解我们在面试中遇到的问题,致力于让每一位工程师拿到自己心仪的offer,感兴趣可以关注JavaPub追更!
目录合集:
Gitee:https://gitee.com/rodert/JavaPub
GitHub:https://github.com/Rodert/JavaPub
http://javapub.net.cn