什么是分布式搜索引擎

什么是分布式搜索引擎

  • 搜索引擎
    所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。
  • 分布式存储与搜索
    是将数据分散存储在多台独立的设备上。传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要。分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。

Lucene vs Solr vs Elasticsearch

  • 到排序索引
  • Lucene是类库
    搜索的鼻祖,基于Java的一个搜索引擎,是一个jar包、api,但是它只能整合java。
  • Solr基于lucene
    Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器
  • ES基于lucene
    Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。

你可能感兴趣的:(分布式搜索引擎,搜索引擎,分布式)