ElasticSearch介绍

ElasticSearch介绍

  • Elasticsearch是一个基于Lucene的搜索服务器
  • 提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口
  • Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到近实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET(C#)、PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。

ES的全文检索功能

全文检索功能主要依赖倒排索引实现数据查询

全文检索是指:

  • 通过一个程序扫描文本中的每一个单词,针对单词建立索引,并保存该单词在文本中的位置、以及出现的次数
  • 用户查询时,通过之前建立好的索引来查询,将索引中单词对应的文本位置、出现的次数返回给用户,因为有了具体文本的位置,所以就可以将具体内容读取出来了
  • 类似于通过字典中的检索字表查字的过程
倒排索引

倒排索引采用了用空间换时间的思路

在文档保存到ES的时候, ES先会做分词的操作 (把长文本拆分成一个一个的单词), 分词之后

你可能感兴趣的:(大数据,elasticsearch,大数据,搜索引擎)