ElasticSearch 进行全局搜索,搜索.doc 等MS Office文档

ElasticSearch

  • Web前端:

    UI:需要搜索条、展示搜索结果面板,是文件的可以打开文件链接

    逻辑:将搜索内容组装为Elasticsearch 的搜索语句发送到后端,并且将返回处理

  • Web后端:

    web服务器提供web API服务

    同时对接ElasticSearch,作为中间件,处理 前端请求 <——> ElasticSearch之间的互动

    web文件服务器,提供静态文件的访问,或者文件上传时将内容转码建立索引

  • 数据库:

    Elasticsearch 作为数据库,包含文件的索引和基本信息,MySQL存book信息

  • 文件监控与索引

    对特定目录下的文件进行监控和索引

    增删改动作都触发文件的索引(把文件索引更新到Elasticsearch 当中)

  • 备注:Amazon Elasticsearch Service 目前支持 Elasticsearch 版本 7.1、6.8、6.7、6.5、6.4、6.3、6.2、6.0、5.6、5.5、5.3、5.1、2.3 和 1.5。

 

文件检索

  1. Ingest-attachment插件   

  2. fscrawler 插件(导入到Elasticsearch ) 

  3. Apache Tika

你可能感兴趣的:(ElasticSearch)