JAVA-全文索引(笔记)

目标:

  • 了解什么是全文索引技术?
    想明白字典的出现是为什么?
    结构化数据:指固定格式或有限长度的数据;如数据库,元数据等。
    非结构化数据: 指不定长或无固定的数据; 如 互联网数据,邮件,word文档等。
    非结构化数据又叫全文数据。
  • 全文索引技术可以用来做什么?
    搜索引擎:百度,谷歌,搜狗等
    站内搜索: 小说网站,电商网站,论坛等。
    文件系统搜索: Windows 文件系统搜索
    先建立索引,再对索引进行搜索文档的过程就叫 全文索引(full-text Search)
  • 有哪些主流的JAVA全文检索技术?
    Lucene: Java 语言去全文检索技术的底层实现(开山鼻祖)
    Solr: 基于 Lucene, 简化开发,同时提升性能和扩展性。也能通过 solrCloud 实现分布式搜索
    ElasticSearch(ES): 基于 Lucene, 更倾向于实现实时搜索。
  • 这些技术如何选择?
    清楚每个技术的特点及缺点。

你可能感兴趣的:(JAVA-全文索引(笔记))