Apache Lucene基础教程

课程大纲

Apache Lucene是一个免费/开源信息检索软件库,它提供基于Java的索引和搜索技术,以及拼写检查,命中突出显示和高级分析/标记化功能。

Lucene是完全用Java编写的高性能,功能齐全的文本搜索引擎库。 它是一项适用于几乎所有需要全文搜索的应用程序的技术,尤其是跨平台的应用程序。

在本课程中,您将了解Lucene。 您将了解为什么这样的库很重要,然后了解Lucene中搜索的工作方式。

此外,您将学习如何将Lucene Search集成到您自己的应用程序中,以提供强大的搜索功能。

关于作者

Piyas是Sun Microsystems认证的企业架构师,在架构定义,企业应用程序,客户端服务器/电子商务解决方案等各个领域拥有超过10年的专业IT经验。 他拥有丰富的经验,可以处理从PostGreSQL,SQL Server7.0 / 2000,Oracle 8i,10g到Sybase,MySQL和NoSQL数据库(如MongoDB)的各种数据库。

他在博客(www.phloxblog.in)中学习并撰写了有关Angular.js,Node.js,MongoDB,Google DART,Apache Lucene,带有GATE的文本分析和相关大数据技术等开源技术的各个方面的信息。

经验教训

在第一课中,您将被介绍到这个令人惊叹的库。 您将学习全文搜索以及运行它们的引擎。 还介绍了Lucene工作流程,以及用于索引和搜索的基本组件。 此外,您将从头开始构建功能齐全的示例应用程序。 将讨论使用Eclipse和Maven的基于Lucene的应用程序。 该应用程序将为文件夹编制索引并为其提供搜索功能。

在本课程中,您将学习Lucene查询(搜索)语法。 您将学习如何利用Query类及其子类(TermQuery,PhraseQuery,BooleanQuery等)来构建功能强大的查询并将人工编写的搜索短语转换为代表性结构。

在本课程中,您将深入研究更高级的查询(搜索)语法示例。 您将学习Lucene Query API的细节,以及组成它的各种类。 给出了多个示例,展示了每个子类的用法。

在本课程中,您将深入研究更高级的查询(搜索)语法示例。 您将学习Lucene Query API的细节,以及组成它的各种类。 给出了多个示例,展示了每个子类的用法。

现在,我们将使用Lucene构建搜索索引。 该索引是利用Lucene的任何组件的核心。 就像书籍的索引一样,它组织所有数据,以便可以快速访问。 您将学习索引操作的工作原理,如何创建索引并对其执行基本操作以及如何使用文档和字段。

在本课程中,我们将讨论如何将Lucene Search集成到应用程序中。 我们将看到如何解析查询字符串,创建索引以及利用不同类型的查询,具体取决于我们要执行的搜索类型。

在最后一课中,我们将讨论如何进行分析。 在Lucene中,分析是将字段文本转换为其最基本的索引表示形式(术语)的过程。 通常,将令牌称为分析器的单词(我们仅在参考英语时讨论该主题)。 但是,对于特殊的分析器,令牌可以带有多个单词,其中也包括空格。 这些术语用于确定在搜索过程中哪些文档与查询匹配。 我们将看到如何从多个列表中选择合适的分析器(例如,空白分析器,标准分析器,雪球分析器等)以及相关过程的实际工作方式。

请确保转发此消息,让您的社交粉丝知道!

翻译自: https://www.javacodegeeks.com/2015/09/apache-lucene-fundamentals.html

你可能感兴趣的:(Apache Lucene基础教程)