Index Mapping 简介

在 bleve 中，IndexMapping 描述了数据模型如何被索引。

Default IndexMapping

要获取默认的 indexmapping，只需调用：

indexMapping := bleve.NewIndexMapping()

IndexMappings 包含了你想要支持的各种不同类型文档的文档映射。此外，它还包含一个DefaultDocumentMapping，将用于任何没有显式映射的类型。

Document Type

Bleve 是如何知道文档的类型的？

如果您的对象实现接口 bleve.classifier，那么 bleve 将使用其 type() 方法返回的字符串。
IndexMapping 有一个名为 typefield 的设置。您可以将其设置为任何文档路径，如果该路径上的值是字符串，则该值将用作类型字段。如果未自定义此设置，则默认设置为 “_type” 。
如果无法从1或2两种途径确定类型，则将该类型设置为 IndexMapping 的 DefaultType。如果未自定义此设置，则默认设置为“_default”。

DocumentMappings

现在我们了解了 bleve 如何确定文档类型，我们可以为感兴趣的每种类型提供定制的 DocumentMapping。

假设我们有一个名为 blog 的文档类型。我们可以为这种类型构建一个 DocumentMapping，并配置IndexMapping 来使用它:

blogMapping := bleve.NewDocumentMapping()
indexMapping.AddDocumentMapping("blog", blogMapping)

我们还可以设置一个 catch-all 映射，通过设置 DefaultMapping 字段，它将用于没有显式映射的任何类型。

FieldMappings

文档是分层的，包含命名字段。这些字段可以是值或是嵌套子文档。我们通过为一个命名字段设置一个DocumentMapping 来定制它的行为。一旦我们有了命名字段的 DocumentMapping，我们就可以为它附加0个或多个字段标记。字段标记描述了我们希望如何解释字段，以及我们希望插入到索引中的内容。

假设我们的博客文档有一个名为 name 字段，我们希望对该字段使用英语分析器。

nameFieldMapping := bleve.NewTextFieldMapping()
nameFieldMapping.Analyzer = "en"
blogMapping.AddFieldMappingsAt("name", nameFieldMapping)

现在，假设我们的博客文档有一个嵌套结构，描述 author 字段、name 字段和 email 字段。这次假设我们想要索引(default)，但不存储。又或者我们想要从 _all 字段中排除电子邮件地址。

author := bleve.NewDocumentMapping()
authorNameFieldMapping := bleve.NewTextFieldMapping()
authorNameFieldMapping.Store = false
author.AddFieldMappingsAt("name", authorFieldNameMapping)
authorEmailFieldMapping := bleve.NewTextFieldMapping()
authorEmailFieldMapping.IncludeInAll = false
author.AddFieldMappingsAt("email", authorEmailFieldMapping)
blog.AddSubDocumentMapping("author", author)

这列出了在字段映射中其他一些标志的用法，如下所示：

Index - 索引此字段，默认为 true
Store - 存储该字段，默认为 true
IncludeTermVectors - 包含该字段的项向量，默认为 true
IncludeInAll - 将该字段包含在名为 _all 的复合字段中，默认值为 true

文本字段的特定选项

Analyzer - 在此字段上使用的命名分析器

如果没有指定显式分析器，可以在多个级别配置默认分析器。

每个 DocumentMapping 都有一个字段 DefaultAnalyzer。这意味着您可以覆盖每个子文档的默认分析器。
IndexMapping 也有一个DefaultAnalyzer。

The DefaultAnalyzer configured with the longest path match to a field will be used.

日期字段的特定选项

DateFormat - DateTimeParser 将用于解析存储为字符串的日期。您可以在 IndexMapping 对象中配置DefaultDateTimeParser。

默认类型与默认映射

当 Bleve 无法确定特定文档的类型时，它会自动分配 DefaultType。

当 Bleve 确定了类型，它将查找匹配此类型名称的文档映射。如果没有为此类型显式配置 DocumentMapping，则使用 DefaultMapping。

DefaultType 将默认为 “_default”，而 DefaultMapping 将默认为一个空的默认 DocumentMapping。

考虑 beer-search 是一个简单的示例。该映射描述了“beer”和“brewery”两种类型。对于其中的每一个，都提供了显式的 DocumentMapping。如果您试图索引一个缺少 type 字段的文档，则将为其分配类型 “default”。然后Bleve 查看是否有配置为 “default” 的映射。没有，所以 Bleve 继续使用 DefaultMapping。

专业术语

IndexMapping 索引映射

data model 数据模型

explicit 显示的

customized adj. 定制的；用户化的

hierarchical adj. 分层的；等级体系的

multiple levels 多级别；多层次

Bleve 文档翻译计划（8）—— Index Mapping