SAP Commerce Cloud 里的 Solr 架构简介

大多数电子商务网站都在其网站上提供搜索功能,尤其是用于搜索产品详细信息。

产品是任何电子商务网站中的主要搜索数据。

由于 Hybris 用于开发电子商务网站,因此 Hybris 中的 Solr 用于更快地搜索网站中的产品。

请看下图,了解如何在 Hybris 中使用 Solr:

SAP Commerce Cloud 里的 Solr 架构简介_第1张图片

Hybris 中的 Solr 概述

每当用户访问店面中的任何数据时,它可以来自hybris DB或Solr,具体取决于该数据是否已编入索引。

如果数据被索引,它将单独存储在 Solr 中,并且可以从那里访问。

如果数据未编入索引,则无论如何它都可以在Hybris DB 中使用并且可以从那里访问。

Solr和Hybris DB之间的通信是一种方式,因为Solr只从Hybris DB获取数据,但不会将任何内容写回Hybris DB。

Hybris 调用Cron 作业进行索引,然后 Solr 从 Hybris DB 获取源数据,然后进行索引并将索引数据保存在其中。

请记住:由于Solr 中的索引数据,
从Hybris DB访问数据将比从Solr访问数据花费更多的时间,因此Solr在搜索中比 Hybris DB 更受欢迎。

hybris 中的 Solr 支持 3 种索引策略

1) 全索引

2)更新索引

3) 删除索引

1) 全索引:

在此策略中,将首先删除所有现有索引文档,然后从头开始创建新索引。
这需要相当长的时间,所以不建议经常这样做。

完整索引支持 2 种提交模式

a) 直接模式
在此模式下,如果索引失败,则先前提交的文档将可用。

b) 两阶段模式
在这种模式下,如果索引失败,一切都会回滚到初始状态。

在这种模式下,Solr 创建一个额外的核心作为临时核心,仅用于索引,一旦索引成功,它将与原始核心交换。
因此,如果索引失败,原始核心将是安全的。

之所以称为两阶段模式,主要是因为它在索引时涉及2 个 Solr 内核。

初始核心作为备份保留,另一个核心作为副本创建,
将在此副本上执行索引,如果索引成功,稍后将与原始核心交换。

2)更新索引:
在这个策略中,只有那些在给定时间内被修改的文档才会被索引,其他被索引的文档保持原样。如果需要, 可以经常执行此操作,因为与完整索引策略相比,它消耗的时间更少

3)删除索引:

此策略用于完全删除索引文档。
应该定期执行此操作以保持索引数据的一致性,因为我们可能在 Solr 中长期存在不需要的索引数据。

众所周知,通过impex 执行是最好的方法,因为它可以在所有环境(DEV、TEST、PROD)中持续很长时间并且可重用,
我们只需要相应地在impex文件中定义Solr 配置即可。

产品项目类型的索引已由 Hybris 开箱即用。
因此,如果我们向Product项目类型添加任何新属性,并且我们希望对这些新属性进行索引,那么我们需要在solr impex文件中添加这些新属性。

我们可以在solr impex文件中定义查询以从hybris DB获取数据以进行索引,我们还需要在Solr impex文件中定义字段描述。

Hybris 的优点在于,它已经提供了用于执行完整索引、更新索引和删除索引的cron 作业。

我们在 SAP Hybris Backoffice 里查看每个 site 对应的 index:
SAP Commerce Cloud 里的 Solr 架构简介_第2张图片

每种索引可以分配 catalog,货币和语言:
SAP Commerce Cloud 里的 Solr 架构简介_第3张图片

索引类型:
SAP Commerce Cloud 里的 Solr 架构简介_第4张图片

其中 update cronjob 被调度成每隔 1 分钟执行一次,以确保 index 和 DB 数据始终保持一致。
SAP Commerce Cloud 里的 Solr 架构简介_第5张图片

更多Jerry的原创文章,尽在:"汪子熙":
SAP Commerce Cloud 里的 Solr 架构简介_第6张图片

你可能感兴趣的:(SAP Commerce Cloud 里的 Solr 架构简介)