Elasticsearch 7.3.0 翻译 - 《Set up Elasticsearch》 配置Elasticsearch--机器学习设置

机器学习设置

使用机器学习不需要配置任何设置。默认情况下启用。

重要:机器学习使用SE4.2指令,因此只在支持SE4.2的机器上工作。如果你在旧硬件上运行Elasticsearch ,你必须切断机器学习(设置Xpack.ml.enabled to false)。

所有这些设置都可以添加到elasticsearch.yml配置文件中。还可以使用集群更新设置API跨集群更新动态设置。

提示:动态设置优先于elasticsearch.yml文件中的设置。

一般机器学习设置

node.ml

设置为“true ”(默认)以将节点标识为机器学习节点。

如果在elasticsearch.yml中设置为false,则节点无法运行作业。如果设置为true,但xpack.ml.enabled设置为false,则忽略node.ml设置,节点无法运行作业。如果要运行作业,群集中必须至少有一个机器学习节点。

重要:在专用协调节点或专用主节点上,禁用node.ml角色。

xpack.ml.enanled

设置为真(true )以在节点上启用机器学习。

如果在elasticsearch.yml中设置为false,则在节点上禁用机器学习API。因此,节点无法打开作业、启动数据馈送或接收与机器学习API相关的传输(内部)通信请求。它还影响连接到此ElasticSearch实例的所有Kibana实例;您不需要在这些kibana.yml文件中禁用机器学习。有关在特定Kibana实例中禁用机器学习的详细信息,请参阅Kibana机器学习设置。

重要:如果要在集群中使用机器学习功能,则必须在所有符合主资格的节点上将xpack.ml.enabled设置为true。这是默认行为。

xpack.ml.max_machine_memory_percent (Dynamic)

机器学习可用于运行分析进程的机器内存的最大百分比。(这些过程独立于ElasticSearch JVM。)默认为30%。限制基于机器的总内存,而不是当前可用内存。如果这样做会导致机器学习作业的估计内存使用超过限制,则不会将作业分配给节点。

xpack.ml.max_model_memory_limit (Dynamic)

可为此节点上的任何作业设置的最大模型内存限制属性值。如果试图创建一个模型内存限制属性值大于此设置值的作业,则会发生错误。更新此设置时,现有作业不受影响。有关“模型内存限制”属性的详细信息,请参阅分析限制。

xpack.ml.max_open_jobs (Dynamic)

可以在节点上同时运行的最大作业数。默认为20。在这种情况下,作业包括异常检测器作业和数据帧分析作业。最大作业数也受内存使用量的限制。因此,如果作业的估计内存使用率高于允许值,那么在节点上运行的作业将更少。在版本7.1之前,此设置是每个节点的非动态设置。它在7.1版中成为了集群范围的动态设置。因此,只有当集群中的每个节点运行7.1或更高版本时,才会使用节点启动后对其值所做的更改。最大允许值为512。

xpack.ml.node_concurrent_job_allocations (Dynamic)

在每个节点上可以同时处于打开状态的最大作业数。通常,工作在进入开放状态之前会在这种状态下花费少量时间。必须在开放时恢复大型模型的作业在开放状态下花费更多时间。默认为2。

 

高级机器学习设置

这些设置适用于高级用例;默认值通常足够:

xpack.ml.enable_config_migration (Dynamic)

保留

xpack.ml.max_anomaly_records (Dynamic)

每个存储桶输出的最大记录数。默认值为500。

xpack.ml.max_lazy_ml_nodes (Dynamic)

缓慢旋转的机器学习节点的数量。在打开第一个机器学习作业之前不需要ML节点的情况下很有用。它默认为0,最大可接受值为3。如果当前的ML节点数大于等于此设置,则假定没有更多的延迟节点可用,因为已经提供了所需的节点数。当一个作业打开时,此设置设置设置为>0,并且没有节点可以接受该作业,那么该作业将保持打开状态,直到将新的ML节点添加到集群中,并且该作业被分配到该节点上运行。

重要:此设置假定某些外部进程能够向集群添加ML节点。此设置仅在与此类外部进程一起使用时才有用。

xpack.ml.process_connect_timeout (Dynamic)

与ElasticSearch JVM分开运行的机器学习进程的连接超时。默认为10秒。一些机器学习处理是由独立于ElasticSearch JVM运行的进程完成的。当这些进程启动时,它们必须连接到ElasticSearch JVM。如果这样的进程未在该设置指定的时间段内连接,则假定该进程已失败。默认为10s。此设置的最小值为5s。

 

你可能感兴趣的:(Elasticsearch翻译)