基于Pycaret自动化机器学习库的异常检测任务入门方案

Pycaret

PyCaret是一个代码量超低的机器学习库,它有效的自动化了机器学习工作流。实现了端到端的机器学习和模型管理工具,可以成倍地加快机器学习的学习、部署和实践速度。本文主要介绍Pycaret的特色、优势和理念,喜欢的朋友请关注本专栏,我的专栏将陆续更新Pycaret基础使用和进阶使用的超详细教程,这篇教程主要关注这个库的一些最简单的使用方式。

异常检测

PyCaret 的异常检测模块是一个无监督机器学习模块,用于识别因与大多数数据显着不同而引起怀疑的稀有项目、事件或观察结果。通常,异常项目会转化为某种问题,例如银行欺诈、结构缺陷、医疗问题或错误。它提供了多种功能,可以通过设置函数为建模准备数据。它有超过 10 种即用型算法,同时可以分析训练模型的性能。

设置

此函数初始化训练环境并创建转换管道。必须在执行任何其他函数之前调用设置函数。它只需要一个强制参数:数据。所有其他参数都是可选的。

from pycaret.datasets import get_data
data = get_data('anomaly')

基于Pycaret自动化机器学习库的异常检测任务入门方案_第1张图片

from pycaret.anomaly import *
s = setup(data)

基于Pycaret自动化机器学习库的异常检测任务入门方案_第2张图片

执行设置时,PyCaret 的推理算法将根据某些属性自动推断所有特征的数据类型。应该正确推断数据类型,但情况并非总是如此。为处理此问题,PyCaret 会在您执行设置后显示提示,要求确认数据类型。如果所有数据类型都正确,您可以按 enter 或键入 quit 退出设置。

确保数据类型正确在 PyCaret 中非常重要,因为它会自动执行多个特定于类型的预处理任务,这对于机器学习模型来说是必不可少的。

或者,您也可以在设置中使用 numeric_features 和 categorical_features 参数来预定义数据类型。

基于Pycaret自动化机器学习库的异常检测任务入门方案_第3张图片

创建模型

此函数训练一个无监督的异常检测模型。可以使用模型函数访问所有可用模型。

iforest = create_model('iforest')
print(iforest)

models()

基于Pycaret自动化机器学习库的异常检测任务入门方案_第4张图片

分析模型

plot_model(iforest, plot = 'tsne')

基于Pycaret自动化机器学习库的异常检测任务入门方案_第5张图片

plot_model(iforest, plot = 'umap')

基于Pycaret自动化机器学习库的异常检测任务入门方案_第6张图片

用模型预测异常标签

此函数为给定模型的数据集分配异常标签。 (1 = 离群值,0 = 离群值)。

result = assign_model(iforest)
result.head()

基于Pycaret自动化机器学习库的异常检测任务入门方案_第7张图片

保存模型

save_model(iforest, 'iforest_pipeline')

基于Pycaret自动化机器学习库的异常检测任务入门方案_第8张图片

要把模型装回环境中:

loaded_model = load_model('iforest_pipeline')
print(loaded_model)

基于Pycaret自动化机器学习库的异常检测任务入门方案_第9张图片

更详细的教程和一对一指导,请见【机器学习从零基础到精通】

你可能感兴趣的:(数据驱动建模,自动化,人工智能,python,低代码)