如何应用Anomalib在数据集不平衡的情况下检测缺陷 ?-- 上篇

如何应用Anomalib在数据集不平衡的情况下检测缺陷 ?-- 上篇_第1张图片

关于作者

Paula Ramos,英特尔AI软件布道师,美国

Zhuo Wu,英特尔AI软件布道师,中国

Samet Akcay,英特尔人工智能研究工程师/科学家

在我的工作中,我一直致力于帮助开发者改进他们的AI应用,并创造新的解决方案来解决实际问题。最近,在 2022 年计算机视觉和模式识别大会CVPR 2022上,我介绍了一些不同的教程和练习资料,展示了AI开发者可如何快速、轻松地开发性能良好的边缘人工智能模型。

在那次演讲中,Anomalib 是给人留下深刻印象的库之一,这个深度学习库用于评测、开发异常检测算法,这些算法可导出至 OpenVINO™ 中间表达(IR)格式,并方便快速地部署到英特尔硬件上。

在这篇博文中,我和英特尔人工智能研究工程师/科学家兼 Anomalib 存储库所有者之一的 Sameet Akcay,以及AI软件布道师武卓一起,将为大家解释 Anomalib 是什么、其特殊之处以及开发者如何快速方便的上手使用它。

下面,让我们谈谈 Anomalib 吧。 . --Paula Ramos

正文

质量控制和质量保证是任何企业保持卓越声誉、提升客户体验的关键环节。例如,在制造业中,通过检测生产线上的异常情况,企业可以确保只有最优质的产品能够出厂。而在医疗行业,通过医学成像及早发现异常有助于医生对患者进行准确诊断。

以上场景中的任何差错都会导致严重后果。正因如此,许多行业开始告别易受主观因素影响而出错的人工检查和维护,转而引入日新月异的计算机视觉和深度学习技术,实施自动化异常检测。

如要真正增强质量控制和质量保证,人工智能必须利用数据量丰富且平衡的数据集。虽然如今有大量良好的数据样本,但有时不足以帮助工业和医疗行业做出准确和有效的预测。此外,大规模制造和工业自动化的发展带来了产能的跃升,质检人员越来越难以处理数量庞大的产品。

克服数据集挑战

基于监督式学习的方法利用足够的注释异常样本,通常可用于实现令人满意的异常检测结果。但如果数据集是缺乏异常类别代表性样本的不平衡数据集,结果会怎样?当缺陷可以是任何类型的形状时,您如何定义异常的边界?

解决这些问题的一个方法是无监督异常检测,它几乎不需要标注。无监督异常检测在训练阶段完全依赖正常样本,可以通过与所学的正常数据分布进行比较来识别异常样本。

开源的端到端异常检测库 Anomalib 便是一种基于无监督异常检测算法的开源库,它提供了可根据特定用例和要求定制的先进异常检测算法。

Anomalib 在制造业中的应用

让我们看一个具有彩色立方体的生产线示例( 1)。

如何应用Anomalib在数据集不平衡的情况下检测缺陷 ?-- 上篇_第2张图片

 图 1.使用教育机器人进行基于 Anomalib 的缺陷检测。

我们要检测出任何有缺陷的彩色立方体,并防止它们进入生产线。为此,需要安装一个摄像头来监测彩色立方体的状况,然后由监控器对机械臂进行操作( 2)。

如何应用Anomalib在数据集不平衡的情况下检测缺陷 ?-- 上篇_第3张图片

2.运行 Anomalib 模型推理的教育机器人。

对于这种场景下的异常检测,我们没有可用于在边缘训练模型的硬件加速器。我们也不能假设已经为边缘训练收集了数千幅图像、尤其是有缺陷的图像。此外,预计不会像真实的制造场景一样,存在大量缺陷已知的情况。

鉴于这些初始条件,我们的一个目标是在边缘实现更快的训练速度,并进行高精确和高效的异常检测。有一点需要记住,即如果有任何外部条件变化 - 如照明、摄像头或异常情况,我们将不得不重新训练模型。因此,进行不太费事的重新训练是有必要的。最后,为了确保模型在真实的制造用例中发挥作用,我们必须保证使用异常检测模型获得精确的推理结果。

借助内容广泛的 Anomalib 库,我们可以设计、实施和部署无监督异常检测模型,覆盖从数据收集到边缘应用在内的流程,从而满足我们的所有要求。

Anomalib 的工作原理

Anomalib 库提供了能够计算图像上异常情况的算法,以及通过训练、评估、测试、基准测试和超参数优化来运行这些算法的工具。模块已经提供了可用于自定义算法的算法设计和工具。

3 中,我们展示了Anomalib 是由工具、组件以及模块这几部分组成的,其中,我们把部署作为工具和模块的一部分,想表明这部分也包含在该库的范围内。

如何应用Anomalib在数据集不平衡的情况下检测缺陷 ?-- 上篇_第4张图片 

3.Anomalib 的工具、组件和模块。

4 详细展示了从训练到部署的工作流程概览图。我们已使用 PyTorch Lighting 进行训练和测试,并使用 ONNX 和 OpenVINO™ 进行优化;TensorFlow、PyTorch 和 OpenVINO 可用于部署。

如何应用Anomalib在数据集不平衡的情况下检测缺陷 ?-- 上篇_第5张图片

2。从训练到部署的工作流程概览图。

希望了解更多信息?

在后续博文中,我们将通过一个示例说明如何将 Anomalib 库用于自定义数据集和用例。如需亲自试用 Anomalib,请下载、安装和查看这个入门示例。

如需开始将 Anomalib 用于您自己的人工智能应用,您可以克隆 OpenVINO Notebooks 存储库,并使用 Open Model Zoo 中超过 270 个深度学习模型。

关于我们:

Paula Ramos 自 21 世纪初以来一直在哥伦比亚开发新型集成工程技术,主要涉及计算机视觉、机器人和机器学习在农业领域的应用。在攻读博士和研究生学位期间,她部署了多个低成本的智能边缘和物联网计算技术,这些技术可供农民等不具备计算机视觉系统专业知识的人员操作。她的发明可在严苛和紧急的条件下运行,如没有照明控制的农业和户外环境,也可从容应对高太阳辐射条件、甚至极端高温条件。目前,她是英特尔的AI软件布道师,负责开发能够理解和重新创造周围视觉世界以满足现实需求的智能系统/机器。

Samet Akcay 是人工智能研究工程师/科学家。他的主要研究兴趣包括实时图像分类、检测、异常检测,以及基于深度/机器学习算法的无监督特征学习。他最近与人联合开发了开源的 Anomalib,这是该领域最大的异常检测库之一。Samet 拥有英国杜伦大学计算机科学系的博士学位,并获得了美国宾夕法尼亚州立大学电气工程系 Robust Machine Intelligence Lab 的硕士学位。他在顶级的计算机视觉和机器/深度学习会议和期刊上发表了 30 多篇学术论文。

Zhuo Wu 是英特尔的AI软件布道师,专注于 OpenVINO™ 工具套件的研究。她的工作职责涵盖了从深度学习技术到 5G 无线通信技术的领域。她在计算机视觉、机器学习、边缘计算、物联网系统和无线通信物理层算法等方面做出了卓越贡献。她为汽车、银行、保险等不同行业的企业客户提供基于机器学习和深度学习的端到端解决方案; 4G-LTE 和 5G 无线通信系统方面进行了广泛研究,并曾任职于中国贝尔实验室,期间申请了多项专利。她在上海大学担任副教授时,曾作为主要研究人员主导过多个研究项目。

追踪数据(请勿编辑)

SEO 关键词

不平衡数据集、自动缺陷检测、非监督式学习、Anomalib

 

你可能感兴趣的:(OpenVINO,开发者分享,人工智能,openvino)