AI小白一枚

工业产品表面缺陷检测方法——综述

原文链接：https://www.mdpi.com/2076-3417/11/16/7657

摘要

1. 简介

2. 用于表面缺陷检测的传统基于特征的机器视觉算法

2.1. 基于纹理特征的方法

2.2.基于颜色特征的方法

2.2.1.颜色直方图

2.2.2.色彩时刻

2.2.3.颜色相干矢量

2.2.4.其他颜色特征

2.3.基于形状特征的方法

3. 基于深度学习的工业产品表面缺陷检测方法

3.1.监督方法

3.1.1. Siamese Network

3.1.2. ShuffleNet

3.1.3. Faster RCNN

3.1.4.全卷积网络

3.1.5. Mask RCNN

3.2. 无监督方法

3.2.1. Autoencoder

3.2.2. 生成对抗网络

3.2.3. 深度信念网络

3.2.4. Self‐Organizing Map

3.3. 弱监督方法

3.3.1. 不完全监督方式

3.3.2. Inexact Supervision Method

3.4 总结

4. 关键问题

4.1. 实时问题

4.2. 小样本问题

4.2.1. 数据增强

4.2.2. 无监督/半监督模型

4.2.3. 迁移学习

4.2.4. 优化网络结构

4.3.小目标检测问题

4.4. 数据不均衡样本识别问题

4.4.1. 数据层面

4.4.2. 模型层面

4.4.3. 特征层面

4.4.4. 评估指标级别

5. 工业产品缺陷检测数据集

6 总结

摘要

制造业的全面智能化发展对工业产品的质量检测提出了新的要求。本文总结了机器学习方法在表面缺陷检测中的研究现状，表面缺陷检测是工业产品质量检测的关键部分。首先，根据表面特征的用途，从纹理特征、颜色特征、形状特征三个方面总结了传统机器视觉表面缺陷检测方法在工业产品表面缺陷检测中的应用。其次，从监督法、无监督法、弱监督法三个方面论述了近年来基于深度学习技术的工业产品表面缺陷检测的研究现状。然后，系统总结了工业表面缺陷检测中常见的关键问题及其解决方法；关键问题包括实时问题、小样本问题、小目标问题、不平衡样本问题。最后对近年来常用的工业表面缺陷数据集进行比较全面的总结，并比较了MVTec AD数据集的最新研究方法，为工业表面缺陷检测技术的进一步研究和发展提供一定的参考。

1. 简介

在工业生产过程中，由于现有技术、工作条件等因素的不足和局限性，极易影响制成品的质量。其中，表面缺陷是产品质量受到影响的最直观表现。因此，为了保证合格率和可靠的质量，必须进行产品表面缺陷检测。 “缺陷”一般可以理解为与正常样品相比的缺失、缺陷或面积。工业产品正常样品与缺陷样品对比如图1所示。表面缺陷检测是指检测样品表面的划痕、缺陷、异物遮挡、颜色污染、孔洞等缺陷，从而获得被测样品表面缺陷的类别、轮廓、位置、大小等一系列相关信息。人工缺陷检测曾经是主流方法，但这种方法效率低下；检测结果容易受人为主观因素的影响，不能满足实时检测的要求。它已逐渐被其他方法所取代。

目前，已有学者开展了表面缺陷检测的相关研究，涉及最新的方法、应用、关键问题等诸多方面，文献[5]总结了磁粉探伤、渗透探伤、涡流检测、超声波检测、机器视觉和深度学习 [6,7]；比较分析上述方法的优缺点；梳理了电子元器件、管道、焊接件、机械零件中的缺陷检测技术，以及在质量控制中的典型应用。从监督学习模型法、无监督学习模型法[8]和其他方法[9]（半监督学习模型法和弱监督学习模型法），文献[10]分析了基于深度学习的表面缺陷检测方法，以及然后，讨论了表面缺陷检测中实时性、小样本以及与传统的基于图像处理的缺陷检测方法的比较三个关键问题。在回顾了自动光学（视觉）检测（AOI）技术后，文献[11]系统地描述了该技术用于表面缺陷检测的几个步骤和相关方法。文献[12]首先列举了缺陷领域的不同对象；介绍和比较了用于缺陷检测的主流技术和深度学习方法。然后分析了超声波检测和深度学习方法在缺陷检测中的应用。最后，对现有应用进行了调查，并基于缺陷检测设备，提出了三维目标检测、高精度、高定位、快速检测、小目标等缺陷检测面临的几个挑战。通过调查可以发现：在工业产品表面缺陷检测领域，目前关于机器学习方法的文献综述很少，一些文献虽然总结了工业产品表面缺陷检测中存在的问题和挑战，但其解决方案和方向还不够系统。此外，在数据集方面，目前还没有对工业产品表面缺陷检测数据集进行全面整理。因此，为了解决上述问题，本文首先从传统的机器视觉方法和深度学习方法总结了工业产品表面缺陷检测的研究现状，然后，工业产品表面缺陷检测过程中的关键问题，真实讨论了时间问题、小样本问题、小目标问题、不平衡样本问题，并给出了每个问题的一些解决方案。最后，总结了全面的工业表面缺陷检测数据集，并比较了几种使用 MVTec AD 数据集的新方法。

本综述参考文献的发表时间主要集中在2016年以后，因为这些文献可以代表最新技术的发展。通过参考相关评论，确定本文的组织顺序为传统方法、最新方法、关键问题和工具（数据集），这也是本文的研究范围。本文的主要内容如下：第二部分，基于传统基于特征的机器视觉算法的工业产品表面缺陷检测方法总结；第三节，基于深度学习的工业产品表面缺陷检测方法总结；第四节，关键问题及其解决方案分析讨论；第五节，工业产品表面缺陷检测数据集的整理和总结以及MVTec AD数据集最新方法的比较。

2. 用于表面缺陷检测的传统基于特征的机器视觉算法

传统的表面缺陷检测方法在一段时间内发挥了巨大的作用。本章从特征提取层面对传统的基于机器视觉的工业产品表面缺陷检测方法进行分类。根据特征的不同，主要分为三类：基于纹理特征的方法、基于颜色特征的方法、基于形状特征的方法。具体的进一步章节安排如图2所示。

2.1. 基于纹理特征的方法

纹理特征反映了图像中的同质化现象，可以通过像素及其附近空间邻域的灰度分布来反映图像表面的组织结构和排列特性。基于纹理特征的方法可以进一步分为四类：统计方法、信号处理方法、结构方法、模型方法[14,15]。

对于统计方法，主要思想是将物体表面的灰度值分布视为随机分布，从角度分析随机变量的分布通过直方图特征、灰度共生矩阵、局部二值模式、自相关函数、数学形态等特征描述灰度值的空间分布。

        对于信号处理方法，主要思想是将图像作为二维信号处理，从信号滤波器设计的角度对图像进行分析，因此也称为频谱法；信号处理方法包括傅里叶变换法、Gabor滤波器法、小波变换法等具体方法。
        对于结构方法，其理论基础是纹理原语理论。纹理原语理论指出，纹理是由一些按照一定规则在空间中重复出现的最小图案（称为纹理原语）组成的。
        对于模型方法，工业产品表面缺陷检测常用的模型有MRF模型和分形模型。
        对于基于纹理特征的方法，本文总结了近期在工业产品表面缺陷检测中的一些应用实例，按图2中的分类顺序排列，具体如表1所示。

2.2.基于颜色特征的方法

颜色特征计算量小，对图像本身的大小、方向、视角等因素的依赖性小，鲁棒性高。它是图像检索中广泛使用的视觉特征之一。

2.2.1.颜色直方图

颜色直方图描述了整个图像中不同颜色的比例，是全局统计的结果；它不注意空间位置颜色，不能描述图像中的物体。

特点：对物理变换（旋转、缩放等）不敏感；如果图像有多个区域，且前景和背景之间的颜色分布有明显差异，则颜色直方图会出现双峰。

文献[27]提出了一种基于颜色直方图的相似度评价方法，用于电阻断层扫描（ERT）图像评价。对于木材表面的缺陷检测，文献[28]提出了一种基于图像块百分比颜色直方图特征和特征向量纹理特征的分类方法；该方法已被实验证明是有效的，特别是对于结型缺陷。文献[29]设计了刨花板缺陷检测的2步工艺流程，利用SVM和颜色直方图特征完成缺陷检测，利用平滑和阈值技术完成缺陷定位。

2.2.2.色彩时刻

颜色矩的主要思想是图像中的任何颜色分布都可以用其每个阶的矩来表示。由于颜色分布的信息主要集中在低阶矩，通常只有颜色的一阶矩（均值）、二阶矩（方差）和三阶矩（偏移）就足以表示图像表面的颜色分布。

特点：不考虑像素空间位置；无需矢量化颜色特征；无需进行颜色量化、平滑等后续处理。

文献[30]提出了一种根据影响大小对色矩特征和FSIFT特征进行加权融合的方法，解决了单个特征不能明显表达瓷砖表面缺陷内容的问题。文献[31]利用余弦相似度检验磁光图像的周期规律，证明了色矩特征概括规律的正确性，从而选择合适的磁光图像进行焊接缺陷检测和定位。

2.2.3.颜色相干矢量

颜色相干向量是颜色直方图的改进算法；其主要思想是将直方图中的每个颜色簇分为聚合和非聚合两部分；在图像相似度比较过程中，分别比较相似度，综合权衡后得到相似值，从而得到结果。
文献[32]将LBP特征与颜色聚合向量特征加权融合相结合，并结合基于RBF的SVM，提出了一种图像分类方法
可以提高分类精度和计算速度的方法。文献[33]将提取的颜色聚合向量和纹理特征以特征的形式存储
用于后续网络训练的向量。

2.2.4.其他颜色特征

除了颜色直方图、颜色矩和颜色聚合向量外，工业产品表面缺陷检测常用的颜色特征包括颜色集和颜色相关图。其中，颜色集也是一种全局颜色特征和匹配方法；它是颜色直方图的近似，表示为二值特征向量；通过构造二叉搜索树，可以加快检索速度。颜色相关图描述了整个图像中某种颜色的像素数所占的比例（概率），可以反映不同颜色对之间的空间相关性；通常，它需要较高的硬件条件。

2.3.基于形状特征的方法

        基于形状的方法有效地利用图像中感兴趣的目标进行检索。其中，基于轮廓的方法是主要的方法类型。基于轮廓的方法通过描述对象的外边界特征来获得图像的形状参数；代表性的方法是霍夫变换和傅立叶形状描述符。
        霍夫变换利用图像的全局特征连接边缘像素形成区域的封闭边界，其理论基础是点对线的对偶性。文献[34]提出了一种检测瓶子表面缺陷的方法；在ROI提取阶段，采用快速霍夫变换检测光源的边界线。文献[35]利用Gabor滤波器和Hough变换实现了E-TPU中间表面线状缺陷（如压痕、凹凸）的检测。文献[36]基于圆霍夫变换、极坐标变换、加权Sobel滤波器和SVM实现了小型相机镜头的表面缺陷检测。
        傅里叶形状描述符使用物体边界的傅里叶变换作为形状描述，利用区域边界的闭合性和周期性，将二维问题转化为一维问题。文献[37]提出了一种基于全局傅里叶图像重建和模板匹配的非周期图像小缺陷检测和定位方法。文献[38]提出了一种磁体表面切割缺陷的检测方法；该方法采用傅里叶变换和霍夫变换对磁体表面图像进行重构，通过比较重构图像与原始图像的灰度差异，得到缺陷信息。
        除上述三类特征外，其他一些特征，如空间关系特征，也可用于工业产品的表面缺陷检测。由于工业产品的表面大多包含多种信息，通常仅使用单一特征或单一类别特征是不够的。因此，在实际应用中，往往会结合使用多个特征和多类特征。

3. 基于深度学习的工业产品表面缺陷检测方法

深度学习的快速发展使其在缺陷检测领域得到越来越广泛的应用。本章基于深度学习的常见分类：监督方法、无监督方法、弱监督方法，简要介绍了工业产品表面缺陷检测的研究现状。具体的缺陷检测方法如图3所示。

3.1.监督方法

监督方法要求训练集和测试集缺一不可，训练集中的样本必须被标记[39]，其中训练集用于寻找样本的内在规律，然后将规律应用到测试集。监督方法可以分为基于度量学习的监督方法和基于表示学习的监督方法。在上述有监督的表面缺陷检测方法中，基于度量学习的常见模型包括Siamese Network；根据缺陷检测的三个阶段，基于表征学习的方法大致可以分为三类：分类网络、检测网络和分割网络。其中，常用的分类网络是ShuffleNet；通常用作检测网络的是 Faster RCNN；常用的分割网络有：FCN、Mask RCNN等，本节以上述网络模型为例，简要介绍其在表面缺陷检测任务中的研究现状。在缺陷检测的任务中，分类网络的重点是解决“缺陷是什么”问题，即确定图像的类型（图像是否包含缺陷，缺陷的类型是什么）；检测网络的重点是解决“缺陷在哪里”的问题，即获取具体的位置信息和通过确定缺陷的位置来确定缺陷的类别信息；分割网络的焦点是为了解决“有多少缺陷”的问题，即分割从背景中修正缺陷区域，获取位置、类别、属性和缺陷的其他信息。

3.1.1. Siamese Network

Siamese网络可以用来判断两个样本之间的相似度；其损失函数的核心思想是使相似类别的输入距离尽可能小，不同类别的输入距离尽可能大[40]。

文献[41]提出了一种两阶段多尺度特征相似度测量模型。在使用 Siamese 网络作为主干架构完成成对图像的特征提取后，将空间金字塔池化网络纳入每个卷积模块的特征图中以融合多尺度特征向量，然后进行判别特征嵌入和通过在训练过程中使用对比损失获得相似度度量。测试在PCB数据集上进行了短路、开路、鼠咬、毛刺、漏电、覆铜6类缺陷，所有类型的ROC曲线下面积均在0.92以上。文献 [42] 提出了一种用于跨类别缺陷检测的两层神经网络（SSIM 层：生成模拟 SSIM 组件的功能；SNN 层：由连接到 SSIM 层的连体网络组成），无需重新训练。该方法从包含一些结构相似性的图像对中学习差异特征，并假设不同的分类对象可以共享由这些学习图像对的差异引起的一些结构相似性。在实际工厂数据集中的实验表明：该方法具有跨类缺陷检测的能力。

3.1.2. ShuffleNet

ShuffleNet 是一种计算效率高的轻量级网络，它采用了逐点组卷积和通道 shuffle 两种新方法来保证计算精度并有效降低计算成本。
基于Shuffle Net V2框架，文献[43]提出了一种新颖的塑料容器复杂背景代码在线检测解决方案，该算法还可以处理复杂背景下的图像，并应用于实际的工业检测系统。文献[44]提出了一种基于深度学习的Shuffle DefectNet缺陷检测系统，在NEU数据集上达到了99.75%的平均准确率

3.1.3. Faster RCNN

Faster RCNN是在Fast RCNN的基础上引入了区域提议网络（RPN），将生成区域推荐的步骤放入神经网络中，在端到端的学习模式下实现了几乎无成本的区域推荐算法，极大地提高了提高了目标检测的速度，还提到了滑动窗口方法。
文献[45]提出了一种基于Faster R-CNN的级联结构，将电力线绝缘子的缺陷检测问题转化为两级目标检测问题。其中，第一阶段用于定位绝缘子区域；第二阶段用于定位绝缘体区域。基于Faster R-CNN，文献[46]提出了一种新的PCB表面缺陷检测网络，该网络使用具有特征金字塔的ResNet50作为主干，同时使用GRAPN的残差单元和ShuffleNetV2的残差单元。

3.1.4.全卷积网络

在 FCN 中，一种端到端的图像分割方法，网络中的所有层都是卷积层；网络主要使用三种技术：卷积、上采样和跳过层；可以通过让网络做像素级预测直接得到标签图。核心思想之一是反卷积层，增加了数据规模，从而可以输出准确的结果。
文献[47]提出了一种利用深度神经网络结合Autoencoder和FCN来区分键盘漏光缺陷和灰尘的算法。在由1632张图像组成的测试集中对所提出的方法进行测试，漏光缺陷的误报率从6.27%降低到2.37%。文献[48]设计了一套完整的绝缘子串自动识别和诊断系统，该系统结合了不同的基于深度学习的组件，分别包括一个绝缘子串分割组件和两个绝缘子片缺失和损坏诊断组件。文献[49]提出了一种太阳能电池电致发光（EL）图像的缺陷分割方法；该方法使用FCN和U-net的特定架构，可以一步得到缺陷分割图；与重复执行CNN滑动窗口的方法相比，该方法获得了相似的结果。文献[50]结合FCN和Faster RCNN，设计了基于FCN的隧道缺陷检测深度学习模型；该模型可以准确快速地检测管道的污渍、泄漏和堵塞等缺陷。

3.1.5. Mask RCNN

Mask RCNN 是 Faster-R-CNN 的一种扩展形式，它为两阶段框架网络集成了目标检测和实例分割功能：第一阶段扫描图像并生成建议（建议可能包含目标区域），第二阶段分类建议并生成边界框和掩码。

文献[51]提出了Mask RCNN的改进模型——IPCNN。该模型首先使用深度残差神经网络对来自图像金字塔的图像进行处理以提取特征；提取的特征通过特征金字塔生成金字塔特征，然后由RPN处理生成缺陷边界框并对其进行分类，然后使用FCN在缺陷边界框中生成缺陷掩码。文献[52]设计了一个端到端的系统，可以定位太阳能电池板污染；该系统基于Mask FCNN（Fully Convolutional Mask RCNN），它由一个分类网络ImageNet和一个自底向上对特征图像进行上采样的综合网络组成；通过上采样消除了信息丢失的影响。

在工业产品表面缺陷检测领域，由于精度高、适应性好，监督法是目前深度学习方法中最主流的方法，其应用范围也越来越广。但是，这种方法的缺点在实际应用中逐渐凸显，即数据集的提前标注带来的工作量巨大，尤其是在一些高精度场景下；同时，产业水平的不断提升导致不良样品不断减少，这也对监管方式产生了一定的影响。

3.2. 无监督方法

针对有监督方法的缺点，一些研究人员开始研究无监督方法。当输入的训练数据只有数据信息本身，没有标签信息时，机器学习这些无标签数据的模式，得到数据的一些内在特征和联系并自动对数据进行分类 [53]。然后，当遇到新数据时，可以根据之前学习到的模型判断新数据属于哪个模型（这里的模型是指由原始数据组成的模型）。这个过程属于无监督学习。

在无监督学习方法中，最常用的表面缺陷检测方法主要包括基于重建的方法和基于嵌入相似性的方法。对于前者，神经网络结构的训练仅用于正常训练图像的重建，异常图像由于不能很好地重建而容易被发现；异常分数通常用重建误差表示。最常见的基于重建的方法是自动编码器（AE）和生成对抗网络（GAN）。对于后者，深度神经网络用于提取描述整幅图像的有意义的向量，异常分数通常由测试图像的嵌入向量与训练数据集中表示正态性的参考向量之间的距离表示。典型的算法主要有SPADE[54]、PaDIM[55]、PatchCore[56]等。除了这两种类型之外，Deep Belief Network（DBN）和Self-Organizing Map（SOM）也可以用于表面缺陷检测.

本节将首先以自编码器（AE）、生成对抗网络（GAN）、深度信念网络（DBN）和自组织映射（SOM）四种网络模型为例，简要介绍它们在表面缺陷检测任务中的研究现状 . 第 5 节将介绍基于嵌入相似性方法的三种典型算法。

3.2.1. Autoencoder

编码器和解码器是自编码器的两个核心部分。其中，encoder对应网络模型中的隐藏层，用于学习输入信号的低维特征；解码器对应模型中的输出层，用于尽可能地再现输入信号。因此，使编码器能够学习输入信号良好的低维特征并重构输入信号是自编码器的最终目标。

文献[57]将传统图像处理中的SSIM指标作为重建损失引入到基于AE的图像重建中；对编织纹理数据集和纳米纤维材料数据集进行了测试，与 L2 损失相比，两者都获得了显着差异。为了解决AE对异常样本重构能力强的缺点。文献[58]将异常检测转化为补丁序列修复[59]问题；同时，为了弥补该类方法难以覆盖较大异常区域的缺点，提出transformer network仅重构覆盖的patch，并针对不同情况设计了局部和全局嵌入方法。文献 [60] 设计了一种具有多尺度特征聚类的全卷积 AE（MS-FCAE），使用多个不同尺度的 FCAE 子网络重建纹理图像背景，然后从输入图像中减去纹理背景以获得残差图像，最后合并它们得到缺陷图像，其中每个 FCAE 子网络使用全卷积神经网络从输入图像中直接获取原始特征图像并进行特征聚类。文献[61]提出了一种多尺度卷积去噪自编码器（MSCDAE），它使用多模态策略来综合多个金字塔层次的结果，并在LCD面板、瓷砖和纺织品上进行测试；实验证明该方法具有较高的准确率和鲁棒性。文献[62]采用卷积自编码器（CAE）检测手机logo图像，提取CAE生成的模板图像与输入图像的差异，然后通过数学形态学处理，达到异常检测的目的。文献[63]提出了一种用于无监督特征学习的卷积自动编码器（CAE）。每个 CAE 都使用传统的在线梯度下降训练，没有额外的正则化项。在 MNIST 和 CIFAR10 上获得了良好的结果。

3.2.2. 生成对抗网络

生成对抗网络由两个参与者组成：生成器和鉴别器。生成器用于获取样本数据的分布，鉴别器用于估计样本训练数据的概率。该模型的最终目标是学习真实数据的内在规律，预测和估计真实数据的分布或密度，并根据学到的知识生成新的数据，即生成对抗网络制造数据。

GAN判别器用于生成缺陷分布似然图；然后，将编码器引入标准DCGAN重构检测到的图像，从原始图像中减去，得到突出潜在缺陷区域的残差图像；之后结合残差图和缺陷分布似然图得到增强融合图，最终在融合图上通过阈值分割得到缺陷的准确位置。文献[65]提出了一种基于GAN的带钢表面缺陷检测的一类分类方法，其中生成器G采用编解码器，输入编码得到的隐藏空间的特征（GAN生成器的倒数第二层输出）引入支持向量机进行缺陷分类，该模型在邯钢提供的图像上取得了良好的测试效果。文献[66]提出了一种基于GAN的检测方法。在第一阶段，使用生成网络和基于统计的表示学习机制检测新区域。在第二阶段，在潜在空间中直接使用 Frechet 距离来区分缺陷和正常样本。该方法在太阳能电池板数据集上达到了 93.75% 的准确率。文献[67]设计了一个基于GAN的表面视觉检测框架，它使用多尺度融合策略融合GAN判别器三个卷积层的响应，然后使用OTSU对融合特征响应图进行分割以进一步分割缺陷位置。在木材和道路裂缝数据集上的实验证明了该框架的有效性。为了检测织物表面的各种缺陷，文献[68]提出了一种基于GAN框架的模型。该模型首先使用多种纹理融合到特定位置，然后通过多级GAN不断更新现有的织物缺陷数据集；因此，网络模型不断微调，以达到更好的检测效果。

3.2.3. 深度信念网络

深度信念网络由多个RBM（受限玻尔兹曼机）组成，整个网络的训练是通过逐层单独训练RBM来完成的。

文献[69]提出了一种基于DBN的太阳能电池缺陷检测算法。该算法以重建图像和训练图像作为监督数据，通过BP算法的微调网络建立训练样本和非缺陷图像之间良好的映射关系。文献[70]提出了一种DS-DBN-SVM（差分搜索-深度信念网络-支持向量机）模型来识别螺栓缺陷的类型。在该模型中，采用DS算法优化DBN网络的权值和阈值； DS-DBN模型用于提取螺栓数据的特征，提取的特征作为SVM的输入来识别螺栓缺陷类型。

3.2.4. Self‐Organizing Map

        自组织图模拟人脑不同区域神经网络细胞的不同分工，通过搜索最优参考向量集对输入模式集进行分类。
        文献 [71] 提出了一种使用 SOM 来区分正常木材和缺陷木材的检测方法。第一阶段检测疑似缺陷区域，第二阶段单独检查缺陷区域。在松木数据集上的测试得到了比较理想的结果。文献[72]结合Otsu和SOM实现TSV缺陷的检测和定位。
        无监督方法有效地弥补了监督方法的不足，但由于其自身的特点仍然存在一些问题。由于只训练了正例，无监督方法无法确定什么是正确的输出，因此不能保证对每种类型的缺陷样本（在训练中没有出现）都有良好的检测效果。因此，无监督方法的准确率还有很大的提升空间，总的来说，无监督方法对纹理图像有更好的检测效果。

3.3. 弱监督方法

有的学者结合了有监督方法和无监督方法的特点；因此，产生了弱监督方法。与监督和非监督方法相比，弱监督方法可以在避免更高的标记成本的同时获得更好的性能。目前，工业表面缺陷检测中常用的弱监督方法有不完全监督法和不准确监督法。

3.3.1. 不完全监督方式

不完全监督意味着大部分训练样本没有标记，只有少数样本被标记，这部分标记样本不足以训练一个好的模型。在不完全监督方法中，半监督方法常用于工业产品的表面缺陷检测。

半监督方法可以在没有人工干预的情况下自动开发未标记的样本数据，以提高学习效果。文献[73]设计了一种基于残差网络结构的深度卷积神经网络结构，将两层残差构建模块堆叠在一起形成一个43层的卷积神经网络，同时为了达到网络深度之间的平衡和网络宽度，提高精度，适当增加网络宽度。该网络结构在 DAGM、NEU 钢数据集和覆铜板数据集上表现出良好的性能。文献[74]提出了一种基于卷积自动编码器（CAE）和生成对抗网络（SGAN）的半监督模型，堆叠的CAE用未标记的数据训练，其编码器网络被保留并作为GAN鉴别器输入到SoftMax层，使用GAN 生成钢铁表面缺陷的假图像来训练鉴别器。文献[75]设计了一个由样本生成和半监督学习组成的钢铁表面缺陷检测系统。在半监督学习部分，使用了CDCGAN和ResNet18两个分类器，并在NEU-CLS数据集上进行了对比实验。其结果，证明该方法优于监督学习和迁移学习。文献[76]提出了一种PCB焊点缺陷检测框架。在该框架的分类任务中，采用了基于“样本-查询-建议”算法的主动学习的概念和基于“自训练”的半监督学习的概念，该框架已被证明可以改善分类性能，同时大大减少注释的数量。

3.3.2. Inexact Supervision Method

不精确监督侧重于给出了监控信息，但信息不精确，即只包含粗粒度标签的情况。对于更多包含像素级标签的任务，图像级标签是粗粒度标签。

文献[77]在原有ResNet-50网络的基础上，删除原有的全连接层和池化层，在网络末端增加两个1×1的卷积，得到缺陷对应的特征图，实现了仅通过图像标签完成对太阳能电池板裂纹的初步检测。文献 [78] 开发了一个由定位网络（LNet）和决策网络（DNet）组成的 WSL 框架用于钢铁表面缺陷检测，其中 LNet 使用图像级标签训练并输出潜在缺陷位置的热图作为 DNet 输入，DNet 使用 RSAM 对 LNet 识别的区域进行加权，所提出框架的性能在实际工业数据集上得到了证明。

目前，弱监督方法在工业产品表面缺陷检测领域还比较少见，但由于同时具有监督学习方法和无监督学习方法的优点，这类方法的应用前景也很广阔 .

3.4 总结

综上所述，在深度学习的三种方法中，监督方法的应用最为广泛，因为它具有较好的准确性，但也存在明显的缺点；无监督方法符合产业发展的进程，但有其自身的特点；弱监督方法目前应用并不广泛，但具有广阔的发展前景。

4. 关键问题

4.1. 实时问题

在实际工业场景中的表面缺陷检测任务中，实时性问题不容忽视。在一些特殊场景中，如在线分析、在线监控等，实时性问题处于极其重要的地位。处理实时性问题的目标是在准确率大致相同的前提下，减少检测时间，提高检测效率。目前，已有学者对实时性问题进行了一定的研究。例如，文献[79]设计了一种新型的 11 层 CNN 模型，用于机器人焊接制造中的焊接缺陷检测。该方法为金属增材制造（AM）的在线检测提供了指导，即该方法可以满足一定的实时性要求。文献 [80] 提出了一种结合 SSIM 和 MobileNet 的两阶段算法来检测印刷电路板上的表面缺陷，在保持高精度的同时，其速度至少比 Faster RCNN 快 12 倍。

目前，模型加速是解决实时性问题的重要思路之一。模型加速主要可以从算法和硬件两个方面进行，具体如下：

(1)算法：对于网络算法层面，可以采用轻量级网络对模型进行加速。常用的轻量级模型包括 MobileNet、ShuffleNet、SqueezeNet 和 EfficientNet。此外，蒸馏和修剪也可以用于在算法级别加速网络。在计算算法上，可以优化卷积运算，达到模型加速的目的。典型的算法包括FFT、Winograd等。
(2)硬件：使用GPU、FPGA、DSP等是目前通过硬件加速模型的主要方式。

4.2. 小样本问题

现实中，基于深度学习的表面缺陷检测方法往往不能直接用于工业产品的表面缺陷检测任务。主要原因之一是现代工业流程的不断优化导致缺陷样本越来越少，即缺陷图像的数量非常有限。这种从少量样本中学习的问题通常称为小样本问题[81]，在训练过程中很容易导致过拟合问题。目前解决小样本问题的主流方案主要有以下四种：

4.2.1. 数据增强

数据增强的常用方法包括平移、旋转、镜像对比度调整和数据合成。通过数据放大，可以获得大量的样本图像。
文献[82]在无缺陷图像的表面添加合成缺陷以完成装饰塑料零件数据集的扩展。文献 [83] 以互补的方式将手工制作的特征与无监督学习特征融合在一起，生成更具辨别力的缺陷表示。

4.2.2. 无监督/半监督模型

无监督模型的优点之一是它只需要用正样本而不是负样本进行训练，这为解决小样本问题提供了方向。另外，只需要标记少量样本的半监督模型也是解决小样本问题的替代模型之一。具体内容参见3.2、3.3.1。

4.2.3. 迁移学习

通过迁移学习，已经从一项任务中学到的知识可以应用于其他不同但相关的任务，尤其是当目标任务的数据不足时。实际上，大多数数据或任务都是相关的。因此，迁移学习也是解决小样本问题的主要思路之一。文献 [84,85] 结合迁移学习和 Alex Net 来检测太阳能电池板和织物的表面缺陷。文献[86-90]将迁移学习与VGG网络结合用于乳液泵体、印刷电路板、传输线组件、钢板和木材的表面缺陷检测。文献 [91] 将迁移学习和 DenseNet 结合到织物表面缺陷检测中。

4.2.4. 优化网络结构

网络结构的优化也是解决小样本问题的一个方向。以GAN为例，AnoGAN模型在2017年的文献[92]中被提出，首次将GAN用于图像异常检测。该模型不断迭代优化固定生成器 G 的参数，在潜在空间中寻找与测试图像最接近的生成图像，然后使用 DCGAN 进行图像异常检测。 2019年，文献[93]对AnoGAN进行了改进，提出了f-AnoGAN模型。在该模型中，建议使用编码器将图像快速映射到潜在空间中的一个点，然后使用 WGAN 进行异常检测。 Encoder的引入解决了AnoGAN迭代优化需要大量时间的问题。此外，GANomaly模型（整体结构为encoder-decoder-encoder）在2018年的文献[94]中提出；通过比较编码得到的潜变量和重构编码得到的潜变量的差异，检测异常样本。值得注意的是，上述模型都不需要用负样本进行训练。

4.3.小目标检测问题

小目标检测问题也是工业产品表面缺陷检测领域的难点之一。小目标是指图像中尺寸较小的目标。 “小”有两种定义。一种是绝对尺寸小，通常认为是尺寸小于32*32像素的小目标。另一种是相对尺寸小，即目标尺寸小于原始图像尺寸的一定比例，如0.1，即该目标被认为是小目标。文献[95]通过彩虹级联（pooling and deconvolution）整合不同层的特征，增加不同层的特征图数量的同时增加不同层之间的特征图关系，一定程度上解决了小目标问题。文献[96]提出了一个由多个不同IOU阈值的检测器组成的Cascade R-CNN多阶段目标检测框架，在整个框架中，将前一阶段调整后的proposal作为下一阶段训练的输入。该方法用于小目标，通过该方法显着提高了小目标的检测结果。目前有一些技巧可以解决小目标检测问题，总结如下：

        (1)特征融合：将深层语义信息融合为浅层特征图，利用深层特征丰富语义信息，同时利用浅层特征适合检测小目标的特点；
        (2) 数据增强：增加训练集中小目标的样本类型和数量；
        (3) Image Pyramid + Multi-scale Sliding Window：为图像设置不同的输入尺寸，训练时随机选择一个尺度，将输入图像缩放到这个尺度，发送到网络；

        (4)降低网络下采样率：通过降低下采样率来减少特征图上物体的损失，常用的方法是直接去掉池化层，同时使用空洞卷积；
        (5)合理的anchor设计：主要方法包括：边界聚类，即在训练集的标签上聚类一组合适的anchor；统计实验，即把anchor和label的中心点放在一起，只利用宽高信息进行匹配实验，找出一组宽高比分布最一致的anchor；设置更小更密集的anchor和匹配策略，比如不要为小物体设置太严格的IoU阈值；
        (6)合适的训练方法：使用高分辨率图像进行预训练，同时放大输入图像，然后在小分辨率图像上进行微调；
        (7) 使用GAN将小物体放大然后检测；
        (8)使用Context信息：在目标与其Context之间建立连接。

4.4. 数据不均衡样本识别问题

不平衡样本的识别 [97,98] 是基于深度学习方法用于工业产品表面缺陷检测的另一个难点。在深度学习中，在训练模型时，通常要求样本集中各类别的样本数量平衡。然而，这种理想情况在现实中很少发生。在更多情况下，数据集中“正常”样本的数据量通常占多数，而“缺陷”或“异常”样本的数据量仅占总样本的一小部分。这种现象称为“样本不平衡”现象。样本识别不平衡的问题主要存在于监督学习的任务中。这个问题的出现会导致算法更加关注数据量较大的类别而低估数据量较小的类别，从而影响模型在测试数据中的泛化和预测能力。

目前，不平衡样本的识别可以从数据层面、模型层面、特征层面、评价指标层面四个方面来处理。

4.4.1. 数据层面

数据层面的处理方法思想是改变训练集的样本分布，使训练集中的样本分布趋于平衡，即各类样本的数量趋于一致。可以从数据源、数据增强、数据重采样[99,100]、类均衡采样、合成样本[101]五个方面进行，如图4所示。

4.4.2. 模型层面

        (1) Cost-sensitive：cost-sensitive思想是在目标函数中增加误分类小类样本的损失值，通过优化目标函数来调整模型对小类样本的注意力。有两种主要的成本敏感方法：重建训练集或引入成本敏感因素。
        重构训练集：在不改变现有算法的情况下，根据样本的不同误分类代价为训练集中的每个样本分配权重，根据权重重构原始样本集。
        引入成本敏感因素：为小类样本分配较高的成本，为大类样本分配较低的成本，以平衡样本数量的差异。成本敏感因素包括成本敏感矩阵和成本敏感向量，成本敏感方法需要在处理前指定成本敏感矩阵（或成本敏感向量）。在实际情况中，成本敏感矩阵（或成本敏感向量）中误分类权重的具体值通常可以根据样本间的比率和分类结果的混淆矩阵等信息来指定。

        (2)集成学习：使用集成学习进行缺陷检测主要有两种方式，分别是：
                A：集成学习+数据预处理：典型的算法包括Smote bagging、Smote boost、Easy Ensemble和Balance cascade；
                B：集成学习+成本敏感：典型的算法是AdaCost [102]，Rare Boost。
        (3) 转化为异常检测问题：当样本类别极不平衡时，缺陷检测问题可以看成是异常检测问题，异常检测算法（如One-Class SVM、SVDD等）可以用于建立单个分类器来检测异常点（即小类别的样本）。

4.4.3. 特征层面

从特征选择的角度，根据与分类器的关系，可以进一步分为三种方法：

与分类器无关（典型算法：过滤器）；
独立于分类器（典型算法：Wrapper）；
结合分类器（典型算法：嵌入式）。

4.4.4. 评估指标级别

由于样本不平衡的问题对准确度（Accuracy）的影响最大，因此在实际中通常不会单独使用该指标。一些评价指标是专门为解决样本不平衡问题而设计的，如召回率、F1测度、Kappa系数、ROC（AUC）等。

5. 工业产品缺陷检测数据集

数据集是研究工作的基础。一个好的数据集更有利于问题的发现和总结，从而便于解决。目前，工业产品表面缺陷检测领域还没有一个庞大而统一的数据集。对于特定的研究对象和研究场景，经常使用不同的数据集。本节根据对象和应用场景的不同，对工业领域常用的数据集进行分类，并给出相关链接。如表 2 所示，这些数据集涵盖了广泛的工业应用，包括：热轧钢带、钢轨、电子换向器、太阳能电池板、印刷电路板、磁瓦、织物等。鉴于现有数据集的总结，希望能为学者在该领域的研究提供相同的数据来源。此外，图 5 选取了部分数据集并在一定程度上展示了它。

MVTec AD 数据集共包含 15 个类别，其中 5 个类别为不同类型的纹理，其余 10 个类别为 10 个不同类型的对象。在这个数据集中，3629幅图像用于训练和验证，1725幅图像用于测试。训练集仅包含无缺陷图像，而测试集包含无缺陷图像和各种类型的缺陷图像。该数据集通常用于无监督缺陷/异常检测。

6 总结

表面缺陷检测是智能生产不可或缺的一部分。因此，研究工业产品表面缺陷检测具有很强的现实意义。本文对机器学习方法在工业产品表面缺陷检测中的现状进行了一定的调查。我们首先讨论传统机器视觉方法和深度学习方法在表面缺陷检测领域的应用。同时指出工业产品表面缺陷检测领域的一些关键问题并总结其解决方案。此外，我们概括了一个相对完整的工业产品表面缺陷检测数据集，可以帮助研究人员对工业产品表面缺陷检测进行更深入的研究。

我们通过简要解释一些具体的研究方法来支持我们的观点，这是有效的。考虑到文章的篇幅和可读性，我们只选取了一些研究方法进行扩展和解释，因此存在一些方法的文献不够或不最新的问题。但是，我们相信我们的综述可以帮助研究人员了解工业产品表面缺陷检测的相关研究进展，并起到一定的参考作用。

你可能感兴趣的:(工业缺陷检测,目标检测,深度学习,目标检测,视觉检测)

TVP：用于高效二维时序视频定位的文本-视觉提示方法 AI专题精讲强化学习强化学习文本视觉人工智能
温馨提示：本篇文章已同步至"AI专题精讲"TVP：用于高效二维时序视频定位的文本-视觉提示方法摘要本文研究的是时序视频定位（TemporalVideoGrounding，TVG）问题，其目标是在一段未经剪辑的长视频中，根据一条文本描述预测对应事件片段的起始和结束时间点。近年来，得益于精细的三维视觉特征，TVG技术取得了显著进展。然而，三维卷积神经网络（3DCNN）计算复杂度高，使得密集的3D视觉特
解密纸巾群链接的生成策略：如何有效促进商品曝光测评君高省
解密纸巾群链接的生成策略：如何有效促进商品曝光在纸巾群中，一个精心设计的链接往往能迅速吸引用户的注意，进而促进商品的曝光与销售。那么，这些链接究竟是如何生成的呢？其背后又隐藏着怎样的策略与技巧？本文将为您解密纸巾群链接的生成策略，从内容策划、视觉设计到传播渠道的选择，全方位剖析如何有效促进商品曝光。通过实例分析与专家建议，我们将助您掌握链接生成的精髓，让您的商品在纸巾群中脱颖而出。首先，高省在拼多
从感知到决策：虚拟仿真系统与视觉算法融合下的多路RTSP视频接入技术探究
1️⃣背景概述随着国防信息化和智能化进程的不断加快，虚拟仿真系统与智能视觉算法平台正逐步成为现代化装备研发、测试验证与战术训练的重要技术支撑。相比传统的静态建模或离线推演，新一代作战仿真与智能系统更强调实时性、感知能力与动态交互，这对前端传感器接入、视频数据处理与系统集成提出了更高的要求。核心应用领域涵盖：装备级虚拟作战环境仿真构建高仿真的虚拟战场环境，接入真实或仿真的传感器数据，提升推演与训练的
VideoPrism模型论文速读：一种用于视频理解的基础视觉编码器
1.引言论文介绍了VideoPrism，这是一个通用视频编码器，能够在多种视频理解任务中实现最先进的性能。VideoPrism的目标是通过单一冻结模型处理不同的视频理解任务，包括分类、定位、检索、字幕生成和问答。VideoPrism在预训练过程中使用了大规模的视频-文本对数据和带有噪声平行文本的视频片段。预训练方法在掩码自动编码基础上进行了改进，通过全局-局部蒸馏语义视频嵌入和令牌洗牌方案，使Vi
信而泰×DeepSeek：AI推理引擎驱动网络智能诊断迈向 “自愈”时代
DeepSeek-R1：强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力，融合了自然语言处理（NLP）、深度学习、大规模数据分析等前沿技术。DeepSeek-R1具备卓越的逻辑推理、多模态分析（文本/图像/语音）和实时交互能力，能够高效处理代码生成、复杂问题求解、跨模态学习等高阶任务。凭借其开源、高效、多模态
AI深度噪音抑制技术
这两年人工智能快速发展，AI已经渗透到了各行各业。在噪音抑制技术领域，AI也同样发挥了巨大的作用。AI深度噪音抑制技术是一种利用人工智能和深度学习算法来动态处理和减少音频信号中的噪声，从而提升音频的清晰度和质量。与传统的噪音抑制技术相比，AI深度噪音抑制能够更智能、更精准地分辨出背景噪音与有用的语音或音乐信号，尤其在复杂、多样的环境下表现尤为出色。1.工作原理AI深度噪音抑制技术基于深度神经网络（
Python 大数据分析（二）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/5058e6970bd2a8d818ecc1f7f8fef74a译者：飞龙协议：CCBY-NC-SA4.0第六章：第五章处理缺失值和相关性分析学习目标到本章结束时，你将能够：使用PySpark检测和处理数据中的缺失值描述变量之间的相关性计算PySpark中两个或多个变量之间的相关性使用PySpark创建相关矩阵在本章中，我们将使用Iris数据集处理
母女相遇在没有硝烟的战场不能相认雨过天晴真有彩虹
刚刚刷了条新闻，在给一个学校做核酸检测的工作人员，意外地遇到了自己多日不见的女儿，女儿对这位“阿姨”的声音表示了怀疑，但这位“阿姨”好像并不认识她，只是用动作来引导孩子做完了检测取样。这位护士妈妈是怀着怎样复杂的心情给女儿做的核酸检测呀！事后，这位感人的沈阳护士妈妈刘沫涵含着泪对记者说，怕跟女儿相认会控制不住地想哭，那样会湿了防护服，防护服有了水汽雾气就不能工作了，换一次衣服太费劲了，当时是忍住了
【深度学习】softmax 回归的从零开始实现与简洁实现 Douglassssssss 深度学习深度学习回归人工智能 softmax回归交叉熵损失函数
前言小时候听过一个小孩练琴的故事，老师让他先弹最简单的第一小节，小孩练了两天后弹不出。接着，老师让他直接去练更难的第二小节，小孩练习了几天后还是弹不出，开始感觉到挫败和烦躁了。小孩以为老师之后会让他从简单的开始练，谁知老师直接让他开始练最难的一小节。小孩不干了，问老师是不是故意刁难他。老师笑笑，让他现在弹弹第一小节试试。神奇的是，小孩竟然发现自己已经能完整弹出来了。这有点像我现在的学习状况，前些天
李开复：AI 2.0 时代的意义 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
人工智能，深度学习，Transformer，大模型，通用人工智能，AI2.0，伦理问题，未来趋势1.背景介绍人工智能（AI）技术近年来发展迅速，从最初的局限于特定领域的应用，逐渐发展到能够处理更复杂的任务，甚至展现出一些类似人类智能的能力。2010年以来，深度学习技术的兴起，特别是Transformer模型的出现，为AI发展带来了新的突破。这些模型能够处理海量数据，学习复杂的模式，并在自然语言处理
时序数据库IoTDB好不好？时序数据说时序数据库数据库 iotdb 物联网开源
时序数据库IoTDB（InternetofThingsDatabase）是专为物联网场景设计的一款开源时序数据库系统，由清华大学团队开发并贡献给Apache基金会。经过多年发展，IoTDB已经在工业物联网、车联网、能源电力等多个领域得到广泛应用。那么IoTDB究竟好不好？下面我将从几个核心优势来分析。一、专为物联网优化的存储架构分层存储设计：IoTDB采用"内存缓冲区+磁盘文件+分布式存储"的分层
25岁从零开始学习平面设计，会不会太晚？ 93091cdf8ebb
很多新手小白想学平面设计，但是苦于不知从何处入门、怎么样去学。究竟怎样系统学习平面设计？今天就来谈谈平面设计系统学习的方法。更多学习设计内容关注V公众号广告设计之站了解平面设计平面设计是以“视觉”作为沟通和表现的方式，通过文字、图片等媒介有机结合，借此表达视觉上的讯息。平面设计的分类有很多，如：名片设计、标志设计、字体设计、VI视觉形象设计等等。所以设计师要掌握字体排印、视觉艺术、版面、电脑软件等
Day9: OpenCV学习（一）—— 图像基础
系列文章目录上一篇：Day8：Python工程化——模块、包文章目录系列文章目录前言一、安装和导入1.安装二、图像认识1.图像2.图像分类三、基础图像操作1.图像读取2.图像显示3.图像裁剪4.图形尺寸修改5.图像保存6.图像绘制7.视频捕获即显示总结前言OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成
济南18家司法亲子鉴定机构汇总一览（2024年8月地址更新）中检国权有限公司
我们从刚开始对于亲子鉴定的难以启齿话题，到现在的大众认知，不管是影视还是生活中不经意总会看到亲子鉴定的片段，这年头，上户口关系证明，刑事案件DNA检测，其实孩子在医院出生后就要做个亲子鉴定也是常有的事，有人甚至会开玩笑着拿宠物去做亲子鉴定，济南人也不例外，当我们要做一个DNA鉴定时，就需要提前了解一下自己所在的地区的正规DNA亲子鉴定中心在哪里，那么济南哪里可以做司法DNA亲子鉴定呢?那么，接下来
Swift 初见（一） bearIT
Swift是一种安全，快速和互动的编程语言。它是第一个既满足工业标准又像脚本语言一样充满表现力和趣味的系统编程语言。它支持代码预览（playgrounds）Swift通过采用现代编程模式来避免大量常见编程错误：变量始终在使用前初始化。检查数组索引超出范围的错误。检查整数是否溢出。可选值确保明确处理nil值。内存被自动管理。错误处理允许从意外故障控制恢复。使用let来声明常量，使用var来声明变量。
不要奢望仪式多有意义图图1513
图片发自App百日誓师，成人礼，是一些高中为了激励学生的斗志而举行的大型活动，并且越来越像样。为了搞好百日誓师和成人礼，早早都开始筹备。从创意策划、方案设计、部门配合都要反复商榷、演练。最后呈现在众人面前的正式的仪式，都是无比的高大上，有强悍的视觉冲击力，堪称经典。需要关注的重点在这些仪式过后——百日誓师过后，一切照旧——课堂上该睡死过去的你依然喊不醒他，不是说誓师过后就得像打了鸡血一样亢奋，但至
如何打造个人品牌，从ID到IP 齐帆齐
如何打造个人品牌，从ID到IPID（IdentityDocument），是身份证标识号、账号、唯一编码、专属号码、工业设计、国家简称、法律词汇、通用账户、译码器、软件公司等各类专有词汇的缩写。我们的微信号，我们的任何平台注册号都有ID，我的ID就是我的首拼。有的人用首拼加上年份的名字，这是我们取ID的一个小窍门，让别人更方便地找到我们。从ID到IP，你要做好每一个细节，还要长期输出内容，尽可能在各
废字8 承晔儿
就哦屠洪刚嘟嘟一段路打电话说提示符时间过得就一次没回复有人他大爷的估计过几天就怪盗基德裤腰一放假姑父砍个价点解点解我爸叫我i我都要给大家请假去的v今晚就去我姐姐啊交流群没共克时艰观察观察v不超过称孤道寡梵蒂冈回到古代近地轨道还开啊连起来送上来带你吃买奶茶女八大古都工业化呵呵今年结婚刚发的是对的飞飞哥好处多多私发给她
与君共享马明洋河南信阳
＃与班共享[玫瑰]昨天期中复习检测已结束[玫瑰]本次试卷有点难——第一题的最后一题和试卷的最后一道解决问题，共计7分，其他题均为常规题。[玫瑰]90分以上的18人，85分以上的34人。但，60分以下的有5人，还有一位同学不交试卷。[玫瑰]从成绩上看，一年级已经出现“二级”分化，主要原因是识字量的差距——以张语蔓、邢硕城全张测试卷仅有2个字不认识；简双佑、简子茜、马梓怡全张试卷仅有3个字不太认识，而
运营商级对接方案：FreeSWITCH+IMS的网关健康监控与负载均衡实践 derek2026 部署实践服务器运维信息与通信
运营商级对接方案：FreeSWITCH+IMS的网关健康监控与负载均衡实践一、功能概述在对接运营商IMS系统的过程中，通常会提供多个信令地址以实现高可用性。本文档描述了如何在FreeSWITCH中配置两个SIP网关地址，实现以下功能：负载均衡：外呼时自动轮询使用两个SIP网关地址。健康检查：系统自动检测SIP网关是否可用。故障剔除：自动跳过当前不可用的SIP网关，仅使用健康状态的地址进行外呼。二、
Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
人的价值就是能让别人生活得更有价值——读荆志强老师的书有感花婆婆
最近读了荆志强老师的专著《快乐地做教育》，前言就提到：教育的本真，就是通过激励为学生赋能，帮助学生产生足够的“自我效能感”，让学生主动获取知识技能、培育情感态度；帮助学生建立自主深度学习的能力。荆志强老师倡导的“赋能教育”主要从两个方面建构：激励型课堂、自主化管理。其中，他还谈到生本教育的学习观：学习是生命成长的过程，它是人自身的一种需要，而不是外在压力的结果。教育的一切行为都应该是为了满足儿童的
IDC权威认可：瑞数信息双项入选《中国大模型安全保护市场概览》科技云报道安全
近日，国际数据公司IDC正式发布了《中国大模型安全保护市场概览，2025：全方位安全检测与防护构建可信AI》报告。本次报告中IDC结合全球统一定义以及中国市场特色，将中国大模型安全保护市场划分为7个细分领域，并通过对中国大模型安全保护市场的广泛和深入的调研，对各细分领域的代表厂商进行了全面梳理。瑞数信息凭借在AI领域的深厚技术积累与前瞻布局，入选中国大模型安全保护市场“保护大模型接口”与“保护大模
芒市全市12家正规司法亲子鉴定中心合集（附2024年汇总鉴定汇总）鼎律基因刘主任
亲子鉴定的程序和流程一般包括如下几个步骤：家长预约，采集样本，送样快递，检测分析和出具鉴定报告。首先，家长需要提前与鉴定机构预约时间，确认相关事宜。然后，在指定的时间和地点采集DNA样本，一般采用唾液或者血液样本。采集完成后，家长将样本交给机构，由专业人员进行检测和分析。最后，机构将根据检测结果出具亲子鉴定报告，交付给家长。亲子鉴定对于家庭关系和法律诉讼具有重要意义和应用价值。首先，亲子鉴定可以帮
OpenCV直线段检测算法类cv::line_descriptor::LSDDetector 村北头的码农 OpenCV opencv 算法人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述该类用于实现LSD(LineSegmentDetector)直线段检测算法。LSD是一种快速、准确的直线检测方法，能够在不依赖边缘检测的前提下直接从图像中提取出直线段。它是OpenCV的line_descriptor模块的一部分，常用于计算机视觉任务如图像拼接、S
OpenCV-光流估计
文章目录一、光流估计介绍1.光流估计的基本概念2.光流估计的原理3.光流估计的前提4.OpenCV中的光流估计算法5.参数设置与调整二、代码实现三、注意事项OpenCV中的光流估计是计算机视觉领域中的一项重要技术，它通过分析图像序列中像素点的运动，来估计物体的运动信息。以下是对OpenCV中光流估计的详细解析：一、光流估计介绍1.光流估计的基本概念光流是空间运动物体在观测成像平面上的像素运动的“瞬
WebSocket断链排查与重连实战：7种实时检测与自动恢复技巧 Clownseven websocket 网络协议网络
更多云服务器知识，尽在hsotol.com前一秒用户还在聊着天，后一秒界面突然“连接已断开，请重试”，你赶忙看日志，发现服务并没崩，CPU正常、内存平稳，也没报错。可用户就是断了，而且还不是一个两个。这种时候你才想起来：这货不是HTTP，是WebSocket。它不是请求-响应那种你来我往，它像一根细长的管子，连上之后就一直开着，谁主动断谁才结束。可问题是——它，突然就没了。WebSocket长连接
AI 驱动自动化运维平台架构与实现大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 算法机器学习人工智能决策树大数据
摘要：随着云计算、容器化和大规模分布式系统的普及，传统人工运维方法已难以满足现代IT环境中海量指标、日志和拓扑关系的实时分析与故障响应需求。AI驱动的自动化运维（AIOps）平台通过融合机器学习、深度学习、图分析以及强化学习等多学科技术，实现对海量运维数据的智能感知、预测、诊断和自动化修复。本文深入探讨AI驱动自动化运维平台的整体架构设计与核心技术实现，涵盖数据采集与预处理、AI引擎设计、自动化执
APT32F1732RBT8爱普特微电子 32位MCU国产芯片智能家居/工业控制首选深圳市尚想信息技术有限公司 32位MCU 国产芯片爱普特微电子智能家居工业控制
APT32F1732RBT8爱普特微电子，32位MCU国产芯片一、产品简介APT32F1732RBT8是爱普特微电子（APT）推出的高性能32位ARMCortex-M0内核MCU，主频高达48MHz，内置64KBFlash+8KBRAM，专为智能家居、工业控制、消费电子等领域打造。国产自主可控，性能比肩国际大厂，价格更亲民！二、核心功能与优势强劲计算性能48MHzCortex-M0内核，1.25D
基于单片机出租车计价器设计小新单片机单片机设计库单片机嵌入式硬件
功能介绍以51单片机作为主控系统；1602液晶屏显示最初的起步价，里程收费，等待时间收费；按键调整起步价，里程收费，等待时间收费；电机旋转，通过霍尔传感器检测转速，来模拟出租车行驶；电路图仿真图元器件清单B15V直流电机+托盘（粘好磁铁）BT12032纽扣电池+电池座C1,C6470uf电解电容C2104瓷片电容C310uF电解电容C4,C530pf瓷片电容D11N4007二极管J1电源接口K1,
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要