禄亿萋

Masked Face Recognition Using Deep Learning: A Review

摘要：本次调查整理并回顾了最近基于深度学习技术为蒙面人脸识别（MFR）开发的工作，提供了对 MFR 系统开发流程的见解和深入讨论。根据深层网络架构的特点和深层特征提取策略，引入了最先进的技术，还讨论了 MFR 领域使用的常见基准测试数据集，强调了许多挑战和有前途的研究方向。

一、引言

遮挡人脸识别（OFR）任务引起了广泛的关注，并且已经提出了许多深度学习方法，包括稀疏表示、自动编码器、基于视频的对象跟踪、双向深度网络和字典学习。本研究重点关注基于深度学习设计和开发的最新进展的人脸识别方法。这项及时研究的主要贡献有三个：

1.形成并提出一个通用的开发流程，该流程被大多数拟议的 MFR 系统广泛采用。对该框架的主要阶段进行了深入讨论，其中深度学习是基线。

2. 全面回顾 MFR 或 OFR 领域的最新技术。介绍了文献中使用的主要深度学习技术。此外，还讨论了常用于评估 MFR 系统性能的基准数据集和评估指标。

3. 强调面部识别这一新兴任务中的许多进展、挑战和差距，从而为如何在不同研究方向利用当前不断进步的技术提供重要见解。本综述研究致力于服务 FR 社区并启发更多的研究工作。

二、MFR 通用流程

本节介绍 MFR 系统通常如何通过一系列复杂的阶段进行开发，如图 2 所示。通用方法主要基于深度学习模型，该模型被广泛用于学习蒙面人脸的辨别特征。从该流程中可以看出，开发最终识别系统时通常会采取几个关键步骤，如以下小节所述。

首先，准备一组原始蒙版图像和相应的真实图像。这通常包括将它们分成分类目录，以便进行模型训练、验证和测试。接下来是一些预处理操作，例如数据增强和图像分割。然后，使用一个或多个深度学习模型提取一组关键面部特征，这些模型通常在通用图像上进行预训练，并在新集合（即蒙面人脸）上进行微调。这些特征应该具有足够的辨别力，以准确地检测掩模。然后应用面部去遮蔽过程以恢复遮蔽的面部并返回原始面部的估计。最后，将预测的人脸与原始的真实人脸进行匹配，以决定是否识别或验证特定的人。

1.图像预处理

用于合成面罩的最流行的方法包括MaskTheFace、MaskedFace-Net、深度卷积神经网络（DCNN）、CYCLE-GAN、身份感知掩模 GAN（IAMGAN）和 starGAN 。

2.深度学习模型

许多著名的方法已经被提出并尝试通过手工制作的局部或全局特征来识别人脸，例如 LBP、SIFT和Gabor 。然而，这些整体方法无法维持偏离其最初假设的不受控制的面部变化。后来，引入了浅层图像表示，例如基于学习的字典描述符，以改善先前方法的独特性和紧凑性问题。尽管实现了准确性的提高，但这些浅层表示仍然往往表现出针对现实世界应用的低稳健性以及针对面部外观变化的不稳定性。

2010年之后，深度学习方法得到快速发展，并以多个深层的形式用于特征提取和图像转换。随着时间的推移，他们证明了在学习与不同抽象级别相对应的多个级别的面部表征方面的优越性[48]，显示出面部变化的坚实不变性，包括灯光、表情、姿势或伪装。深度学习模型能够结合低级和高级抽象来表示和识别具有很强独特性的稳定的面部身份。接下来，介绍用于蒙面人脸识别的常见深度学习模型。

（1）卷积神经网络

AlexNet是已成功用于 FR 任务的最流行的预训练架构之一。随着集成图形处理单元（GPU）的出现，AlexNet 减少了训练时间并最大限度地减少了错误。VGG16 和 VGG19也是非常常见的基于 CNN 的架构，已用于各种计算机视觉应用，包括人脸识别。基于 VGG 的模型通常提供基于卷积的特征或表示。尽管取得了显着的准确性，但它们却受到训练时间和复杂性的影响。随着时间的推移，图像识别的任务变得越来越复杂，因此应该由更深的神经网络来处理。然而，如果网络中添加更多层，它就会变得更加复杂且难以训练；因此，通常会遇到精度下降的情况。为了克服这一挑战，引入了残差网络（ResNet），它堆叠额外的层并实现更高的性能和准确性。所添加的层可以学习复杂的特征；然而，添加更多层必须凭经验确定，以控制模型性能的任何下降。 MobileNet 是最重要的轻量级深度神经网络之一，主要依赖于流线型架构，通常用于 FR 任务。其架构表现出超参数的高性能，并且模型的计算速度更快。Inception 及其变体也是流行的基于 CNN 的架构；它们的新颖之处在于使用模块或块来构建包含卷积层的网络，而不是堆叠它们。 Xception是 inception 的极端版本，它用深度可分离卷积替换了 inception 的模块。表 1 总结了 MFR 领域中使用的流行的基于 CNN 的模型的主要特征。

（2）自动编码器

自动编码器是一种流行的深度神经网络，它提供了一种基于无监督特征学习的范例来有效地编码和解码数据。由于它能够自动从大量未标记数据中学习鲁棒特征，因此人们付出了大量的研究努力将输入数据编码到具有显着和有区别的表示的低维空间，这是由解码器完成的。然后，解码器在训练时通过反向传播反转该过程，从编码阶段生成关键特征。自动编码器已被有效地用于OFR任务，例如LSTM自动编码器、双通道SSDA（DC-SSDA）、去腐败自动编码器和基于3D地标的变分自动编码器。

（3）生成对抗网络

生成对抗网络（GAN）[74]用于自动探索和学习输入数据中的规则模式，而无需广泛注释的训练数据。 GAN 由一对神经网络组成：生成器和判别器。生成器使用给定分布的随机值作为噪声数据并生成新特征。鉴别器代表一个二元分类器，对生成的特征进行分类并决定它们是假的还是真的。 GAN 因其对抗性训练设置而被称为对抗性，因为生成器和判别器寻求优化极小极大游戏（即零和游戏）中的相反损失函数。

（4）深度置信网络（Deep Belief Network）

深度置信网络（DBN）是不同层的多个隐藏单元的集合，这些隐藏单元内部相连，而不连接同一层的单元。它通常包括一系列受限玻尔兹曼机 (RBM) 或自动编码器，其中每个隐藏子层充当下一个隐藏子层的可见层，最后一层是分类过程中使用的 softmax 层。

（5）深度强化学习

强化学习从附近的环境中学习；因此，它通过授权代理通过反复试验从其经验中选择行动来模仿人类决策的程序。代理是一个可以通过传感器感知其环境并通过执行器对该环境采取行动的实体。深度学习和强化学习的结合在深度FR中得到了有效的应用，例如注意力感知和边缘感知方法。

（6）特定 MFR 深度网络

许多深度学习架构是专门为 FR 或 OFR 任务开发或调整的，它们对性能的提高做出了显着的贡献。 FaceNet [83] 通过深度神经网络将图像映射到欧几里德空间，根据三元组损失构建人脸嵌入。当图像属于同一个人时，在欧氏空间中它们之间的距离会很小，而如果这些图像属于不同的人，则距离会很大。此功能使 FaceNet 能够处理不同的任务，例如人脸检测、识别和聚类。SphereFace是另一个流行的 FR 系统，它可以渲染几何解释并使 CNN 能够学习角度判别特征，这使得它在人脸表示学习中非常高效。 ArcFace也是一种基于相似性学习的有效FR网络，它用角度边缘损失代替了softmax损失。它使用余弦相似度来计算图像之间的距离，以找到最小距离。

MFCosface作为基于大余弦损失的MFR算法，它通过检测蒙面人脸的关键面部特征，有效克服了蒙面遮挡识别率低的问题。 MFCosface 还依赖于大余弦损失。它通过向模型添加注意力机制来优化面部特征的表示。 VGGFace是一个人脸识别系统，包含基于 VGG-Very-Deep16 CNN 架构的深度卷积神经网络进行识别。它还包括基于级联可变形部件模型的面部检测器和定位器。

DeepID的引入是为了通过将大规模人脸图像分类为大量身份来学习有区别的深层人脸表示，即人脸识别。然而，学习到的人脸表示受到显着的个人内部变化的挑战，这些变化已被许多 DeepID 变体减少，例如 DeepID + 2中提出的联合人脸识别验证。

3.特征提取

特征提取是人脸识别流程中的关键步骤，旨在提取一组具有足够辨别力的特征来表示和学习关键的面部属性，例如眼睛、嘴巴、鼻子和纹理。由于面部遮挡和掩模的存在，这个过程变得更加复杂，并且现有的面部识别系统需要进行调整以提取具有代表性且鲁棒的面部特征。在蒙面人脸识别的背景下，特征提取方法可以分为浅层表示方法和深层表示方法。

浅层特征提取是一种传统方法，它显式地制定一组具有低学习或优化机制的手工特征。一些方法使用手工制作的低级特征来查找被遮挡的局部部分并将其从识别中排除。 LBP、SIFT、HOG 和码本是代表整体学习、局部特征和浅层学习方法的流行描述符。在非遮挡人脸识别任务中，他们针对照明、仿射、旋转、缩放和平移等许多人脸变化实现了显着的准确性和鲁棒性。然而，在处理遮挡人脸（包括面罩）时，浅层特征的性能表现出下降，而深度学习模型获得的深度表示在很大程度上优于这些人脸。

人们创建并评估了许多方法来使用深度学习从面部提取特征。假设蒙面人脸的特征通常包括与蒙面区域相关的信息，这些信息应该单独建模，并为每个类别学习两个中心，而不是只有一个中心，即一个用于全脸图像的中心，一个用于蒙面人脸的中心图片；引入了一种主要基于CNN的多阶段掩模学习策略，旨在发现并消除识别中的损坏特征。许多其他注意力感知和上下文感知方法已经使用额外的子网提取图像特征来获取重要的面部区域。

具有深度图卷积网络（GCN）的图图像表示也已被用于蒙面人脸检测、重建和识别领域。 GCN 在使用为共享或固定图结构构建的空间或光谱滤波器来学习和处理人脸图像方面表现出了强大的能力。然而，学习图表示通常受到 GCN 层数和不利的计算复杂度的限制。 3D 空间特征也已针对遮挡或遮蔽 3D 人脸识别任务进行了研究。 3D人脸识别方法模仿真实视觉和对人脸特征的理解，因此有助于提高现有2D识别系统的性能。 3D 面部特征对于许多面部变化（例如照明变化、面部表情和面部方向）具有鲁棒性。

4.掩模检测

近年来，口罩已成为遮挡面部部位的常见物品之一，有不同的款式、尺寸、纹理和颜色。这加强了训练深度学习模型以准确检测口罩的要求。大多数现有的检测方法通常是为目标检测而引入的，在掩模检测任务中进行了调整和研究。具有 CNN 特征的区域（R-CNN）已在目标检测领域得到全球采用，其中利用深度 ConvNet 对目标提案进行分类。在人脸被遮挡的情况下，R-CNN 通过将数千个面部区域输入 CNN 网络并应用选择性搜索算法来提取数千个面部区域，该算法为每个区域生成一个特征向量。随后，将通过支持向量机 (SVM) 对提取的特征中的候选面部区域提案中是否存在对象进行分类。还引入了 Fast R-CNN和 Faster R-CNN，通过改造 R-CNN 架构来增强性能。然而，这些方法有显着的缺点，例如训练过程是多级管道，因此在空间和时间方面都很昂贵。此外，R-CNN 缓慢地对每个目标提案执行 ConvNet 前向传递，而不共享计算。提出了上下文注意力R-CNN作为戴口罩的检测框架。该框架用于通过提取区分特征来扩大类内距离并减少类间距离。

引入了一种称为人脸注意网络（FAN）的单次人脸检测器，它利用特征金字塔网络来解决不同尺度人脸的遮挡和误报问题。提出了一种 LLE-CNN，通过结合预先训练的 CNN 来检测蒙面人脸，提取候选面部区域并用高维描述符表示它们。然后，局部线性嵌入模块将面部描述符形成权重向量，以恢复屏蔽区域中任何丢失的面部线索。最后，分类和回归任务使用加权向量作为输入来识别真实的面部区域。引入了改进的LeNet（MLeNet），通过增加输出层的单元数量和具有较小滤波器尺寸的特征图，这反过来又进一步减少了过拟合，并提高了用少量训练图像进行蒙面人脸检测的性能。阿尔古佐等人。提出了基于多图 GCN 的特征，使用多个过滤器来检测口罩。他们使用基于距离和相关图计算的嵌入几何信息来提取和学习关键的面部特征。通过提出基于 CNN 和 VGG16 的深度学习模型并结合基于人工智能的预防措施，在模拟蒙面人脸数据集（SMFD）上检测口罩。

基于局部特征融合的深度网络也已应用于非线性空间中的蒙面人脸检测。许多其他基于检测的作品利用了基于关键面部部位（例如鼻子和嘴巴）的传统局部和全局面部特征。

最近提出了面罩助手（FMA）的概念。作为一种基于移动显微镜的人脸检测方法。他们获得了面罩的显微照片，然后利用全局和局部一致图像完成（GLCM）来提取纹理特征并选择对比度、相关性、能量和均匀性作为面部特征。提出了一种基于深度学习的单次轻量级口罩检测器，以满足嵌入式系统较低的计算要求。他们推出了单次轻型口罩检测器（SL-FMDet），由于其硬件要求较低，因此工作效率很高。轻量级主干导致特征提取能力较低，这是一个很大的障碍。为了解决这个问题，作者提取了丰富的上下文信息，并重点关注与口罩相关的关键区域，以学习更多区分戴口罩和不戴口罩的人脸的特征。研究并开发了一种用于口罩检测的深度学习模型，并在五个不同时期在 YoloV5 上对其进行训练。 YoloV5 与 CNN 一起使用来验证口罩是否存在以及口罩是否正确放置在脸上。

5去除掩模

这里介绍了基于学习的对象删除和非基于学习的对象删除算法的几种常见方法。

对于基于学习的方法，基于 GAN 的模型，该模型接收输入图像，然后自动删除目标对象。引入了两种不同的模型来学习全局一致性，并通过删除目标对象并使用 GAN 设置重建损坏的部分来完成损坏的区域。一种从粗到细的基于 GAN 的方法来从面部图像中删除对象。对于面罩去除，嵌入去掩码模型（EUM），该模型将从掩码人脸中提取的特征嵌入作为输入。它生成一个新的特征嵌入，类似于嵌入具有独特属性的相同身份的未蒙面面孔。带有两个判别器的 GAN 设置来自动摘除面罩。

对于非学习方法，引入了一种模型，该模型可以删除图像中不需要的部分，并创建适合缺失区域的新区域，然后综合匹配图像的剩余部分。正则化因子来调整补丁优先级函数的曲线以计算填充顺序。帕克等人。使用主成分分析（PCA）重建和递归误差补偿来从面部图像中去除眼镜。一种图像补全算法，该算法依赖于大型图像数据库来搜索相似信息并将其嵌入到输入样本的损坏像素中。

6.面部修复

图像重建领域的开创性工作之一是基于稀疏表示的分类（SRC），以实现稳健的 OFR。针对FR中的特定问题引入了SRC的各种变体，例如用于欠采样FR任务的扩展SRC（ESRC）和用于提高人脸重建的判别能力的组稀疏编码（GSC）。已经提出了许多其他方法来重建被遮挡面部的缺失部分。支持向量判别字典和基于 Gabor 遮挡字典的 SRC (SVGSRC) 进行 OFR。 Li 等人将稀疏表示和粒子滤波结合起来并进行了研究。基于深度字典表示的分类方案，以实现稳健的 OFR。基于二维图像矩阵的误差模型，称为 OFR 的基于核范数的矩阵回归 (NMR)。稀疏正则化 NMR 方法，该方法通过在 NMR 框架的表示上引入 L1-范数约束而不是 L2-范数。然而，图像重建方法显示出许多众所周知的缺点，例如需要过完备的字典和图库图像的大量增加导致复杂性问题，以及它们在泛化能力方面的限制。

深度学习方法已经解决了这些挑战，以恢复面部图像中丢失的部分。在过去的几年中，基于 GAN 的方法已与全局和局部判别器一起使用来处理面部重建任务。基于语义图像修复的数据来计算丢失的像素和区域。然而，他们无法保留面部身份。引入了一种模型来检索各种头部姿势下丢失的像素部分，同时尝试在网络训练中的身份损失和姿势鉴别器的基础上保留身份。提出了一种端到端的BoostGAN网络，该网络由三部分组成：多遮挡前视图生成器、多输入增强网络和多输入鉴别器。该方法配备了从粗到细的面部去遮挡和正面化网络集成。提出了一种基于 GAN 的从粗到细的方法，具有用于图像修复的新颖的上下文注意模块。通过图像到图像的转换方法使用基于 GAN 的图像修复来完成图像。使用 GAN 同时处理面部正面化和面部补全任务。他们引入了两阶段生成对抗网络（TSGAN），并提出了一种基于遮挡掩模的注意力模型。此外，利用GANs引入了EyesGAN框架，该框架主要用于基于眼睛构建人脸。

一种人脸补全方法，称为学习和保留人脸补全网络（LP-FCN），用于解析人脸图像并同时提取人脸身份保留（FIP）的特征。该方法主要基于CNN，训练CNN来变换FIP特征。这些特征被融合，将它们输入到生成完整图像的解码器中。

图 3 显示了最近提出的两种方法来揭开面部面具并恢复丢失的面部部位。

(a) 具有两个判别器的基于 GAN 的网络和 (b) EUM 模型的一般方法。

7.人脸比对与识别

FR和MFR的深度特征人脸匹配可以被视为人脸验证或识别问题。为了完成此任务，首先在训练和验证阶段将一组已识别对象的图像输入系统。在测试阶段，一个新的未见过的主题被呈现给系统以做出识别决策。为了有效地学习一组深层特征或描述符，应该实现和应用适当的损失函数。 MFR社区常用的匹配方式有两种：1对1和1对N（一对多）。在这两种方法中，通常使用常见的距离度量，例如基于欧几里得的 L2 和余弦。 1对1相似度匹配过程通常用于人脸验证，该过程应用于真实图像集合和测试图像之间，以确定两个图像是否指同一个人，而1对N相似度匹配用于人脸识别，调查特定蒙面人脸的身份。

人们已经引入了许多方法来增强深层特征的辨别水平，以使人脸匹配过程更加准确和有效，例如度量学习和稀疏表示。用于匹配人脸身份的深度学习模型已广泛使用基于softmax损失和基于三元组损失的模型。基于 Softmax 损失的模型依赖于使用 softmax 函数训练关于训练数据集中每个身份的一类的多类分类器。另一方面，基于三元组损失的模型的特点是通过匹配各种输入的结果来立即学习嵌入，以最小化类内距离，从而最大化类间距离。然而，基于 softmax 损失和基于三元组损失的模型的性能受到面罩遮挡的影响。

最近，文献中也提出了大量的研究工作来解决 MFR 任务。例如，有效的方法已经显示出较高的 FR 性能，要么通过基于 GAN 的方法在将面部输入到面部识别模型之前揭露面部，要么仅从面部的上部提取特征，或者通过结合蒙面和未蒙面的人脸来训练人脸识别网络。将 VGG2 数据集与增强型蒙面人脸相结合，并使用 FaceNet中定义的原始管道训练模型，这反过来又使模型能够根据上半张脸的特征。引入了基于 ArcFace 的 MFR 人脸识别模型的完整训练流程。能够为每个身份识别两个与全脸图像和蒙面图像相匹配的中心使用域约束排序（DCR）顺序图像。

三、标准数据集

表2显示了蒙面人脸识别任务中使用的数据集的主要特征。

四、用于 MFR 的最先进方法

本节首先介绍针对遮挡部分的 FR 提出的现有工作，即针对包括面罩在内的任何物体的 OFR。然后，讨论了 MFR 任务中具体提出的研究贡献。

1.遮挡人脸识别

一种计算高效的方法来应用特征提取、深度计算和 3D 图像公式。他们使用 SIFT 来密集地表示面部特征。然后，使用多元高斯分布计算图像深度。最后，他们通过应用基于朗伯反射定律的着色技术来确定形状，从而恢复了酒窝和皱纹等高细节。引入了一种用于面部图像的面部去遮挡技术，其中用户应该决定要删除哪个对象。他们通过在单个网络中使用普通卷积和部分卷积的合并操作，生成了融合良好且无视觉伪影的内容。此外，为了解决数据不足问题，他们使用公开获取的 CelebA 和 CelebA-HQ 数据集构建了一个大型合成面部遮挡配对数据集。他们的结论是，即使使用在合成面部遮挡数据集上训练的模型，它也能有效地删除非面部对象，并提供结构和感知上的信息。在具有挑战性的真实图像中呈现可信的面部内容。

名为 MaskNet 的深度可训练模块，用于学习以异常准确度制定图像特征，并忽略那些因遮挡而变形的特征。它可以涉及多个具有有限个人身份标签和较少计算量的 CNN 架构。他们使用真实的和合成的遮挡人脸图像来证明 MaskNet 的有效性。他们在 CASIA-Webface上训练这个网络，在 AR 数据集上对其进行微调，最后在 LFW 数据集上对其进行测试。一种成对差分连体网络（PDSN）框架，用于查找深度 CNN 模型中被遮挡的面部块和受损特征元素之间的等价性。系统性能在具有真实世界和合成遮挡的人脸数据集上进行评估。

一种基于单个端到端深度神经网络的遮挡人脸识别方法，称为遮挡掩模人脸识别（FROM）。它用于学习准确的特征掩码，使用深度 CNN 发现损坏的特征，然后使用动态学习的掩码来清理它们。此外，作者通过创建巨大的、被遮挡的面部图像来有效地训练 FROM。他们检查了许多具有遮挡或遮蔽人脸的数据集，例如 LFW、Megaface Challenge 1、RMF2 和 AR。

成对自对比注意感知（PSCA）模型来提取不同的局部特征。所提出的注意力稀疏损失（ASL）增加了注意力图中的稀疏响应，从而减少了对分散注意力的区域的关注，同时促进了对有区别的面部部位的关注。他们评估了多个数据集上的识别性能，包括 LFW、VGGFace2、MS-Celeb-1M 和 RMFRD。

提出了一种感知哈希方法，称为单次频率主导邻域结构（OSF-DNS）。该方法在遮挡人脸验证和人脸分类任务上表现出改进。将遮挡面部与其非遮挡面部进行匹配的能力有利于遮挡面部验证。此外，使用分类器接收被遮挡面部的身份，并用非遮挡面部和感知哈希码作为特征向量进行训练，有利于面部分类。他们创建了六个最先进数据集的 AERO 攻击版本：LFW、CUHK 、MEDS-II、CFPW、VGGFace2 和 NIMH-ChEFS 。

表 3 总结了本小节讨论的最新 OFR 方法的主要特征。

2.蒙面人脸识别

一种自动从面部去除掩模对象并合成损坏区域同时保留初始面部结构的方法。他们使用两个鉴别器来学习深度去除区域的一般面部结构，从而保持检索到的面部的结构和形状一致性。在CelebA数据集的基础上使用合成配对数据集来解决数据不足的问题。他们的组合前馈模型产生结构上和感知上合理的面部图像来挑战真实图像。对四种最先进的深度学习模型进行了比较分析，即 VGGFace、FaceNet、OpenFace 和 DeepFace。他们的结论是这些模型在人脸验证任务中表现出很高的准确性。

一种基于 ArcFace 的深度模型，并对主干网和损失函数进行了更改。他们利用数据增强从原始人脸识别数据集中生成了蒙版版本，并以较低的计算成本在 MFR 上检查了 ResNet-50。然后，ArcFace 损失与掩模使用分类损失组合成一个名为多任务 ArcFace (MTArcFace) 的新函数。

基于深度学习的特征来丢弃 MFR 的屏蔽区域。他们使用预先训练的深度 CNN 从捕获的区域（主要是眼睛和前额区域）中选择最佳特征。然后，将特征袋范例应用于最后一个卷积层的特征图以量化表示。他们还使用了 RMFRD 数据集，其中使用三个预训练的深度 CNN（VGG-16、AlexNet 和 ResNet-50）从捕获的区域中选择深度特征。基于Haar-cascade和MobileNet的MFR方法来检测掩模，然后使用VGG16和Triplet loss FaceNet以及多线程技术进行人脸识别。适用于当前人脸识别模型头部的 EUM 模型。他们使用自我约束三元组 (SRT)，允许 EUM 创建与相关角色的未遮盖脸部相关的嵌入。

采用了 FaceMaskNet-21 网络，该网络使用四元组和深度度量学习进行训练，可以立即识别蒙面人脸。为数据集中的每个人脸以及输入图像或实时视频流生成 128 维编码。他们还使用 HOG 特征来更主动地识别被面罩遮挡的面部。提出了三个蒙面人脸数据集，真实世界蒙面人脸识别数据集（RMFRD）、蒙面人脸检测数据集（MFDD）和蒙面人脸识别数据集（SMFRD），以处理需要足够量蒙面人脸的MFR任务和未屏蔽的图像。他们将注意力权重应用于未覆盖的面部部位的重要特征，例如眼睛细节、前额和面部轮廓。

MaskTheFace模型，综合生成蒙面人脸的集合。 MaskTheFace 检测面部标志来识别面部的关键特征和倾斜度。他们还使用 MaskTheFace 通过 FaceNet 系统来识别蒙面人脸，该系统为人脸添加了嵌入。为了训练 FaceNet，他们使用 VGGFace2 数据集并随机采样每人 42 张图像来创建一个名为 VGGFace2-mini 的子数据集。根据新的子集，他们创建了另一个子集，其中包含相同的图像但带有蒙版，称为 VGGFace2-mini-SM。

一种基于 3D 模型的方法，称为 WearMask3D，用于增强不同姿势的蒙面人脸图像。它在图像上拟合 3D 变形模型 (3DMM)，然后生成 3D 掩模表面以将其覆盖在面部模型上。它将遮罩纹理映射到模型，并根据图像分辨率和亮度将 3D 表面渲染为 2D 图像。他们还引入了 Masked Faces in the Wild (MFW) 迷你数据集，并评估了 MFW-mini 和 MFR2 上的模型性能。一个基于 ResNet-50 的框架来识别蒙面人脸。在训练中，他们使用了域适应，其中将未蒙蔽的面孔视为源域，将蒙蔽的面孔视为目标域。第一个场景是仅在源域上训练模型并在目标域上进行测试。第二种场景是在源域和部分目标域上训练模型，并在目标域的其余部分上测试模型。

多任务级联卷积神经网络（MTCNN）来检测遮蔽和未遮蔽的面部部分并将其转换为高维描述符。之后，他们使用边界框调整图像大小并裁剪图像作为后处理步骤，然后使用 FaceNet 提取主要特征。 SVM分类器用于识别身份。他们执行了两个场景，第一个场景是使用未蒙面的面部作为训练的输入，蒙面的面部作为测试的输入，第二个场景是使用蒙面和未蒙面的面部作为训练的输入，蒙面的面部作为测试的输入。

一个名为蒙面人脸分割和识别（MFSR）的数据集，使用身份感知蒙版生成对抗网络（IAMGAN）综合地丰富了更多蒙面人脸作为训练对象。它基于 MFSR 数据集，由一个循环生成器组成，可将全脸图像转换为蒙版脸部。然而，由于域差异巨大以及屏蔽图像和未屏蔽图像之间缺乏配对，导致生成的图像无法进行身份识别，因此该模块效果不佳。因此，这个具有挑战性的部分是通过多级身份保留模块解决的。它通过使用域约束排名损失（DCR）学习类中心来考虑蒙面和未蒙面人脸之间的类内差异，该损失假设蒙面人脸的特征包含与蒙面区域相关的信息，并且应该单独建模。这使得模型能够学习同时提取身份的特定特征和单独的身份。

一个基于去闭塞蒸馏的框架来提高 MFR 的准确性。该框架包括两个模块：去遮挡模块，应用基于 GAN 的面部补全网络来消除蒙面人脸外观的模糊性，使用注意力机制显示没有蒙面的完整面部，以关注信息丰富的区域。脸。第二个模块是蒸馏，采用预先训练的人脸识别模型，并通过基于 VGGFace2 的知识蒸馏来调整其人脸知识。此外，他们训练模型将口罩分为四类：简单口罩、复杂口罩、人体口罩和混合口罩。

引入了两个MFR数据集：蒙面人脸验证（MFV）和蒙面人脸识别（MFI），它们被考虑用于测试和评估目的。在训练中，数据增强用于通过对齐人脸和面具并检测预定义的面部标志，从现有人脸识别数据集中生成合成蒙面人脸。应用 Delaunay 三角剖分算法将图像划分为小三角形，其中人脸图像的每个三角形都有对应的掩模三角形。为了进行测试，使用了 MFV 和 MFI 数据集，并将数据增强应用于 LFW 数据集，称为合成屏蔽 LFW。他们还提出了一种潜在部分检测（LPD）模型，该模型的灵感来自于人眼聚焦于被遮挡或遮挡的面部的可见部分（称为潜在部分）。然而，潜在部分的特征需要能够区分身份。 LPD模型受到面具始终位于脸部下部的假设的限制。

MFR 还受邀检测和识别遮住脸部的犯罪分子。引入了行人重新识别（ReID）方法，试图解决寻找同一身份的蒙版和未蒙版图像之间关联的问题。它使用局部和全局图像特征重新识别蒙版行人图像，然后测量蒙版行人和未蒙版行人图像之间的相似性。 FaceNet 用于识别人的身份。

从训练方法和数据模型方面讨论了近红外到可见光（NIR-VIS）MFR 的挑战。他们提出了一种异构半连体训练（HSST）方法，旨在利用半连体网络最大化人脸表示之间的联合信息。他们还提出了一种基于面部重建的方法，该方法可以从现有数据集中合成面部图像的掩模。

引入了一种基于注意力的 MFR 算法，该算法使用局部约束字典学习方法将掩模与面部分离。它提高了分辨率使用扩张卷积对图像进行处理，并使用注意力机制减少信息损失。他们使用 ResNet 提取特征，并在 RMFRD 和 SMFRD 数据集上进行评估。基于大余弦损失的MFCosface MFR算法，通过在模型中添加注意力感知机制来优化检测关键面部特征。一种基于注意力的算法和一种基于裁剪的MFR算法。他们在基于注意力的部分使用了卷积块注意力模块（CBAM）来突出眼睛周围的区域。

表 4 总结了本小节中讨论的最新 MFR 方法的主要特征：

表 5 总结了 MFR 方法在准确度方面的表现：

表 6 总结了 MFR 方法在排序准确度方面的表现：

表 7 列出了 MFR 方法应用的各种类型的性能指标：

六、结论

研究讨论了近年来采用的通用 MFR 流程，并确定了有助于提高 MFR 方法性能的最新进展。讨论了许多直接影响 MFR 系统的重要问题，包括图像预处理、特征提取、人脸检测和定位；面部揭秘和修复；以及身份匹配和验证。此外，最近引入了一些有趣且有前途的技术，预计将激发更多的研究工作来应对现有的 MFR 挑战。最重要的是，可以得出结论，MFR任务将被长期研究，并且文献中将不断提出更多的研究和操作工作。将现有 FR 方法用于 MFR 的调整仍然倾向于显示出明显的性能下降。考虑有效和先进的技术来更多地关注深度学习模型的学习能力将是有益的。为了提高 MFR 系统的泛化能力，需要仔细考虑图像和测试集变化的性质。此外，成功利用混合深度神经网络来学习并发任务（例如掩模检测和人脸重建）对于 MFR 准确性非常重要。度量学习也会对身份验证或识别的性能产生积极影响。

附录 A ：提供了本研究涵盖的主要问题的分类。

你可能感兴趣的:(深度学习,人工智能)

Chat Model API 虾条_花吹雪 Spring AI java
聊天模型API为开发人员提供了将人工智能聊天完成功能集成到应用程序中的能力。它利用预训练的语言模型，如GPT（生成预训练转换器），以自然语言对用户输入生成类似人类的响应。API通常通过向人工智能模型发送提示或部分对话来工作，然后人工智能模型根据其训练数据和对自然语言模式的理解生成对话的完成或继续。然后将完成的响应返回给应用程序，应用程序可以将其呈现给用户或用于进一步处理。Spring人工智能聊天模
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
巅峰对决，超三十万奖金等你挑战！第十届信也科技杯全球AI算法大赛火热开赛！中杯可乐多加冰前沿资讯分享科技人工智能算法计算机视觉机器学习深度学习
信也科技今年跟IJCAI和CIKM这两大全球顶级AI会议合作，这场比赛被全球人工智能顶会CIKM收录为官方赛事单元，获奖选手有机会全球人工智能顶会创造更大的影响力。一、赛事概况随着深度伪造技术的高度发展，人工智能产业走深向实，生成合成技术开始呈现工具化和普及化趋势。在生成合成内容质量显著提升的当下，基于换脸攻击的身份冒用和欺诈事件在全球范围内激增，严重威胁个人隐私和公共数据安全。第十届信也科技杯全
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
OPENAI中Assistants API的实现原理及示例代码python实现 dzend aigc python ai
OPENAI中AssistantsAPI的实现原理及示例代码前言OPENAI是一家人工智能公司，致力于研究和开发人工智能技术。其中，AssistantsAPI是OPENAI推出的一项人工智能服务，可以帮助开发者快速构建智能助手。本文将介绍AssistantsAPI的实现原理，并提供使用Python实现的示例代码。AssistantsAPI实现原理AssistantsAPI的实现原理主要包括以下几个
【深度学习】神经网络剪枝方法的分类烟锁池塘柳0 机器学习与深度学习深度学习神经网络剪枝
神经网络剪枝方法的分类摘要随着深度学习模型，特别是大语言模型（LLM）的参数量爆炸式增长，模型的部署和推理成本变得异常高昂。如何在保持模型性能的同时，降低其计算和存储需求，成为了工业界和学术界的核心议题。神经网络剪枝（Pruning）作为模型压缩的关键技术之一，应运而生。本文将解析剪枝技术的不同分类，深入探讨其原理、优缺点。文章目录神经网络剪枝方法的分类摘要1为什么我们需要剪枝？2分类方法一：剪什
Python 图像分类入门超龄超能程序猿机器学习 python 分类开发语言
一、介绍图像分类作为深度学习的基础任务，旨在将输入图像划分到预定义的类别集合中。在实际的业务中，图像分类技术是比较常用的一种技术技能。例如，在安防监控中，可通过图像分类识别异常行为；在智能交通系统中，实现对交通标志和车辆类型的快速识别等。本文将通过安装包已有数据带你逐步了解使用Python进行图像分类的全过程。二、环境搭建在开始图像分类项目前，需要确保Python环境中安装了必要的库。主要包括：T
初始CNN(卷积神经网络) 超龄超能程序猿机器学习 cnn 人工智能神经网络
卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）作为深度学习的重要分支，在图像识别、目标检测、语义分割等领域大放异彩。无论是手机上的人脸识别解锁，还是自动驾驶汽车对道路和行人的识别，背后都离不开CNN的强大能力一、CNN诞生的背景与意义在CNN出现之前，传统的图像识别方法主要依赖人工提取特征，例如使用SIFT（尺度不变特征变换）、HOG（方向梯度直方图）等算法。这些
深度学习实验：GPU加速，突破性能瓶颈 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
深度学习实验：GPU加速，突破性能瓶颈1.背景介绍随着深度学习模型变得越来越复杂和庞大，传统的CPU已经无法满足训练和推理的计算需求。GPU凭借其强大的并行计算能力和专门为矩阵运算优化的架构，成为了深度学习领域的核心加速器。本文将探讨如何利用GPU加速深度学习实验,突破性能瓶颈,提高模型训练和推理的效率。2.核心概念与联系2.1GPU架构GPU(图形处理器)最初是为了加速图形渲染而设计的,但由于其
使用大模型预测胃穿孔的全流程系统技术方案大纲
目录一、项目概述二、项目背景三、建设目标四、建设内容（一）建设架构（二）核心功能（三）核心技术（四）预期成效（五）方案总结五、系统架构方案流程图六、实验验证证据七、健康教育与指导一、项目概述本项目旨在构建一套基于大模型的胃穿孔预测及全流程管理系统，通过整合术前、术中、术后各环节数据，利用先进的人工智能技术，实现对胃穿孔疾病的精准预测、手术方案优化、并发症风险预警以及术后护理指导等功能，为医疗决策提
深度学习相关指标工作笔记 Victor Zhong AI 框架深度学习笔记人工智能
这里写目录标题检测指标iou/Ｇou/Ｄiou/ＣiouMSE(MeanSquaredError)(均方误差)(回归问题)交叉熵损失函数(CrossEntropyErrorFunction)(分类问题)检测指标iou/Ｇou/Ｄiou/ＣiouIntersectionoverUnion(IoU)是目标检测里一种重要的评价值交并比令人遗憾的是IoU无法优化无重叠的bboxes如果用IoU作为loss
【深度学习新浪潮】基于扩散模型的图像编辑加速方法小米玄戒Andrew 深度学习新浪潮深度学习人工智能扩散模型 Transformer DiT 图像编辑模型加速
在基于扩散模型的图像编辑任务中，实现高质量与高效加速的平衡需要综合运用模型架构优化、采样策略创新、条件控制增强及硬件加速等多维度技术。一、一步反演与掩码引导的编辑框架通过一步反演框架将输入图像映射到可编辑的潜在空间，结合掩码引导的注意力重缩放机制，实现文本引导的局部编辑。例如，SwiftEdit通过一步反演和注意力重缩放，将编辑时间压缩至0.23秒，比传统多步方法快50倍。具体步骤包括：一步反演：
表观遗传风暴：深圳AI-BioFab终极防御战全纪实
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站⚡《表观遗传风暴：深圳AI-BioFab终极防御战全纪实》副标题：抗癌疫苗灌装倒计时90秒惊现组蛋白叛乱，中国启动虫洞计算化解文明级生物危机2025年7月2日14:26光明科学城急电当第184支抗癌疫苗注入冷链罐的瞬间，B3层突爆刺眼蓝光！培养舱内数千细胞染色体疯狂解旋，量子钟在14:26:03
医疗影像诊断新范式：多模态AI在癌症早筛中的落地难题 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站医疗影像诊断新范式：多模态AI在癌症早筛中的落地难题——2025年临床转化瓶颈突破与多中心验证报告残酷现实：FDA2025Q1报告显示，87%的AI影像工具因临床转化失败止步于III期试验破局曙光：斯坦福-梅奥联合研究证实，多模态融合使肺结节良恶性判别AUC提升至0.98（单模态上限0.91）一
合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实》副标题：全球首座AI-BioFab落地深圳，蛋白质设计周期从3年压缩至11天，生物制造成本暴跌90%一、生物制造范式的历史性颠覆▶︎传统生物工程的三大世纪困局graphTDA[缓慢的试错循环]-->B[单基因改造耗时≥6个月]C[
Transformer已死？2025年十大替代架构实战评测
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站封面图建议：十大架构3D渲染图环绕碎裂的Transformer图标，背景为动态性能雷达图副标题：实测推理速度/显存占用/长文本能力，附迁移成本决策树一、争议源起：Transformer的时代性局限（2025版）graphLRA[Transformer痛点]-->B[显存黑洞：千亿模型推理需1.6
生物启发AI新突破：神经形态芯片+脉冲神经网络落地指南 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《生物启发AI新突破：神经形态芯片+脉冲神经网络落地指南》副标题：基于2025年英特尔Loihi3芯片的工业级部署实战（附能耗对比&代码库）封面建议：脉冲神经网络动态脉冲传导图覆盖在神经形态芯片显微结构上，标注「能效比：传统GPU的1/800」一、2025生物启发AI的临界点突破生物神经特性事件
《从Backprop到Diffusion：深度学习的算法进化树全景图》 HeartException 学习人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《从Backprop到Diffusion：深度学习的算法进化树全景图》**展开系统性解析。全文基于算法原理-技术突破-产业重塑的三层逻辑链，融合2025年最新研究成果与产业数据，呈现深度学习四十年的底层技术迁徙路径从Backprop到Diffusion：深度学习的算法进化树全景图副标题：一部算法
语言模型之谜：提示内容与格式的交响诗步子哥 AGI通用人工智能语言模型人工智能自然语言处理
当代人工智能领域中，语言模型（LLM）正以前所未有的规模和深度渗透到各行各业。从代码生成到数学推理，从问答系统到多项选择题，每一次技术的跃进都离不开一个看似简单却充满玄机的关键环节——提示（prompt）的设计。而在这场提示优化的探索中，内容与格式的双重奏正逐渐揭开其神秘面纱，谱写出一曲宏大的交响诗。本文将带您走进“内容格式集成提示优化（CFPO）”的奇幻世界，揭示如何透过细腻的内容雕琢和精妙的格
多模态大模型：技术原理与实战看清GPT的进化史和创新点 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战看清GPT的进化史和创新点1.背景介绍1.1人工智能的发展历程1.1.1早期人工智能1.1.2机器学习时代1.1.3深度学习的崛起1.2自然语言处理的演进1.2.1基于规则的方法1.2.2统计机器学习方法1.2.3深度学习方法1.3大语言模型的出现1.3.1Transformer架构的提出1.3.2GPT系列模型的发展1.3.3多模态大模型的兴起2.核心概念与联系2.1
《卷积神经网络到Vision Transformer：计算机视觉的十年架构革命》 HeartException 人工智能学习
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站题目《卷积神经网络到VisionTransformer：计算机视觉的十年架构革命》展开深度解析，全文采用技术演进史+架构对比+产业影响的三段式结构，附关键数据与趋势预测：卷积神经网络到VisionTransformer：计算机视觉的十年架构革命副标题：从局部感知到全局建模，一场改变AI视觉基石的
Alpha系统联结大数据、GPT两大功能，助力律所管理降本增效资讯分享周大数据 gpt
如何通过AI工具实现法律服务的提质增效,是每一位法律人都积极关注和学习的课题。但从AI技术火爆一下,法律人一直缺乏系统、实用的学习资料,来掌握在法律场景下AI的使用技巧。今年5月,iCourt携手贵阳律协大数据与人工智能专业委员会,联合举办了《人工智能助力律师行业高质量发展巡回讲座》,超过100家律所的律师参与活动。讲座上,iCourtAIGC研究员、AlphaGPT产品研发负责人兰洋,为贵州律协
Xtuner：大模型微调快速上手潘达斯奈基~ AIGC AIGC
一、XTuner是什么？简单来说，XTuner是一个轻量级、易于使用的、为大语言模型（LLM）设计的微调工具库。它由上海人工智能实验室（OpenMMLab）开发，是其强大AI工具生态（MMCV,MMEngine等）的一部分。它的核心设计理念是“用一个配置文件搞定一切”，让开发者和研究人员可以极大地简化微调流程。二、为什么选择XTuner？（核心优势）轻量且用户友好：命令行驱动：你不需要编写复杂的训
AI时代的人类增强：道德考虑与身体增强的未来发展机遇分析机遇挑战 AI天才研究院 AI人工智能与大数据 AI大模型企业级应用开发实战 Agentic AI 实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
AI时代的人类增强：道德考虑与身体增强的未来发展机遇分析机遇挑战关键词：人工智能、身体增强、道德考虑、未来发展、机遇挑战摘要：本文将探讨AI时代人类增强的各个方面，包括道德考虑和身体增强技术的未来发展机遇与挑战。通过详细分析AI技术基础、身体增强技术、道德哲学及社会影响，本文旨在为读者提供对这一前沿领域的深入理解和前瞻性思考。目录大纲AI时代的人类增强：道德考虑与身体增强的未来发展机遇分析机遇挑战
目标检测：从基础原理到前沿技术全面解析随机森林404 计算机视觉目标检测人工智能计算机视觉
引言在计算机视觉领域，目标检测是一项核心且极具挑战性的任务，它不仅要识别图像中有什么物体，还要确定这些物体在图像中的具体位置。随着人工智能技术的快速发展，目标检测已成为智能监控、自动驾驶、医疗影像分析等众多应用的基础技术。本文将全面介绍目标检测的基础概念、发展历程、关键技术、实践应用以及未来趋势，为读者提供系统性的知识框架。第一章目标检测概述1.1目标检测的定义与重要性目标检测（ObjectDet
喜讯 | Navicat 蝉联 2025 年 DBTA 100 强名单 Navicat中国 Navicat 17 焕新上市 navicat 数据库
Navicat在“DBTA1002025-数据领域最重要的公司”榜单中获得表彰。该奖项旨在表彰在数据管理与分析领域的领先创新者。数据库趋势与应用集团出版人TomHogan表示：“企业正寻求扩大人工智能的应用范围，采用新的技术与应用，增加数据分析/商业智能的使用，并对现有应用进行现代化改造”，“每年，《数据库趋势与应用》杂志都会推出DBTA100榜单，旨在表彰具有创新精神、能够为客户带来新产品新体验
Midjourney：AI人工智能图像生成的新方向 AI智能探索者人工智能 midjourney 计算机视觉 ai
Midjourney：AI人工智能图像生成的新方向关键词：Midjourney、AI图像生成、扩散模型、提示词工程、多模态学习、生成式AI、创意工具摘要：本文将带您走进AI图像生成的前沿领域，以Midjourney为核心，从技术原理到实际应用，用通俗易懂的语言解析其背后的“魔法”。我们将通过生活案例、技术拆解和实战演示，揭示Midjourney如何通过扩散模型、提示词工程和多模态学习，重新定义“用
剖析AI人工智能领域Whisper的性能指标 AI大模型应用实战人工智能 whisper xcode ai
剖析AI人工智能领域Whisper的性能指标关键词：Whisper、语音识别、性能指标、ASR、AI模型评估、基准测试、语音转文本摘要：本文深入剖析OpenAI开发的Whisper语音识别系统的性能指标。我们将从技术原理、架构设计、性能基准测试等多个维度，全面分析Whisper在不同场景下的表现。文章将详细讲解Whisper的评估方法、关键性能指标解读、实际应用中的性能表现，以及与其他主流语音识别
探索AI人工智能领域多智能体系统的技术原理 AI大模型应用之禅人工智能网络 ai
探索AI人工智能领域多智能体系统的技术原理关键词：AI人工智能、多智能体系统、技术原理、智能体交互、分布式计算摘要：本文深入探索了AI人工智能领域多智能体系统的技术原理。首先介绍了多智能体系统的背景，包括其目的、预期读者、文档结构和相关术语。接着阐述了多智能体系统的核心概念与联系，通过文本示意图和Mermaid流程图进行清晰展示。详细讲解了核心算法原理，结合Python源代码进行说明，并给出了相关
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默