dongyangY

center loss 翻译

深度人脸识别的判别特征学习方法（Center Loss）

文章目录

深度人脸识别的判别特征学习方法（Center Loss）

摘要
1 简介
2 相关工作
3 建议的方法

3.1 一个玩具的例子
3.2 中心损失
3.3 讨论

4 实验

4.1 实施细节
4.2 参数λ和α的实验
4.3 LFW和YTF数据集的实验
4.4 MegaFace Challenge数据集的实验

5 结论
6 致谢
参考

摘要

卷积神经网络（CNNs）已被广泛应用于计算机视觉领域，显着提高了现有技术水平。在大多数可用的CNN中，softmax损失函数被用作训练深度模型的监督信号。为了增强深度学习特征的判别力，本文提出了一种新的监督信号，称为中心丢失，用于人脸识别任务。具体而言，中心损失同时学习每个类别的深度特征的中心并且惩罚深度特征与其对应的类中心之间的距离。更重要的是，我们证明了所提出的中心损失函数是可训练的并且易于在CNN中进行优化。通过对softmax损失和中心损失的联合监督，我们可以训练强大的CNN，以尽可能地获得具有两个关键学习目标，课间分散和课内紧凑性的深层特征，这对于人脸识别是非常必要的。。令人鼓舞的是，我们的CNN（通过这种联合监督）在几个重要的人脸识别基准，野外标签面（LFW），YouTube Faces（YTF）和MegaFace挑战中达到了最先进的准确性。特别是，我们的新方法在MegaFace（最大的公共领域基准测试版）下，在小型训练集（包含500000以下图像和20000人以下）的协议下取得了最佳结果，显着改善了之前的结果并设置了新的状态。 - 用于面部识别和面部验证任务

关键词：卷积神经网络，人脸识别，判别特征学习，中心损失

1 简介

卷积神经网络（CNNs）在视觉社区取得了巨大成功，显着提高了分类问题的现状，如对象[18,28,33,12,11]，场景[42,41]，动作[3] ，36,16]等等。它主要受益于大规模的培训数据[8,26]和端到端的学习框架。最常用的CNN执行特征学习和标签预测，将输入数据映射到深层特征（最后隐藏层的输出），然后映射到预测标签，如图1所示。

图1.卷积神经网络的典型框架。

在通用对象，场景或动作识别中，可能的测试样本的类别在训练集内，其也被称为近集识别。因此，预测标签在性能上占主导地位，而softmax损失能够直接解决分类问题。通过这种方式，标签预测（最后一个完全连接的层）就像一个线性分类器，并且深度学习的特征易于分离。

对于面部识别任务，深度学习的特征不仅需要分离，还需要具有辨别力。由于预先收集用于训练的所有可能的测试身份是不切实际的，因此CNN中的标签预测并不总是适用的。深度学习的特征需要具有辨别力和概括性，以便在没有标签预测的情况下识别新的看不见的类。判别力表征了紧凑的类内变化和可分离的类间差异，如图1所示。判别特征可以通过最近邻（NN）[7]或k近邻（k-NN）进行良好分类。）[9]算法，它们不一定依赖于标签预测。然而，softmax损失仅鼓励特征的可分离性。所得到的特征对于面部识别不是足够有效的。

为CNN中的判别特征学习构建高效的损失函数是非常重要的。因为随机梯度下降（SGD）[19]基于小批量优化CNN，这不能很好地反映深度特征的全局分布。由于训练集的规模庞大，在每次迭代中输入所有训练样本是不切实际的。作为替代方法，对比度损失[10,29]和三重态损失[27]分别构建图像对和三元组的损失函数。然而，与图像样本相比，训练对或三元组的数量急剧增加。它不可避免地导致收敛缓慢和不稳定。通过仔细选择图像对或三元组，可以部分地缓解该问题。但是它显着增加了计算复杂性并且训练过程变得不方便

在本文中，我们提出了一种新的损失函数，即中心损失，以有效地增强神经网络中深度学习特征的判别力。具体来说，我们学习一个中心（一个与特征具有相同维度的向量），用于每个类的深层特征。在训练过程中，我们同时更新中心并最小化深度特征与其相应的班级中心之间的距离。 CNN在softmax损失和中心损失的联合监督下进行训练，具有超参数以平衡两个监督信号。直观地说，softmax损失迫使不同类别的深层特征保持分开。中心损失有效地将同一级别的深层特征带到了他们的中心。通过联合监督，不仅扩大了班级间的特征差异，而且减少了班级内的特征变化。因此，可以极大地增强深度学习的特征的辨别力。我们的主要贡献总结如下。

我们提出了一种新的损失函数（称为中心损失），以最小化深部特征的类内距离。据我们所知，这是第一次尝试使用这种损失函数来帮助监督CNN的学习。通过对中心损失和softmax损失的联合监督，可以获得高度辨别的特征，用于鲁棒的人脸识别，这得到了我们的实验结果的支持。
我们证明了所提出的损失函数在CNN中很容易实现。我们的CNN型号可以训练，可以通过标准SGD直接优化。
我们在MegaFace Challenge [23]（具有100万个面孔的最大公共领域人脸数据库）的数据集上进行了大量实验，并在小型训练集的评估协议下设置了新的最新技术。我们还验证了我们在野外Labeled Faces（LFW）[15]和YouTube Faces（YTF）数据集[38]中的新方法的出色表现。

2 相关工作

通过深度学习进行人脸识别已经在这些年中取得了一系列突破[30,34,29,27,25,37]。将一对人脸图像映射到一定距离的想法从[6]开始。他们训练暹罗网络以推动相似性度量对于正对而言较小，对于负对则则较大。胡等人。 [13]学习非线性变换并产生判别性深度量，在正面和负面图像对之间有一个边界。有方法需要图像对作为输入。

最近，[34,31]通过挑战识别信号（softmax损失函数）来监督CNN中的学习过程，该信号将更丰富的身份相关信息带入深度学习的特征。之后，[29,37]采用联合识别 - 验证监督信号，导致更多的判别特征。 [32]通过向每个卷积层添加完全连接的层和损失函数来增强监督。 [27,25,21]证明了三重态损失的有效性。通过深嵌入，锚和正之间的距离最小化，而锚和负之间的距离最大化，直到满足边界。它们在LFW和YTF数据集中实现了最先进的性能。

3 建议的方法

在本节中，我们将详细介绍我们的方法。我们首先使用一个玩具示例直观地显示深层学习的特性的分布。受此分布的启发，我们提出了利用中心损耗来提高深层学习特征的识别能力，并进行了一些讨论。

表1.我们在玩具示例中使用的CNN架构，称为 $\mathbf{LeNets ++}$ 。一些卷积层之后是最大池化。

$5,32)/_{1,2}×2$ 表示2个级联卷积层，具有32个大小为5×5的滤波器，其中步幅和填充分别为1和2。

$2 /_{2,0}$ 表示网格为2×2的最大池化层，其中步幅和填充分别为2和0。

在 $\mathbf{LeNets}++$ 中，我们使用参数整流线性单元（ $\mathbf{PReLU}$ ）[12]作为非线性单元。

3.1 一个玩具的例子

在本节中，介绍了 $\mathbf{MNIST}$ [20]数据集上的玩具示例。我们将 $\mathbf{LeNets}$ [19]修改为更深更广的网络，但将最后一个隐藏层的输出数量减少到2（这意味着深度特征的维度为2）。因此，我们可以直接绘制 $\mathbf{2D}$ 表面上的特征以进行可视化。表1中给出了网络架构的更多细节 $\mathbf{softmax}$ 损失函数如下所示：
$L_s = - \sum^m_{i=1} \log\frac{e^{W^T_{y_i}x_i+b_{y_i}}}{\sum^n_{j=1}e^{w^T_jx_i+b_j}}$
在等式1中， $x_i \in \R^d$ 表示第 $i$ 个深部特征，属于第 $y$ 类。 $d$ 是要素尺寸。 $W_j \in \R^d$ 表示最后完全连接层中权重 $\in \R^{d×n}$ 的第 $j$ 列， $\in \R^n$ 是偏置项。小批量的大小和类的数量分别为 $m$ 和 $n$ 。我们省略了简化分析的偏见。（事实上，表现几乎没有差别）。

得到的二维深度特征绘制在图2中，以说明分布。由于最后一个完全连接的层就像一个线性分类器，不同类的深层特征由决策边界区分。从图2中我们可以观察到：i）在 $\mathbf{softmax}$ 损失的监督下，深度学习的特征是可分离的，并且ii）深度特征没有足够的辨别力，因为它们仍然显示出显着的类内变化。因此，不适合直接使用这些特征进行识别

图2。深入学习的特征在(a)训练集(b)测试集中的分布，在软最大损失的监督下，我们使用50K/10K的训练/测试分割。具有不同颜色的点表示来自不同类的特征。颜色最好看。

3.2 中心损失

因此，如何开发有效的损失函数来提高深度学习特征的判别力直观地说，最小化类内变化同时保持不同类的特征可分离是关键。为此，我们提出了中心损失函数，如公式2所示。
$L_c = \frac{1}{2} \sum^m_{i=1} ||x_i - c_{yi}||^2_2$
$c_{yi} \in \R^d$ 表示深部特征的第 $y_i$ 类中心。该公式有效地表征了类内变化。理想情况下，随着深层特征的改变，应该更新 $c_{y_i}$ 。换句话说，我们需要考虑整个训练集并在每次迭代中平均每个类的特征，这是低效的，甚至是不切实际的。因此，中心损失不能直接使用。这可能是迄今为止这种中心丢失从未在CNN中使用过的原因。

为了解决这个问题，我们进行了两次必要的修改。首先，我们不是根据整个训练集更新中心，而是基于小批量执行更新。在每次迭代中，通过平均相应类的特征来计算中心（在这种情况下，一些中心可能不会更新）。其次，为了避免由少量错误标记的样本引起的大扰动，我们使用标量 α 来控制中心的学习率。 $L_c$ 相对于 $x_i$ 的梯度和 $c_{y_i}$ 的更新方程计算如下：
$\frac{\partial L_c }{\partial x_i} = x_i - c_{y_i}$

$\Delta c_j = \frac{\sum^m_{i=1} \delta (y_i = j )·(c_j -x_i)}{1+\sum ^m_{i=1}\delta (y_i=j)}$

其中，如果满足条件，则δ(条件)=1，如果不满足条件，则δ(条件)=0。α在 $[0, 1]$ 中受限。我们采用软最大损失和中心损失的联合监督来训练CNN进行鉴别特征学习。公式5给出。
$$
L = L_s +\lambda L_c \

= - \sum^m_{i=1} \log\frac{e^{WT_{y_i}}x_i+b_{y_i}}{\sum^n_{j=1}e{w^T_jx_i+b_j}} + \frac{\lambda}{2} \sum^m_{i=1} ||x_i - c_{yi}||^2_2
$$
显然，受中心损失监督的CNN是可训练的，可以通过标准 SGD 进行优化。标量λ用于平衡两个损失函数。如果将λ设置为0，则可以将传统的 softmax 损失视为该联合监督的特例。在算法1中，我们通过联合监督来总结CNN中的学习细节。

算法1判别特征学习算法：

输入：训练数据 $\{\boldsymbol{x}_i\}$ 。卷积层中的初始化参数 $\theta _C$ 。参数 $W $ 和 $\{c_j|j =1,2,\cdots,n\}$ 分别在损耗层中。超参数 $\lambda$ ， $\alpha$ 和学习率 $\mu^t$ 。迭代次数 $\leftarrow0$ 。

输出：参数 $\theta_C$ 。

1：但没有收敛时，做如下操作

2： $\leftarrow t+1$

3：计算总损失： $L^t = L^t_S+L^t_C$

4：通过 $\frac{\partial L^t}{\partial x^t_i}$ 计算每个 $i$ 的反向传播误差 $ \frac{\partial L^t}{\partial x^t_i}=\frac{\partial L^t_S}{\partial x^t_i}+\frac{\partial L^t_C}{\partial x^t_i}$

5：通过 $W^{t+1}=W^t- \mu^t ·\frac{\partial L^t}{\partial W^t} = W^t-\mu^t·\frac{\partial L^t_S}{\partial W^t}$ 更新参数W.

6：用 $c^{t+1} =c^t_j -\alpha· \Delta c^t_j$ 更新每个 $j$ 的参数 $c_j$

7：用 $\theta^{t+1}_C = \theta^t_C -\mu^t \sum^m_i \frac{\partial L^t}{\partial x^t_i}·\frac{\partial x^t_i}{\partial \theta^t_c}$ 更新参数 $\theta_C$

8：结束while

我们还进行了实验来说明λ如何影响分布。图3显示不同的λ导致不同的深度特征分布。通过适当的λ，可以显着增强深度特征的辨别力。此外，特征在很宽的λ范围内具有辨别力。因此，联合监督有利于深度学习特征的辨别力，这对于人脸识别至关重要。

3.3 讨论

联合监督的必要性。如果我们仅使用softmax损失作为监督信号，则所得到的深度学习的特征将包含大的类内变化。另一方面，如果我们只通过中心损失来监督CNN，那么深度学习的特征和中心将降级为零（此时，中心损失非常小）。简单地使用它们中的任何一个都无法实现有区别的特征学习。因此，正如我们的实验所证实的那样，有必要将它们结合起来共同监督CNN。
与对比损失和三重损失相比。最近，还提出了对比度损失[29,37]和三重态损失[27]，以增强深度学习的面部特征的辨别力。然而，当构成来自训练集的样本对或样本三元组时，对比损失和三元组丢失都会遭受显着的数据扩展。我们的中心损失与softmax损失具有相同的要求，并且不需要训练样本的复杂重组。因此，我们对CNN的监督学习更有效且易于实施。此外，我们的损失函数更直接地针对类内紧致性的学习目标，这对于辨别特征学习非常有益。

图3.在softmax损失和中心损失的联合监督下深度学习的特征的分布。不同颜色的点表示来自不同类别的特征。不同的λ导致不同的深度特征分布 $\alpha = 0.5$ 。白点 $c_0,c_1,\cdots,c_9$ 表示10个深级特征中心，最佳颜色。

4 实验

必要的实现细节在4.1节中给出。然后我们研究了4.2节中参数λ和α的敏感性。在4.3和4.4节中，对几个公共领域人脸数据集（LFW [15]，YTF [38]和MegaFace Challenge [23]）进行了大量实验，以验证所提方法的有效性。

图4.用于人脸识别实验的CNN架构。采取联合监督。卷积和局部卷积层中的滤波器大小为3×3，步长为1，其次为PReLU [12]非线性单位。三个局部卷积层中的权重分别在4×4,2×2和1×1的区域中共享。卷积层的特征映射数为128，本地卷积层的特征映射数为256。最大池网格为2×2，步幅为2.第4汇集层和第3局部卷积层的输出连接为第1完全连接层的输入。完全连接层的输出尺寸为512.最好以彩色显示。

4.1 实施细节

预处理。 图像中的所有面部及其地标都是由最近提出的算法检测出来的[40]。我们使用5个地标（两只眼睛，鼻子和嘴角）进行相似性转换。当检测失败时，我们只是丢弃图像（如果它在训练集中），但如果它是测试图像则使用提供的标记。面被裁剪为112×96 RGB图像。遵循先前的约定，RGB图像中的每个像素（在[0; 255]中）通过减去127.5然后除以128来归一化。

训练数据。我们使用网络收集的培训数据，包括CASIAWebFace [39]，CACD2000 [4]，Celebrity + [22]。在删除具有出现在测试数据集中的身份的图像之后，它大致达到17,18个独特人物的0.7M图像。在4.4节中，我们仅使用0.49M训练数据，遵循小训练集的协议。水平翻转图像以进行数据增强。与[27]（200M），[34]（4M）和[25]（2M）相比，它是一个小规模的训练集。

CNN中的详细设置。我们使用Caffe [17]库实现了CNN模型并进行了修改。本节中的所有CNN模型都是相同的结构，详细信息如图4所示。为了公平比较，我们分别在softmax损失（模型A），softmax损失和对比损失（模型B）的监督下训练三种模型。），softmax损失和中心损失（模型C）。这些模型在两个GPU（TitanX）上以批量大小256进行训练。对于模型A和模型C，学习速率从0.1开始，在16K，24K迭代时除以10。完成28K迭代的完整培训，大约花费14个小时。对于模型B，我们发现它收敛得更慢。因此，我们将学习速率初始化为0.1，并将其切换为24K，36K迭代。总迭代次数为42K，成本为22小时。

测试中的详细设置。深度特征取自第一个FC层的输出。我们为每个图像及其水平翻转的图像提取特征，并将它们连接为表示。分数由PCA后两个特征的余弦距离计算。最近邻居[7]和阈值比较用于识别和验证任务。请注意，我们仅对所有测试使用单一模型

4.2 参数λ和α的实验

超参数λ支配类内变化，α控制模型C中心c的学习率。它们对我们的模型都是必不可少的。因此，我们进行了两个实验来研究这两个参数的敏感性。

图5. LFW数据集的面验证精度分别由（a）具有不同λ和固定α= 0：5的模型实现。（b）具有不同α和固定λ= 0：003的模型。

在第一个实验中，我们将α固定为0.5并将λ从0变为0.1以学习不同的模型。 LFW数据集上这些模型的验证精度如图5所示。很明显，简单地使用softmax损失（在这种情况下λ为0）不是一个好的选择，导致验证性能差。正确选择λ的值可以提高深度学习的特征的验证准确性。我们还观察到，我们模型的验证性能在很宽的λ范围内保持稳定。在第二个实验中，我们修正λ= 0：003并将α从0.01变为1以学习不同的模型。这些模型在LFW上的验证精度如图5所示。同样，我们模型的验证性能在很宽的α范围内基本保持稳定。

图6. LFW和YTF数据集中的一些人脸图像和视频。绿色帧中的面部图像对是正对（同一个人），而红色帧中的面部图像对是负对。每个图像中的白色边界框表示用于测试的面部

4.3 LFW和YTF数据集的实验

在这一部分中，我们在无约束环境中的两个着名的人脸识别基准，LFW和YTF数据集上评估我们的单一模型。它们是图像和视频中人脸识别的优秀基准。它们的一些例子如图6所示。我们的模型是在0.7M外部数据上训练的，没有人与LFW和YTF重叠。在本节中，我们将λ固定为0.003，对于模型C，α为0.5。

LFW数据集包含来自5749个不同身份的13,233个网络收集的图像，在姿势，表情和照明方面有很大的变化。遵循标准协议，不受限制的标记外部数据[14]。我们测试了6,000个面对，并在表2中报告了实验结果。

YTF数据集包含3,425个1,595个不同的人的视频，平均每人2.15个视频。剪辑持续时间从48帧到6,070帧不等，平均长度为181.3帧。同样，我们遵循不受限制的标记外部数据协议，并在表2中的5,000个视频对上报告结果。

根据表2中的结果，我们得到以下观察结果。首先，模型C（由softmax损失和中心损失共同监督）击败基线1（模型A，仅由softmax损失监督），显着提高了性能（LFW为97.37％，YTF为91.1％））至（LFW为99.28％，YTF为94.9％）。这表明联合监督可以显着提高深度学习特征的辨别力，体现中心损失的有效性。其次，与模型B（由softmax损失和对比损失的组合监督）相比，模型C实现了更好的性能（99.10％对比率99.28％和93.8％对比率94.9％）。这显示了中心损失优于设计的CNN中的对比损失的优点。最后，与两个数据库中的最新结果相比，所提出的模型C的结果（更少的训练数据和更简单的网络架构）始终位于基于这两个数据库的排名靠前的方法集中，表现优于表2中的大多数现有结果。这显示了所提出的CNN的优点。

表2. LFW和YTF数据集上不同方法的验证性能

4.4 MegaFace Challenge数据集的实验

MegaFace数据集最近作为测试基准发布。这是一个非常具有挑战性的数据集，旨在评估数百万规模的干扰物（不在测试集中的人）的人脸识别算法的性能。 MegaFace数据集包括图库集和探针集。画廊集包含来自690K不同个体的超过100万张图像，作为来自雅虎的Flickr照片[35]的子集。在这次挑战中使用的探针集是两个现有的数据库：Facescrub [24]和FGNet [1]。 Facescrub数据集是公开可用的数据集，包含530个独特个体的100K照片（55,742个男性图像和52,076个女性图像）。通过每个身份中的足够样本可以减少可能的偏差。 FGNet数据集是面部老化数据集，具有来自82个身份的1002个图像。每个身份都有不同年龄的多个脸部图像（范围从0到69）

在两种协议（大型或小型训练集）下有几种测试场景（识别，验证和姿势不变性）。如果训练集包含少于0.5M的图像和20K的主题，则定义为小。按照小训练集的协议，我们将训练图像的大小减小到0.49M，但保持身份的数量不变（即17,189个对象）。与Facescrub数据集重叠的图像将被丢弃。为了公平比较，我们还在不同监督信号下的小训练集上训练了三种CNN模型。得到的模型分别称为模型A-，模型B-和模型C-。按照4.3节中的相同设置，在模型C-中λ为0.003，α为0.5。我们使用提供的代码[23]进行实验，该代码仅在三个库（集合1）中的一个上测试我们的算法。

图7. MegaFace数据集中的一些示例面部图像，包括探针集和图库。该画廊由至少一个正确的图像和数百万的干扰物组成。由于每个主题和各种干扰因素的内部变化很大，识别和验证任务变得非常具有挑战性。

面部识别。面部识别旨在将给定的探测图像与图库中具有相同人物的探测图像相匹配。在此任务中，我们需要计算每个给定探测面图像和图库之间的相似性，其中包括至少一个与探测图像具有相同身份的图像。此外，画廊包含不同规模的干扰物，从100万到100万，导致测试中的挑战越来越大。更多细节可以在[23]中找到。在面部识别实验中，我们通过累积匹配特征（CMC）曲线呈现结果。它揭示了正确的画廊图像在top-K上排名的概率。结果如图8所示。

面部验证。对于面部验证，算法应该确定给定的一对图像是否是同一个人。生成探针和图库数据集之间的40亿个负对。我们计算真实接受率（TAR）和误接受率（FAR），并绘制图9中不同方法的接收器工作特性（ROC）曲线。

我们将我们的方法与许多现有方法进行比较，包括i）LBP [2]和JointBayes [5]，ii）我们的基线深度模型（模型A-和模型B-），以及iii）其他组提交的深度模型。从图8和图9中可以看出，手工工艺特征和浅模型表现不佳。随着越来越多的干扰者，他们的准确性急剧下降。此外，基于深度学习的方法比传统方法表现更好。但是，性能改进仍有很大空间。最后，在软最大损失和中心损失的联合监督下，模型C-实现了最佳结果，不仅超越了模型A-和模型B-，而且明显优于其他已发表的方法。

为了满足实际需求，人脸识别模型应该能够对数以百万计的干扰者实现高性能。在这种情况下，只有至少1M干扰物的Rank-1识别率和低误接受率（例如10-6）的验证率是非常有意义的[23]。我们报告了表3和表4中不同方法的实验结果。

图8.不同方法（在小训练集的协议下）的CMC曲线，其中（a）1M和（b）第1组的10K干扰物。其他方法的结果由MegaFace团队提供。

图9.不同方法（在小训练集的协议下）的ROC曲线，其中（a）1M和（b）第1组上的10K干扰物。其他方法的结果由MegaFace团队提供。

从这些结果我们得到以下观察结果。首先，毫不奇怪，模型C-在面部识别和验证任务中始终优于模型A-和模型B-，证实了设计的损失函数的优势。其次，在小训练集的评估协议下，所提出的模型C-在面部识别和验证任务中都取得了最好的结果，分别在面部识别和面部识别上分别优于5.97％和10.15％。此外，值得注意的是，模型C-甚至超过了使用大型训练集训练的一些模型（例如，北京Facecall公司）。最后，Google和NTechLAB的模型在大型训练集的协议下实现了最佳性能。请注意，他们的私人培训集（Google为500M，NTechLAB为18M）远大于我们（0.49M）

表3. MegaFace与1M干扰物的不同方法的鉴定率。

表4.使用1M干扰物的MegaFace上10-6 FAR的不同方法的验证TAR。

5 结论

在本文中，我们提出了一种新的损失函数，称为中心损失。通过将中心损失与softmax损失相结合以共同监督CNN的学习，可以高度增强深度学习的特征的辨别力以用于鲁棒的面部识别。对几个大规模面部基准的广泛实验已经令人信服地证明了所提出方法的有效性。

6 致谢

该项工作由中国科学院BIC对外合作项目（172644KYSB20160033,172644KYSB20150019），深圳研究计划（KQCX2015033117354153，JSGG20150925164740726，CXZZ20150930104115529和JCYJ20150925163005055），广东省研究计划（2014B050505017和2015B010129013），广东省自然科学基金（ 2014A030313688）和中国科学院人体智能 - 协同系统重点实验室。

参考

Fg-net老化数据库。在：http：//www.fgnet.rsunit.com/（2010）
Ahonen，T.，Hadid，A.，Pietikainen，M。：具有局部二元模式的面部描述：面部识别的应用。模式分析与机器智能，IEEE Transactions on 28（12），2037 {2041（2006）
Baccouche，M.，Mamalet，F.，Wolf，C.，Garcia，C.，Baskurt，A Sequential deep learning for human action recognition。在：人类行为理解，第29页{39。施普林格（2011年）
Chen，B.C.，Chen，C.S.，Hsu，W.H。：使用跨年龄参考编码与跨年龄名人数据集进行面部识别和检索。多媒体，IEEE Transactions on 17（6），804 {815（2015）
Chen，D.，Cao，X.，Wang，L.，Wen，F.，Sun，J。：重新审视贝叶斯面部：联合制定。在：计算机视觉{ECCV 2012，pp.566 {579。施普林格（2012）
Chopra，S.，Hadsell，R.，LeCun，Y。：有区别地学习相似性度量，应用于面部验证。在：计算机视觉和模式识别，2005年.CVPR 2005. IEEE计算机学会会议。第一卷。 1，pp.539 {546。 IEEE（2005）
封面，T.M.，Hart，P.E。：最近邻模式分类。信息理论，IEEE Transactions on 13（1），21 {27（1967）
Deng，J.，Dong，W.，Socher，R.，Li，L.J.，Li，K.，Fei-Fei，L。：Imagenet：一个大规模的分层图像数据库。在：计算机视觉和模式识别，2009年.CVPR 2009. IEEE会议。第248页{255。 IEEE（2009）
Fukunaga，K.，Narendra，P.M。：用于计算最近邻居的分支定界算法。计算机，IEEE Transactions on 100（7），750 {753（1975）
Hadsell，R.，Chopra，S.，LeCun，Y。：通过学习不变映射来降低维数。在：计算机视觉和模式识别，2006年IEEE计算机社会会议
上。第一卷。 2，pp.1735 {1742。 IEEE（2006）
He，K.，Zhang，X.，Ren，S.，Sun，J。：用于图像识别的深度残差学习。 arXiv preprint arXiv：1512.03385（2015）
He，K.，Zhang，X.，Ren，S.，Sun，J。：深入研究整流者：超越图像网络分类的人类水平表现。在：IEEE计算机视觉国际会议论文集。第1026页{1034（2015）
Hu，J.，Lu，J.，Tan，Y.P。：用于野外面部验证的判别性深度量学习。在：IEEE计算机视觉和模式识别会议论文集。第1875页{1882（2014）
Huang，G.B.，Learned-Miller，E。：疯狂的标记面孔：更新和新的报告程序。部门计算。 Sci。，Univ。马萨诸塞州阿默斯特，阿默斯特，马萨诸塞州，美国，科技。 Rep pp.14 {003（2014）
Huang，G.B.，Ramesh，M.，Berg，T.，Learned-Miller，E。：野外标记的面孔：用于在无约束环境中研究人脸识别的数据库。技术。代表，技术报告07-49，马萨诸塞大学阿默斯特分校（2007年）
Ji，S.，Xu，W.，Yang，M.，Yu，K。：用于人类行为识别的3d卷积神经网络。模式分析与机器智能，IEEE Transactions on 35（1），221 {231（2013）
Jia，Y.，Shelhamer，E.，Donahue，J.，Karayev，S.，Long，J.，Girshick，R.，Guadarrama，S.，Darrell，T。：Caffe：用于快速特征嵌入的卷积结构。在：ACM国际多媒体会议论文集。第675页{678。 ACM（2014）
Krizhevsky，A.，Sutskever，I.，Hinton，G.E。：使用深度卷积神经网络的Imagenet分类。在：神经信息处理系统的进展。
第1097页{1105（2012）
LeCun，Y.，Bottou，L.，Bengio，Y.，Haffner，P。：基于梯度的学习应用于
文件识别。 IEEE 86（11），2278 {2324（1998）的会议记录
LeCun，Y.，Cortes，C.，Burges，C.J。：手写数字的mnist数据库
（1998）
Liu，J.，Deng，Y.，Huang，C。：针对最终准确性：通过面部识别
深嵌入。 arXiv preprint arXiv：1506.07310（2015）
Liu，Z.，Luo，P.，Wang，X.，Tang，X。：在野外深刻学习面部属性。
在：IEEE计算机视觉国际会议论文集。第
3730 {3738（2015）
Miller，D.，Kemelmacher-Shlizerman，I.，Seitz，S.M。：Megaface：A million faces for
大规模认可。 arXiv preprint arXiv：1505.02108（2015）
Ng，H.W.，Winkler，S。：清理大型面部数据集的数据驱动方法。在：
图像处理（ICIP），2014年IEEE国际会议。第343页{347。
IEEE（2014）
Parkhi，O.M.，Vedaldi，A.，Zisserman，A。：深层识别。诉讼程序
英国机器视觉1（3），6（2015）
Russakovsky，O.，Deng，J.，Su，H.，Krause，J.，Satheesh，S.，Ma，S.，Huang，Z。，
Karpathy，A.，Khosla，A.，Bernstein，M.，et al。：Imagenet大规模视觉识别挑战。国际计算机视觉杂志115（3），211 {252（2015）
Schroff，F.，Kalenichenko，D.，Philbin，J。：Facenet：统一的面部嵌入
识别和聚类。在：IEEE计算机会议论文集
视觉和模式识别。第815页{823（2015）
Simonyan，K.，Zisserman，A。：非常深刻的大规模卷积网络
图像识别。 arXiv preprint arXiv：1409.1556（2014）
Sun，Y.，Chen，Y.，Wang，X.，Tang，X。：通过联合进行深度学习面部表征
身份验证。在：神经信息处理系统的进展。
pp.1988 {1996（2014）
Sun，Y。，Wang，X.，Tang，X。：面部验证的混合深度学习。在：IEEE计算机视觉国际会议论文集。第1489页{1496
（2013）
Sun，Y.，Wang，X.，Tang，X。：从预测中深入学习面部表征
10,000班。参见：IEEE计算机视觉与会议论文集
模式识别。第1891页{1898（2014）
Sun，Y.，Wang，X.，Tang，X。：深刻学习的面部表征是稀疏，有选择性和强大的。在：IEEE计算机视觉会议论文集
和模式识别。第2892页{2900（2015）
Szegedy，C.，Liu，W.，Jia，Y.，Sermanet，P.，Reed，S.，Anguelov，D.，Erhan，D。，
Vanhoucke，V.，Rabinovich，A。：进一步研究卷积。在：会议录
IEEE计算机视觉和模式识别会议。第1页{9
（2015）
Taigman，Y.，Yang，M.，Ranzato，M.，Wolf，L。：Deepface：在面部验证中弥合人类绩效的差距。在：IEEE会议论文集
计算机视觉与模式识别。 pp.1701 {1708（2014）
Thomee，B.，Shamma，D.A.，Friedland，G.，Elizalde，B.，Ni，K.，Poland，D.，Borth，
D.，Li，L.J。：多媒体研究中的新数据和新挑战。的arXiv
preprint arXiv：1503.01817（2015）
Wang，L.，Qiao，Y.，Tang，X。：用轨迹汇集的深卷积描述符进行动作识别。在：IEEE计算机视觉和模式识别会议论文集。第4305页{4314（2015）
Wen，Y.，Li，Z.，Qiao，Y。：用于年龄不变人脸识别的潜在因子引导卷积神经网络。在：IEEE计算机视觉和模式识别会议论文集。第4893页{4901（2016）
Wolf，L.，Hassner，T.，Maoz，I。：在具有匹配背景相似性的无约束视频中的面部识别。在：计算机视觉和模式识别（CVPR），2011年IEEE会议。第529页{534。 IEEE（2011）
Yi，D.，Lei，Z.，Liao，S.，Li，S.Z。：从头开始学习面部表征。 arXiv preprint arXiv：1411.7923（2014）
Zhang，K.，Zhang，Z.，Li，Z.，Qiao，Y。：使用多任务级联卷积网络的联合面部检测和对准。 arXiv preprint arXiv：1604.02878（2016）
Zhou，B.，Khosla，A.，Lapedriza，A.，Oliva，A.，Torralba，A。：物体探测器出现在深度场景中。 arXiv preprint arXiv：1412.6856（2014）
Zhou，B.，Lapedriza，A.，Xiao，J.，Torralba，A.，Oliva，A。：使用场所数据库学习场景识别的深层特征。在：神经信息处理系统的进展。第487页{495（2014）

你可能感兴趣的:(人脸识别)

人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
基于OpenCV-python的人脸识别系统 transuperb 完整代码 opencv python 人工智能
importsysimportosimporttkinterastkfromtkinter.ttkimportStyleimportnumpyasnpimportcv2fromPILimportImageTk,ImageDraw,ImageFontfrompanel.models.tabulatorimportthemefromModelimport*fromtkinterimportttk,fi
零基础学 OpenCV + Python 图像处理：手把手带你做人脸识别（附代码+典型案例）猫头虎 #Python专栏 opencv python 图像处理计算机视觉 AIGC AI编程人工智能
零基础学OpenCV+Python图像处理：手把手带你做人脸识别（附代码+典型案例）关键词：opencv-python、opencv图像处理、opencv人脸识别代码python、python安装opencv库亮点提示：本文面向零基础读者，手把手教你从环境搭建到实战应用，一步步深入，让你快速掌握OpenCV+Python图像处理与人脸识别技术。文中附带完整示例代码与典型案例，可直接复制、运行与深度
Camera相机人脸识别系列专题分析之十三：人脸特征检测FFD算法之libcvface_api.so人脸识别检测流程详解一起搞IT吧数码相机算法计算机视觉 android 人工智能图像处理
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：这一篇我们开始讲：Camera相机人脸识别系列专题分析之十三：人脸特征检测FFD算法之libcvface_api.so人脸识别检测流程详解目录一、背景二、：FFD算法libcvface_api.so人脸识别检测流程详解2.1：FFD初始化2.2：FFD人脸识别检测process2.3：setFdAlgoInfo2.4：FFD卸载
Camera相机人脸识别系列专题分析之四：Camera相机领域人脸识别和人脸属性检测介绍一起搞IT吧人工智能计算机视觉图像处理 android
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：Camera相机人脸识别系列专题分析之三：一张图片的人脸识别过程原理这一篇我们开始讲：Camera相机人脸识别系列专题分析之四：Camera相机领域人脸识别和人脸属性检测介绍目录一、背景二、：Camera相机领域人脸识别2.1：影像相关基础知识2.1.1pipeline简介2.1.2Raw阈图像处理2.2：Camera相机人脸识别2.3：
Camera相机人脸识别系列专题分析之七：MTK ISP6S平台FDNode流程FdNodeImp.cpp调试手段及客制化dump，跳帧，开关，使能，异步控制等等一起搞IT吧数码相机人工智能图像处理 android
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：Camera相机人脸识别系列专题分析之六：MTKISP6S平台人脸识别fdnode流程FdNodeImp.cpp详解这一篇我们开始讲：Camera相机人脸识别系列专题分析之七：MTKISP6S平台FDNode流程FdNodeImp.cpp调试手段及客制化dump，跳帧，开关，使能，异步控制等等目录一、背景二、：FDNode客制化2.1：F
Camera相机人脸识别系列专题分析之十四：人脸特征检测FFD算法之libcvface_api.so人脸属性(年龄，性别，肤色，微笑，种族等)检测流程详解一起搞IT吧数码相机算法计算机视觉 android 人工智能图像处理
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：这一篇我们开始讲：Camera相机人脸识别系列专题分析之十四：人脸特征检测FFD算法之libcvface_api.so人脸属性(年龄，性别，肤色，微笑，种族等)检测流程详解目录一、背景二、：FFD算法libcvface_api.so人脸属性检测流程详解2.1：FFD初始化阶段2.2：FFD人脸属性检测process2.3：fd_algo_
深度学习在人脸识别中的应用及Python实现 loop_syntax648 机器学习-深度学习
人脸识别是一种通过计算机技术识别和验证人脸的方法，近年来深度学习在人脸识别领域取得了显著的进展。深度学习模型能够学习和提取人脸图像中的高级特征，从而实现准确的人脸识别。本文将介绍深度学习在人脸识别中的应用，并提供Python实现的源代码。深度学习模型通常基于卷积神经网络（ConvolutionalNeuralNetwork，CNN）进行人脸识别。CNN是一种专门用于处理图像和视觉数据的神经网络模型
人脸识别python实现源码（功能丰富）张沙姗
人脸识别python实现源码（功能丰富）去发现同类优质开源项目:https://gitcode.com/此仓库提供了一组基于Python的人脸识别源码，利用dlib库的先进面部识别功能构建而成，并具备深度学习特性。以下是对该资源的详细介绍：功能特点在Wild标记的LabeledFaces数据集上实现99.38％的准确度。提供简单的命令行工具，支持以下功能：在图像文件夹中找到出现的所有面孔。获取每个
python实现面部特效_【AI美颜算法】300行Python实现基于人脸特征的美颜算法
先上效果图：AI美颜人类一直是一个看脸的物种，人人都希望可以变得更美是无可争议的，而美颜类应用的出现拯救了所有人，从此人类进入了美(照)颜(骗)时代。。。。。每次写技术blog都要写一堆废话引言，现在懒得写，大概就是美颜很重要，美女主播靠它活，没了它大部分妹子不敢发朋友圈blabla。美颜算法的基础是人脸识别技术，市面上的美颜应用普遍使用了CV科技类公司的人脸识别（特征点提取）接口：MeituKi
计算机视觉入门：OpenCV 人脸识别与手势控制系统全解析高山仰星计算机视觉 opencv 人工智能
1.引言计算机视觉（ComputerVision）是人工智能的重要领域，而OpenCV（OpenSourceComputerVisionLibrary）是最常用的开源计算机视觉库。它广泛用于图像处理、人脸识别、目标检测、手势识别等多个应用场景。本教程将详细介绍OpenCV的核心概念，并通过人脸识别的门禁系统和手势识别的智能控制系统这两个案例，帮助你掌握OpenCV的实际应用。2.OpenCV介绍与
python深度学习毕业设计项目选题汇总 kooerr 毕业设计 python 毕设
文章目录1前言1.1选题注意事项1.1.1难度怎么把控？1.1.2题目名称怎么取？1.2开题选题推荐1.2.1起因1.2.2核心-如何避坑(重中之重)1.2.3怎么办呢？2选题概览3项目概览题目1:图像隐写算法研究与实现题目2:Django股价预测可视化系统题目3:大数据招聘数据可视化系统题目4:深度学习车道线检测题目5:深度学习交通车流量计数系统题目6:深度学习遮挡下的人脸识别题目7:深度学习照
《计算机科学与应用》遮挡人脸识别技术综述 hans汉斯深度学习人工智能计算机视觉目标跟踪算法人机交互机器学习
作者信息王晓彤,韩金颖*,王俊兴,李振乾：北华航天工业学院计算机学院，河北廊坊基金信息北华航天工业学院2023年硕士研究生科研创新项目(项目号：YKY-2023-32)导读人脸识别作为一种非接触、便捷的生物识别技术，在安防、金融、身份认证等领域得到广泛应用。然而，面部遮挡会导致关键特征丢失，严重影响识别性能，成为该领域的重要挑战。针对这一问题，当前研究主要从两个方向展开：一是改进人脸识别算法本身，
班车出行服务的功能特点和技术选型实战避坑事项 Alex艾力的IT数字空间 IT类项目管理经验及方法论 java 开发语言 python 架构小程序 uni-app 图像处理
一、员工移动端功能特点实时车辆定位与到站预测员工可通过APP查看班车实时位置、预计到达时间，支持地图导航功能，减少候车焦虑。部分系统集成GPS/北斗定位和电子围栏技术，车辆偏离路线时自动报警。预约与票务管理支持长期预约、临时改签、次票/月票购买，部分系统提供“亲属购票”功能。支付方式多样化，包括微信/支付宝、企业补贴扣款、数字人民币等。身份验证与安全管控支持二维码扫码、人脸识别、刷卡等多种验证方式
【python实用小脚本-109】人脸识别系统实战：从基础实现到性能优化 Kyln.Wu Python python 开发语言 opencv
一、代码功能解析1.核心功能概述本代码实现了一个基于face_recognition库的人脸识别系统，能够从已知人脸库中识别出输入图像中的人物身份，主要功能包括：已知人脸特征编码存储未知图像人脸检测与编码人脸特征匹配与身份识别结果可视化展示2.关键模块深度解析(1)已知人脸编码模块defget_encoded_faces():encoded={}fordirpath,dnames,fnamesin
深度学习笔记16-VGG-16算法-Pytorch实现人脸识别 boooo_hhh 深度学习机器学习 pytorch
目录前言一、前期准备1.设置GPU2.导入数据3.划分数据集二、调用官方的VGG-16模型三、训练模型1.编写训练函数2.编写测试函数3.设置动态学习率4.正式训练四、结果可视化1.Loss与Accuracy图2.指定图片进行预测3.模型评估五、总结前言本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、前期准备1.设置GPU如果设备上支持GPU就使用GPU,否则使用CPUimport
手把手教你用Python实现高可用人脸识别系统：从理论到实战全解析 AI_DL_CODE AI 赋能：Python 人工智能应用实战人工智能基础：AI基石 python 人脸识别人工智能 OpenCV 计算机视觉特征提取图像识别
摘要：本博文围绕计算机视觉领域热门的人脸识别技术，深入阐述如何基于Python结合OpenCV、face_recognition等开源库，构建一个完整且实用的人脸识别系统。从环境搭建、数据采集与预处理，到核心算法实现、多场景应用，再到系统优化与挑战分析，均进行了细致讲解，并辅以丰富代码示例与运行效果展示。旨在帮助读者深入理解人脸识别技术原理，掌握实际开发技能，同时为进一步优化和拓展系统功能提供思路
【图像处理入门】10. 计算机视觉基础：从人脸识别到文档矫正小米玄戒Andrew 图像处理：从入门到专家图像处理计算机视觉人工智能 CV 算法 opencv python
摘要本文聚焦计算机视觉经典应用场景，带你实现人脸识别、文档扫描矫正和目标跟踪三大项目。通过Haar级联分类器、透视变换、CamShift算法等技术，结合OpenCV实战代码，掌握从特征检测到图像几何变换的完整流程，将图像处理知识升级为计算机视觉工程能力。一、项目1：基于Haar级联的人脸识别系统1.技术原理Haar级联分类器通过级联多个简单的Haar特征强分类器，快速检测图像中的目标（如人脸）。核
基于YOLOv8的人脸识别与跟踪系统设计与实现 YOLO实战营 YOLO ui 目标检测目标跟踪深度学习
1.项目背景与意义随着智能安防、智能监控、人机交互等领域的快速发展，人脸识别与跟踪技术受到了广泛关注。它不仅在安防监控系统中用于身份认证与异常检测，也在智能门禁、自动考勤和营销系统中发挥重要作用。传统的人脸检测多依赖Haar级联或基于特征的检测方法，准确率和鲁棒性有限。深度学习方法，尤其是YOLOv8等先进目标检测框架，实现了实时且高准确度的人脸检测。同时，结合人脸识别（身份验证）和多目标跟踪，可
【OpenCV人脸识别】基于深度学习（Dlib+HOG特征）的人脸识别——QT（C++）+Linux
1.人脸检测工具概述1.DlibDlib是一个开源的C++机器学习和计算机视觉库，用于解决多种任务，包括图像处理、计算机视觉、机器学习、数据分析等。Dlib提供了一系列工具和算法，可用于开发各种应用，从人脸检测和识别，到对象检测、形状预测、图像分类等。以下是Dlib主要的特点和功能：人脸检测和识别：Dlib提供了高性能的人脸检测器，基于HOG特征和深度学习模型。它还包括面部关键点检测和人脸识别的功
dlib库快速构建人脸识别
概念：引入自2002年以来，DavisKing一直是dlib的主要作者。dlib为每个类和函数提供了完整的文档说明。同时还提供了debug模式，打开debug模式后，开发者能够调试代码，查看变量和对象的值，快速定位错误点。不依赖第三方库，就是这么高傲。因此我们无需安装和配置，并且在windows，MacOS,Linux系统上轻松驾驭。截止2022年5月12日，github上已有个11.1Kstar
鸿蒙开发实战之Function Flow Runtime Kit优化美颜相机AI流水线 harmonyos-next
一、架构设计突破针对美颜相机复杂的AI处理流程，FunctionFlowRuntimeKit实现三大创新：异构计算流水线CPU+GPU+NPU三端任务自动分配人脸识别→皮肤检测→背景分割→滤镜渲染四阶段并行智能调度策略二、核心代码实现importfunctionFlowfrom'@ohos.functionFlowKit';//定义处理节点constnodes=[{id:'face_detect'
Python编程 - 基于OpenCV实现人脸识别（实践篇）爬虫+人脸识别_python-opencv人脸识别 m0_61418142 程序员 python opencv 爬虫
最后Python崛起并且风靡，因为优点多、应用领域广、被大牛们认可。学习Python门槛很低，但它的晋级路线很多，通过它你能进入机器学习、数据挖掘、大数据，CS等更加高级的领域。Python可以做网络应用，可以做科学计算，数据分析，可以做网络爬虫，可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多，你需要学好基础，再选择明确的方向。这里给大家分享一份全套的Pytho
《智慧票务系统：开启便捷票务新时代》侯炯智慧城市票务系统智慧景区
一、智慧票务系统概述智慧票务系统作为现代票务管理的重要工具，具有显著的特点。便捷性：游客可以通过多种方式购票，如手机购票、自助售票机购票等，无需长时间排队等待。例如，在景区中，游客可以通过手机轻松购买门票，避免了在景区门口排队购票的烦恼。同时，一些智慧票务系统还支持人脸识别、二维码扫描等快速入园方式，进一步提高了游客的入园效率。高效性：智慧票务系统采用自动化技术，能够快速处理票务信息，大大提高了票
商业版授权相亲交友软件开发打造同城社交软件前端后端小程序数据库程序员
核心功能设计同城社交功能精准匹配：基于LBS定位和兴趣标签（如健身、剧本杀），结合AI算法推荐同城用户。动态距离显示：在用户资料中显示实时距离（如“1.2公里”），增强真实感。同城群聊：支持按城市或兴趣创建群组，促进本地用户交流。相亲交友功能实名认证：采用身份证+人脸识别双重验证，确保用户真实性。智能推荐：基于大数据分析和机器学习，根据用户偏好（如年龄、职业、兴趣）进行匹配。多维度筛选：支持按地理
物联网标识技术实验室解决方案武汉唯众智创物联网物联网标识技术实验室物联网标识物联网标识技术物联网实验室物联网实训室物联网标识技术实训室
一、实验室建设目标与意义1.1培养物联网专业人才物联网标识技术实验室的建设旨在为学生提供一个实践平台，以满足物联网专业人才培养的需求。物联网作为新兴技术领域，对人才的实践能力要求极高。通过配备条码扫码枪、二维码扫描设备、RFID阅读器、RFID标签、人脸识别门禁一体机等实验设备，实验室能够支持物联网标识技术、嵌入式系统开发、物联网信息安全技术、物联网系统集成开发、物联网工程设计与实施等多门课程的实
人脸识别技术应用备案材料揭秘算法备案人脸识别备案人脸识别技术应用备案人脸识别技术应用备案流程人脸识别技术应用备案材料人脸识别技术应用备案代办人脸识别技术应用安全管理办法人脸识别人脸识别技术
宝子们！今天来唠唠超重要的「人脸识别备案」那些事儿～不管是开公司还是搞创业，只要碰了人脸识别技术，这篇干货必须码住！不然小心被罚到流泪一、人脸识别技术应用备案红线预警！哪些情况必须备案？▪️存了10万+人脸信息？30天内必须冲去备案！▪️技术用途一变，或者不玩了要注销，也得立刻更新信息！二、人脸识别技术应用备案材料揭秘准备这些，一次过审！1️⃣企业：营业执照+法人身份证▫️2️⃣技术说明书▫️应用
基于机器学习的多模态影像分类研究 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
多模态影像，机器学习，分类，深度学习，计算机视觉1.背景介绍随着计算机视觉技术的飞速发展，多模态影像分类在各个领域得到了广泛应用，例如医疗诊断、自动驾驶、人脸识别等。多模态影像是指由多种传感器获取的图像数据，例如可见光图像、红外图像、热成像等。相比单模态影像，多模态影像包含更丰富的特征信息，能够更准确地描述目标的属性和状态。传统的影像分类方法主要依赖于手工提取的特征，而机器学习方法能够自动学习图像
Camera相机人脸识别系列专题分析之十二：人脸特征检测FFD算法之libvega_face.so数据结构详解一起搞IT吧数码相机 android 人工智能图像处理计算机视觉算法数据结构
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：Camera相机人脸识别系列专题分析之十一：人脸特征检测FFD算法之低功耗libvega_face.so人脸属性(年龄，性别，肤色，微笑，种族等)检测流程详解这一篇我们开始讲：Camera相机人脸识别系列专题分析之十二：人脸特征检测FFD算法之libvega_face.so数据结构详解目录一、背景二、：FFD算法之libvega_face
k230人脸识别阿容123456 k230 python 开发语言 opencv 计算机视觉视觉检测
fromlibs.PipeLineimportPipeLine,ScopedTiming#Pipeline是集成了摄像头、LCD屏幕显示等多媒体功能的模块，大大简化了调用摄像头和显示相关的操作#PipelineisamodulethatintegratesmultimediafunctionslikecameraandLCDdisplay,greatlysimplifyingcameraanddi
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方