傻傻的小狗子

使用多任务级联卷积网络进行人脸检测和对齐（MTCNN翻译）

使用多任务级联卷积网络进行人脸检测和对齐

摘要

在无约束的环境下，由于各种各样的姿势、光线强度以及面部遮挡等原因，人脸检测和对齐是一个巨大的挑战。最近的研究表明，深度学习的方法在这两个任务上的表现令人印象深刻。在本文中，我们提出了一个深入的级联多任务框架，通过它们之间内在的相互关系去提高它们的性能。值得一提的是，我们的框架采用级联结构伴随着精心设计的深度卷积网络的三个阶段，以粗到细的方式去预测人脸和特征点的位置。除此之外，在学习的过程中，我们提出了一种新的在线硬样本挖掘方法，能够在没有手动选择样本的情况下自动提升性能。在FDDB和WIDER FACE为基准的人脸识别挑战和以ALFW为基准的人脸对齐挑战中，我们的方法在保持实时性能的同时，达到了极高的精确度并且超过了现在最新的技术。

关键字：人脸检测人脸对齐级联卷积神经网络

一、绪论

人脸检测和对齐是很多人脸应用的基础，如人脸识别和表情分析。然而，人脸在遮挡、姿态变换以及极端光照的巨大变化下，给这些任务在实际应用中带来了巨大的挑战。

Viola和Jones[2]提出的级联人脸检测算法利用类haar特征和adaboost来训练级联分类器，取得了良好的性能和实时性。然而，相当多的工作[1, 3, 4]表明该检测器在实际应用中的性能会显著降级，即使在具有更高级特征和分类器的情况下，人脸的视觉变化也会变得更大。在级联结构的基础上，[5, 6, 7]引入了用于人脸检测的可变模型(DPM)，取得了显著的性能。然而，它们需要很高的计算开销，并且在训练阶段通常需要繁琐的标注。近年来，卷积神经网络(CNN)在各种计算机视觉任务中取得了显著进步，例如图像分类[9]和人脸识别[10]。由于受到CNN在计算机视觉任务中取得良好表现的启发，所以近年来提出了一些基于CNN面部检测的方法。Yang et al. [11]训练了用于面部属性识别的深度卷积神经网络，以便于在面部区域获得高区分度，从而进一步产生面部的候选窗口。但是由于其复杂的CNN结构，这种方法在实践中非常耗时。Li et al. [19]使用级联的CNN进行人脸检测，但是它需要在人脸检测中进行边界框校准，伴随着额外的计算开销，并且忽略了人脸标志定位和边界框回归之间的内在关联。

人脸对齐也同样引起了广泛的关注，基于回归的方法[12,13,16]和模板拟合的方法[14,15,7]是两个流行的类别。最近， Zhang et al. [22]提出了在使用面部属性识别作为辅助任务的基础上利用深度卷积神经网络提高面部对齐的性能。

然而，大多数可用的面部检测和面部对齐的方法都忽略了这两个任务之间的固有关联。尽管已经存在了几种尝试共同解决它们的作品，但是这些作品然而存在局限性。例如，Chen et al. [18] 使用像素值差的特征与随机森林联合进行对准和检测，但是其使用的手动特征限制了这个方法的性能。Zhang et al. [20]使用多任务CNN来提高多视图中人脸检测的准确性，但是其检测精度收到弱人脸检测器产生的初始检测窗口的限制。

另一方面，在训练过程中，挖掘硬样本对于增强检测器的能力至关重要。但是，传统的硬样本挖掘通常以离线的方式执行，这大大增加了手动操作。所以期望能够设计出一种用于面部检测和对准的在线硬样本挖掘策略，该策略能够自动适用于当前的训练过程。

在本文中，我们提出了一个新框架，通过多任务学习使用统一级联的CNN去集成这两个任务。这个CNN框架包含三个阶段。在第一阶段，它会通过浅层的CNN快速生成候选窗口。然后，它将通过更复杂的CNN来优化窗口以拒绝大量非面部窗口。最后，手那个用功能更强大的CNN细化结果并输出面部标志位置。

Fig. 1

Fig. 1.我们级联框架的管道包含三个阶段任务的深度卷积网络。首先，通过快速的提案网络(P-Net)产生候选窗口。之后，在下一阶段通过优化网络(R-Net)优化这些候选对象。在第三阶段，输出网络(O-Net)产生最终的边界框和面部标志位。

多亏了这种多任务学习框架，该算法的性能得以显著提升。本文的主要贡献概括如下：

(1)我们提出了一个新的基于级联CNN的联合人脸检测和对齐的框架，并精心设计了轻量级CNN框架以实现实时性能。

(2)我们提出了一种有效的在线硬样本挖掘方法以提高其性能。

(3)在具有挑战性的基准上进行了广泛的实验，以证明该方法的显著能行，并且能够改进与最先技术相比的面部检测和对齐任务。

二、方法

在本节中，我们将描述我们人脸检测和对齐的联合方法。

A. Overall Framework

我们的方法整体流程如Fig. 1所示。给定图像，我们首先将其调整为不同的比例以构建图片金字塔，以下内容是三个输入阶段的级联框架：

Stage 1:我们利用被称之为全卷积网络的提案网络(P-Net)，以[29]类似的方式去获取候选窗口和它们的边界框回归向量。然后我们使用估计的边界框回归向量来校准候选人。接着，我们利用非最大抑制(NMS)来合并高度重叠的候选人。

Stage 2:所有候选人都送入另一个名为“优化”的CNN网络(R-Net)，进一步拒绝大量错误候选者，使用边界框回归进行校准，再与NMS候选者合并。

Stage 3:这个阶段类似于第二阶段，但是在这个阶段，我们旨在更详细的描述面孔。尤其是，网络将输出五个面部标志的位置。

B. CNN Architectures

在[19]中，已经为面部检测设计了多个CNN。然而，我们注意到其性能可能受到以下事实限制：

(1)一些过滤器缺乏权重的多样性可能会限制它们产生区分性描述。

(2)与其它多类别的目标检测和分类任务相比，人脸检测是一个具有挑战性的二进制分类任务，因此它可能需要用较少的过滤器数量去获取在它们之中更多的区分度。为此，我们减少了过滤器的数量，将5x5过滤器更改为3x3过滤器以较少计算量，同时增加深度以获得更好的性能。用这些改善与[19]中之前的架构相比，我们可以用更少的运行时间获得更好的性能(结果如Table 1所示。为了公平比较，我们将相同的数据用于两种方法)。我们的CNN架构如Fig. 2所示。

C. Training

我们利用三项任务来训练CNN检测器：人脸/非人脸分类，边界框回归和面部标志本地化。

(1)人脸分类：将学习目标表述为二分类问题。对于每个样本 $^{}$ $x_{i}$ ，我们使用交叉熵损失：

其中 $p_{i}$ 表示网络产生的概率，表明一个样本就是一张脸。符号 $y_{i}^{det}\in \left \{ 0,1 \right \}$ 表示真实标签。

(2)边界框回归：对每个候选窗口，我们预测它与最接近真实情况之间的偏移量(即，边界框的左上角，高度和宽度)。学习目标被称之为回归问题，我们采用每个样本 $^{}$ $x_{i}$ 的欧几里得损失：

其中 $\widehat{y}_{i}^{box}$ 是从网络中获得的回归目标， $y_{i}^{box}$ 是真实坐标。这里有四个坐标，包含左上角，高度和宽度，因此 $y_{i}^{box}\in R^{4}$ 。

(3)面部标志定位：类似于边界框回归任务，将面部标志检测公式化为回归问题，我们将欧几里得损失降至最低：

其中 $\widehat{y}_{i}^{landmark}$ 是从网络中获得的面部标志坐标， $y_{i}^{landmark}$ 是真实坐标。这里有五个面部标志，包括左眼，右眼，鼻子，左嘴角和右嘴角，因此 $y_{i}^{landmark}\in R^{4}$ 。

(4)多来源训练：由于我们在每个CNN中采用不同的任务，因此在学习过程中有不同类型的训练图像，例如面部，非面部和部分对齐的面部。在这种情况下，一些损失函数(i.e., Eq. (1)-(3))将不被使用。例如说，对于背景区域的样本，我们只计算 $L_{i}^{det}$ ，将其它两个损失值设为0。这可以直接通过样本类型指示器来实现。然后总体学习目标可以表述为：

其中N是训练样本数量。 $\alpha _{j}$ 表示任务的重要性。我们在P-Net和R-Net中使用 $\left (\alpha _{det}= 1,\alpha _{box}= 0.5,\alpha _{landmark}= 0.5 \right )$ ，在O-Net中使用 $\left (\alpha _{det}= 1,\alpha _{box}= 0.5,\alpha _{landmark}= 1 \right )$ 来获得更准确的面部标志定位。 $\beta _{i}^{j}\in \left \{ 0,1 \right \}$ 是样本类型指示器。在这种情况下，采用自然的随机梯度下降来训练CNN。

(5)在线硬样本挖掘：不同于先进行传统硬样本挖掘，后训练原始分类器的方法，我们在人脸分类任务中进行在线硬样本挖掘以适应训练过程。

尤其是，在每个小批量中，我们对所有样本在前向传播阶段计算出的损耗进行排序，并选择其中的前70%作为硬样本。然后，我们仅在后向传播阶段从硬样本中计算梯度。这意味着我们忽略了简单的样本，这些样本在训练时对增强检测器的帮助较小。实验表明，这种策略无需手动选择样本即可获得更好的性能。第三节中证明了其有效性。

三、实验

在本节中，我们首先评估提出的硬样本挖掘策略的有效性。然后，我们将人脸检测和对齐与人脸检测数据集中最先进的方法进行对比，包含FDDB[25]，WIDER FACE[24]和带标记的野外环境AFLW[8]。FDDB数据集包含2,845张图像，5,171张人脸。WIDER FACE数据集由32,203张图像中的393,703个带标签的面部边界框组成，其中50％根据图像的难度分为三个子集进行测试，40％用于训练，其余用于验证。AFLW包含24,386张面部的标签注释，并且我们使用与[22]相同的测试子集。最后，我们评估人脸检测器的计算效率。

A. Training Data

由于我们同时使用人脸检测和对齐，因此我们在训练过程中使用四种不同类型的数据注释：

(i)负样本：与真实人脸联合相交(IoU)小于0.3的区域。

(ii)正样本：与真实人脸相交高于0.65.

(iii)局部样本：与真实人脸相交，IoU在0.4和0.65之间。

(iv)标签样本：人脸5个标志的标签位置。

负样本和正样本用于人脸分类任务，正样本和局部样本用于边界框回归，标签样本用于人脸标志的定位。每个网络的训练数据描述如下：

(1)P-Net：我们对WIDER FACE[24]进行了随机裁切，以收集正样本，负样本和局部样本。然后，我们将CelebA[23]中的人脸裁剪为标签样本。

(2)R-Net：在从CelebA[23]中检测标签人脸的时候，我们使用框架中的第一阶段从WIDER FACE[24]检测人脸，以收集正样本，负样本和局部样本。

(3)O-Net：类似于R-Net收集数据，但我们使用框架的前两个阶段来检测人脸。

B. The effectiveness of online hard sample mining

为了评估提出的在线硬样本挖掘策略的贡献，我们训练了两个O-Net(有和没有在线硬样本挖掘)并比较了它们的损失曲线。为了更直接地进行比较，我们仅训练O-Net进行人脸分类任务。在这两个O-Net中，包括网络初始化在内的所有训练参数都相同。为了更轻松地比较它们，我们使用固定学习率。Fig. 3 (a)显示了两种不同训练方式的损耗曲线。很明显，硬样本挖掘有利于提高性能。

C. The effectiveness of joint detection and alignment

为了评估联合检测和对齐的贡献，我们评估了FDDB(具有相同的P-Net和R-Net，以进行公平比较)上两个不同的O-Net(联合面部标识回归任务和不联合)的性能。我们还比较了这两个O-Net中边界框回归的性能。Fig. 3 (b) 表明联合面部标识任务学习对于人脸分类和边界框回归任务都是有益的。

D. Evaluation on face detection

为了评估我们的人脸检测方法的性能，我们将我们的方法与FDDB中 [1,5, 6, 11, 18, 19, 26, 27, 28, 29]和WIDER FACE中[1, 24, 11]最先进的方法进行了比较。Fig. 4(a)-(d)表明，我们的方法在两个基准测试中均以较大的优势胜过先前所有的方法。我们还评估了一些具有挑战性照片的方法。

E. Evaluation on face alignment

在这一部分中，我们将我们的方法与以下方法的人脸对齐性能进行了比较：RCPR [12], TSPM[7], Luxand face SDK [17], ESR [13], CDM [15], SDM [21], TCDCN [22]。在测试阶段，我们的方法无法检测到13张图像。因此，我们裁剪了这13张图像的中心区域，并将它们作为O-Net的输入。通过估计的标志位和真实标志位之间的距离测量平均误差，并相对于眼间距离进行归一化。 Fig. 4 (e)表明我们的方法在性能上优于所有最新方法。

F. Runtime efficiency

给定级联结构，我们的方法可以在联合人脸检测和对齐中实现非常快的速度。在2.60GHz CPU上达到16fps，在GPU (Nvidia Titan Black)上达到99fps。目前，我们的实现基于未优化的MATLAB代码。

四、结论

在本文中，我们提出了一种基于多任务级联CNN的框架，用于联合人脸检测和对齐。实验结果表明，在保持实时性能的同时，我们的方法在多个具有挑战性的基准(包括用于人脸检测的FDDB和WIDER FACE，以及用于人脸对齐的AFLW)上始终优于最新方法。将来，我们将利用人脸检测与其它人脸分析任务之间的固有关联性，进一步提高性能。

参考资料

[1] B. Yang, J. Yan, Z. Lei, and S. Z. Li, “Aggregate channel eatures for multi-view face detection,” in IEEE International Joint Conference on Biometrics, 2014, pp. 1-8.

[2] P. Viola and M. J. Jones, “Robust real-time face detection. International journal of computer vision,” vol. 57, no. 2, pp. 137-154, 2004

[3] M. T. Pham, Y. Gao, V. D. D. Hoang, and T. J. Cham, “Fast polygonal integration and its application in extending haar-like features to improve object detection,” in IEEE Conference on Computer Vision and Pattern Recognition, 2010, pp. 942-949.

[4] Q. Zhu, M. C. Yeh, K. T. Cheng, and S. Avidan, “Fast human detection using a cascade of histograms of oriented gradients,” in IEEE Computer Conference on Computer Vision and Pattern Recognition, 2006, pp. 1491-1498.

[5] M. Mathias, R. Benenson, M. Pedersoli, and L. Van Gool, “Face detection without bells and whistles,” in European Conference on Computer Vision, 2014, pp. 720-735.

[6] J. Yan, Z. Lei, L. Wen, and S. Li, “The fastest deformable part model for object detection,” in IEEE Conference on Computer Vision and Pattern Recognition, 2014, pp. 2497-2504.

[7] X. Zhu, and D. Ramanan, “Face detection, pose estimation, and landmark localization in the wild,” in IEEE Conference on Computer Vision and Pattern Recognition, 2012, pp. 2879-2886.

[8] M. Köstinger, P. Wohlhart, P. M. Roth, and H. Bischof, “Annotated facial landmarks in the wild: A large-scale, real-world database for facial landmark localization,” in IEEE Conference on Computer Vision and Pattern Recognition Workshops, 2011, pp. 2144-2151.

[9] A. Krizhevsky, I. Sutskever, and G. E. Hinton, “Imagenet classification with deep convolutional neural networks,” in Advances in neural information processing systems, 2012, pp. 1097-1105.

[10] Y. Sun, Y. Chen, X. Wang, and X. Tang, “Deep learning face representation by joint identification-verification,” in Advances in Neural Information Processing Systems, 2014, pp. 1988-1996.

[11] S. Yang, P. Luo, C. C. Loy, and X. Tang, “From facial parts responses to face detection: A deep learning approach,” in IEEE International Conference on Computer Vision, 2015, pp. 3676-3684.

[12] X. P. Burgos-Artizzu, P. Perona, and P. Dollar, “Robust face landmark estimation under occlusion,” in IEEE International Conference on Computer Vision, 2013, pp. 1513-1520.

[13] X. Cao, Y. Wei, F. Wen, and J. Sun, “Face alignment by explicit shape regression,” International Journal of Computer Vision, vol 107, no. 2, pp. 177-190, 2012.

[14] T. F. Cootes, G. J. Edwards, and C. J. Taylor, “Active appearance models,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 23, no. 6, pp. 681-685, 2001.

[15] X. Yu, J. Huang, S. Zhang, W. Yan, and D. Metaxas, “Pose-free facial landmark fitting via optimized part mixtures and cascaded deformable shape model,” in IEEE International Conference on Computer Vision, 2013, pp. 1944-1951.

[16] J. Zhang, S. Shan, M. Kan, and X. Chen, “Coarse-to-fine auto-encoder networks (CFAN) for real-time face alignment,” in European Conference on Computer Vision, 2014, pp. 1-16.

[17] Luxand Incorporated: Luxand face SDK, http://www.luxand.com/

[18] D. Chen, S. Ren, Y. Wei, X. Cao, and J. Sun, “Joint cascade face detection and alignment,” in European Conference on Computer Vision, 2014, pp. 109-122.

[19] H. Li, Z. Lin, X. Shen, J. Brandt, and G. Hua, “A convolutional neural network cascade for face detection,” in IEEE Conference on Computer Vision and Pattern Recognition, 2015, pp. 5325-5334.

[20] C. Zhang, and Z. Zhang, “Improving multiview face detection with multi-task deep convolutional neural networks,” IEEE Winter Conference on Applications of Computer Vision, 2014, pp. 1036-1041.

[21] X. Xiong, and F. Torre, “Supervised descent method and its applications to face alignment,” in IEEE Conference on Computer Vision and Pattern Recognition, 2013, pp. 532-539.

[22] Z. Zhang, P. Luo, C. C. Loy, and X. Tang, “Facial landmark detection by deep multi-task learning,” in European Conference on Computer Vision, 2014, pp. 94-108.

[23] Z. Liu, P. Luo, X. Wang, and X. Tang, “Deep learning face attributes in the wild,” in IEEE International Conference on Computer Vision, 2015, pp. 3730-3738.

[24] S. Yang, P. Luo, C. C. Loy, and X. Tang, “WIDER FACE: A Face Detection Benchmark”. arXiv preprint arXiv:1511.06523

[25] V. Jain, and E. G. Learned-Miller, “FDDB: A benchmark for face detection in unconstrained settings,” Technical Report UMCS-2010-009, University of Massachusetts, Amherst, 2010.

[26] B. Yang, J. Yan, Z. Lei, and S. Z. Li, “Convolutional channel features,” in IEEE International Conference on Computer Vision, 2015, pp. 82-90.

[27] R. Ranjan, V. M. Patel, and R. Chellappa, “A deep pyramid deformable part model for face detection,” in IEEE International Conference on Biometrics Theory, Applications and Systems, 2015, pp. 1-8.

[28] G. Ghiasi, and C. C. Fowlkes, “Occlusion Coherence: Detecting and Localizing Occluded Faces,” arXiv preprint arXiv:1506.08347.

[29] S. S. Farfade, M. J. Saberian, and L. J. Li, “Multi-view face detection using deep convolutional neural networks,” in ACM on International Conference on Multimedia Retrieval, 2015, pp. 643-650.

Linux部署模型报错OSError: Error no file named pytorch_model.bin, tf_model.h5, model.ckpt.index or flax_mod dkgee linux pytorch 运维
报错内容：OSError:Errornofilenamedpytorch_model.bin,tf_model.h5,model.ckpt.indexorflax_model.msgpackfoundindirectory主要原因是transformer版本不对，需要升级pipinstall--upgradehuggingface_hubpipinstalltransformers[torch]其
Ubuntu-Server 设置多个ip和多个ipv6 笔记250320 kfepiza #Linux CentOS Ubuntu 等 #控制台命令行 Shell脚本 sh cmd 等网络通讯传输协议物联 ubuntu tcp/ip 笔记
Ubuntu-Server设置多个ip和多个ipv6在UbuntuServer上为同一网卡配置多个IPv4和IPv6地址，Ubuntu-server-16用的是/etc/network/interfaces配置的networkingUbuntu-server-17.10及更新版本默认用的是systemd-networkd+Netplan,用Netplan来管理systemd-networkd对于U
应用程序编程接口API的类型与结构恶霸不委屈 API 程序人生
应用程序编程接口，ApplicationProgrammingInterface是一组定义不同软件组件如何相互交互的规则和协议。它为不同的软件应用程序提供了一种接口，使得它们能够相互通信和交互，而无需了解其内部实现细节。目录API的主要类型API的组成部分API的作用和优势使用API的例子如何使用API总结API的主要类型WebAPI：这是最常见的一种API类型，通常用于通过网络与远程服务器进行通
MMO基础服务器架构（四）：线程安全的对象池晴空～蓝兮 MMO双端游戏架构 c#游戏服务器
更多代码细节，球球各位观众老爷给鄙人的开源项目点个Star，持续更新中~项目开源地址4.线程安全的对象池类(采用线程安全的单例模式)压测过~需要实现对象池的对象都要继承IPool接口namespaceCommon.Summer.core;publicinterfaceIPool{voidReturnPool();//放回对象池，释放持有的引用}usingSystem.Collections.Con
基于roop/insightface将视频中包含指定人脸的视频片段提取并合并成新视频阆遤 python roop pytorch insightface
利用insightface.app.FaceAnalysis提最一个视频中包含指定人脸的视频片段，并将其合并成一个新视频，使用“buffalo_l”模型，模型需安装在代码当前目录下的.\models中。需要roop或其他支持pytorch、insightface、moviepy的环境。pytorch安装请见我其他文章。#cython:language_level=3str#-*-coding:ut
facefusion AI换脸软件的本地部署过程记录 kfrealme 人工智能
tags:AI驾驭facefusion我的环境Win10+N卡安装步骤安装Python3.10方案手动安装Python官网下载安装包安装PythonReleasesforWindows|Python.org我的蓝奏云分享https://www.lanzoub.com/i9La81s1o5gb密码:h17b命令行安装1以管理员身份打开「命令提示符」2删除Microsoft官方源wingetsourc
自用基于 TypeScript 的 WebSocket 客户端封装 Luke Paul Na typescript websocket javascript
代码本体exportinterfaceIWSOptions{url?:string;sendContent?:string|object;token?:string;reconnectInterval?:number;heartbeatInterval?:number;heartbeatContent?:string|object;onOpen?:()=>void;onMessage?:(data
Ubuntu18.04之网络配置+域名配置+软件源配置+ssh免密登陆那记忆微凉 Linux
网络配置ubuntu18.04网络配置较之前版本有较大改动，它弃用了/etc/networks/interface配置，真正的网络配置是在/etc/netplan/xxx.yaml中生效查看当前系统网口连结状态，使用ipa查看对应网口，如果状态不是down而是up,则选择改网口进行配置编辑/etc/netplan/xxx.yaml#注意，如果每个配置后面有内容，则:号后面需加一个空格，再加入自己的
C++：类（通识版）愚戏师 C++c++开发语言数据结构算法
类的基本思想是数据抽象（dataabstraction）和封装（encapsulation）。数据抽象是一种依赖于接口（interface）和实现（implementation）分离的编程（以及设计）技术。类的接口包括用户所能执行的操作；类的实现则包括类的数据成员、负责接口实现的函数体以及定义类所需的各种私有函数。封装实现了类的接口和实现的分离。封装后的类隐藏了它的实现细节，也就是说，类的用户只能
Windows端口转发命令 windows
命令介绍Windows从Windows2000开始就提供了最基本的端口转发功能，是基于Windows的IPHelper服务的，不仅可以提供端口转发功能，还可以通过将IPv4和IPv6的不同地址的数据进行转发，但是只可以转发TCP协议，暂不支持UDP协议，使用netshinterfaceportproxy命令即可开启。添加端口转发netshinterfaceportproxyaddv4tov4lis
Python预训练模型实现俄语音频转文字啥都鼓捣的小yao 人工智能 python 音视频人工智能
Python预训练模型实现俄语音频转文字使用CommonVoice8.0、Golos和MultilingualTEDx的训练和验证分割对俄语的facebook/wav2vec2-xls-r-1b进行了微调。使用此模型时，请确保您的语音输入以16kHz采样。我们只需要装好三个功能包，写好你的文件路径即可使用！importtorchimportlibrosafromtransformersimport
java用来模块化开发和扩展很有用的服务加载器 ServiceLoader类实现SPI机制爱的叹息 Java 基础整理 java 开发语言
java.util.ServiceLoader是Java中用于实现服务提供者接口（ServiceProviderInterface,SPI）机制的一个工具。SPI允许你在不修改现有代码的情况下，动态地加载和使用第三方实现。这在插件化设计、模块化开发和扩展性需求中非常有用。基本概念服务接口（ServiceInterface）：定义了服务的接口。服务提供者（ServiceProvider）：实现了服务
Activity渲染完成第一帧时机 brycegao321 Android 渲染完成第一帧
Activity第一帧渲染涉及知识点setContentView流程、帧绘制流程、SurfaceFlinger等。统计开始时间：hookActivityThread的Instrumentation，得到Activity各个生命周期的开始、结束时间；参考：Activity的生命周期是谁调用的？注意：ActivityLifecycleCallbacks的回调函数是执行结束后触发的，无法得到开始执行时间
Python 向量检索库Faiss使用懒大王爱吃狼 python python 开发语言自动化 Python基础 python教程
Faiss（FacebookAISimilaritySearch）是一个由FacebookAIResearch开发的库，它专门用于高效地搜索和聚类大量向量。Faiss能够在几毫秒内搜索数亿个向量，这使得它非常适合于实现近似最近邻（ANN）搜索，这在许多应用中都非常有用，比如图像检索、推荐系统和自然语言处理。以下是如何使用Faiss的基本步骤和示例：1.安装Faiss首先，你需要安装Faiss。你可
人脸识别的一些代码饿了就干饭 CV相关人脸识别
1、cv2入门函数imread及其相关操作2、（详解）opencv里的cv2.resize改变图片大小Python3、机器学习之人脸识别face_recognition使用4、使用face_recognition进行人脸校准5、简单的人脸识别通用流程示意图（这个看着写的挺好的）6、face_recognition和图像处理中left、top、right、bottom解释7、使用pillow库对图片
dubbo服务META-INF.dubbo文件夹作用 zhglhy dubbo java apache
META-INF.dubbo文件夹是ApacheDubbo框架中的一个重要目录，通常用于存放Dubbo的SPI（ServiceProviderInterface）扩展配置文件。Dubbo是一个高性能的JavaRPC框架，支持分布式服务治理，而SPI机制是Dubbo实现可扩展性的核心设计之一。1.SPI机制简介SPI是Java提供的一种服务发现机制，允许框架在运行时动态加载实现类。Dubbo对其进行
android音频概念解析 yyc_audio android 音视频
音频硬件接口（我们可以理解为ASOC的声卡）官方代码里叫audiohardwareinterface也称为module，定义在services/audiopolicy/config/audio_policy_configuration.xml：分别有primary，a2dp，usb，r_submix(用于音频数据回环)；配置文件中的每一个module都被描述为HwModule，保存在mHwModu
python科学绘图-matplotlib绘制三维函数图像，并且在函数底部绘制等值线 zhan114514 python科学绘图 python matplotlib 开发语言
python使用matplotlib库绘制三维函数图像，并且在底部绘制等值线。三维图像函数surface=ax.plot_surface(X,Y,zss,camp=色带)等值线函数contour=ax.contour(xs,ys,zss,zdir=在哪个轴绘制,offset=在该轴什么位置绘制,camp=色带,zorder=图层位置)颜色条函数plt.colorbar(surface,shrink
API 测试承悦不会玩 API
前提概要本文章主要用于分享API测试基础学习，以下是对API测试的一些个人解析，请大家结合参考其他文章中的相关信息进行归纳和补充。API测试描述什么是API？API是应用程序编程接口（ApplicationProgrammingInterface）的缩写。它是一组定义、协议和工具，用于让不同的软件应用程序之间进行交互和通信。以下从几个方面为你详细介绍API：功能：1.提供服务接口2.数据交互工作原
Android com.facebook.react:react-native:+ 版本问题小铁-Android react native android
Executionfailedfortask':app:desugarBetaDebugAndroidTestFileDependencies'.>Couldnotresolveallfilesforconfiguration':app:betaDebugRuntimeClasspath'.>Failedtotransformreact-native-0.71.0-rc.0-debug.aar(c
C语言，记录一次局部变量被意外修改的问题三日沐水嵌入式全套学习教程 c语言
背景：单片机开发过程中，我在函数体内（begin_face_record）定义了一个局部变量data_length，在使用的时候，该局部变量一直别改变，每次调用其他函数，例如c库里面的函数memcpy，不知什么情况data_length值就会被改变。1、源码分析voidmain(void){init_gpio();init_face();face_power_up();begin_face_rec
揭秘时空大数据：详细介绍、真实应用场景和数据示例解析陈书予 GIS开发（时空大数据）前端大数据 python 时序数据库
时空大数据(SpatialBigData)是指利用空间环境和时间环境信息，以及数字技术，从多种来源获取的海量、动态的、多维的数据，对空间环境和时间环境进行实时监测，并基于复杂的数据分析和挖掘，获取有价值的信息。时空大数据示例：1）社会网络数据：Twitter、Facebook、Instagram等社交媒体上的海量数据，可以通过时间、空间、主题等来提取有价值的信息。2）遥感图像数据：通过遥感技术从卫
【深度学习】 PyTorch一文详解 Nerous_ 深度学习深度学习 pytorch 人工智能机器学习 python
“PyTorchisadeeplearningframeworkthatprioritizessimplicityandflexibility,makingitthego-tochoiceforbothresearchersanddevelopers.”—Anonymous1.PyTorch简介1.1PyTorch的背景与发展PyTorch是由Facebook人工智能研究院（FAIR）开发的一个开
freecad嵌入工作台黄河里的小鲤鱼软件开发建模 python
1Introduction导言FreeCADcanbeimportedasaPythonmoduleinotherprogramsorinastandalonePythonconsole,togetherwithallitsmodulesandcomponents.It’sevenpossibletoimporttheFreeCADuserinterfaceasapythonmodulebutwi
关于误差平面小记文弱_书生乱七八糟平面算法神经网络机器学习
四维曲面的二维切片：误差平面详解在深度学习优化过程中，我们通常研究损失函数（LossFunction）的变化，试图找到权重的最优配置。由于神经网络的参数空间通常是高维的，我们需要使用低维可视化的方法来理解优化过程和误差平面（ErrorSurface）。在这里，我们讨论一个四维曲面的二维切片，其中：三个维度是网络的权重（w1,w2,w3w_1,w_2,w_3w1,w2,w3）。第四个维度是误差（损失
RIP路由欺骗攻击与防御实验详解 w2361734601 智能路由器网络
一、基础网络配置1.路由器R1配置interfaceGigabitEthernet0/0/0ipaddress192.1.2.254255.255.255.0!interfaceGigabitEthernet0/0/1ipaddress192.1.3.254255.255.255.0!routerrip1version2network192.1.2.0network192.1.3.02.路由器R2
Hugging Face预训练GPT微调ChatGPT（微调入门！新手友好！） y江江江江机器学习大模型 gpt chatgpt
HuggingFace预训练GPT微调ChatGPT（微调入门！新手友好！）在实战中，⼤多数情况下都不需要从0开始训练模型，⽽是使⽤“⼤⼚”或者其他研究者开源的已经训练好的⼤模型。在各种⼤模型开源库中，最具代表性的就是HuggingFace。HuggingFace是⼀家专注于NLP领域的AI公司，开发了⼀个名为Transformers的开源库，该开源库拥有许多预训练后的深度学习模型，如BERT、G
一文梳理清楚Vsync/Choreographer/SurfaceFlinger/Surface/SurfaceHolder/硬件刷新频率关系 lpftobetheone android
在Android应用开发中，流畅的UI体验是用户感知的核心。为了实现这一点，Android系统构建了一套复杂的图形渲染架构，涉及垂直同步信号（VSync）、编舞者（Choreographer）、硬件刷新频率、SurfaceFlinger、Surface和SurfaceHolder等多个关键组件。本文将深入解析这些组件的关系与工作流程，帮助你全面理解Android图形渲染的核心机制。总结起来，整个流
Sketch：UI界面设计原则与Sketch实现_2024-07-21_23-01-33.Tex chenjj4003 游戏开发 ui 交互 microsoft react.js 前端
Sketch：UI界面设计原则与Sketch实现Sketch：UI界面设计原则与Sketch实现UI设计基础UI设计的重要性在数字产品日益丰富的今天，用户界面设计（UserInterfaceDesign，简称UI设计）成为了决定产品用户体验的关键因素。良好的UI设计不仅能够提升产品的美观度，更重要的是，它能够确保用户在使用产品时的直观性、易用性和效率。UI设计的重要性体现在以下几个方面：提升用户体
react hook:useRef,forwardRef, useImperativeHandle父子通信取啥好 react react.js javascript 前端
使用场景:父组件调用子组件里的方法父组件：Father.tsximportReact,{useRef}from'react';importChildrenfrom'./children';import{Button,FormInstance}from'antd';interfaceCustomFormInstanceextendsFormInstance{reLoadPage:()=>void;}
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。