C小C

【论文翻译】论文中英对照翻译--（Learning Generalized Deep Feature Representation for Face Anti-Spoofing）（其一）

【开始时间】2018.10.23

【完成时间】2018.10.25

【论文翻译】论文中英对照翻译--（Learning Generalized Deep Feature Representation for Face Anti-Spoofing）（其一）

【中文译名】人脸反欺骗的广义深层特征表示

【论文链接】论文链接

【说明】此论文较长，本人将它分为了两部分，这是前半部分

【补充】

1）论文的发表时间是：2018年5月14日，是在IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY上发表的论文

2）2017年12月20日收到手稿；2018年3月13日修订；2018年3月20日接受；2018年4月11日出版；本版日期：2018年5月14日。这项研究是在新加坡南洋科技大学的快速富物搜索(ROSE)实验室进行的。

【声明】本文是本人根据原论文进行翻译，有些地方加上了自己的理解，有些专有名词用了最常用的译法，时间匆忙，如有遗漏及错误，望各位包涵

题目：人脸反欺骗的广义深层特征表示

Abstract（摘要）

In this paper, we propose a novel framework leveraging the advantages of the representational ability of deep learning and domain generalization for face spoofing detection. In particular, the generalized deep feature representation is achieved by taking both spatial and temporal information into consideration, and a 3D convolutional neural network architecture tailored for the spatial-temporal input is proposed. The network is first initialized by training with augmented facial samples based on cross-entropy loss and further enhanced with a specifically designed generalization loss, which coherently serves as the regularization term. The training samples from different domains can seamlessly work together for learning the generalized feature representation by manipulating their feature distribution distances. We evaluate the proposed framework with different experimental setups using various databases. Experimental results indicate that our method can learn more discriminative and generalized information compared with the state-of-the-art methods.

本文提出了一种新的人脸欺骗检测框架，该框架充分利用了深度学习的表征能力和领域泛化的特点，实现了人脸欺骗检测。特别是考虑了时空信息，实现了广义深度特征表示，并提出了一种适合时空输入的三维卷积神经网络结构。该网络首先通过基于交叉熵损失的增强样本训练来初始化，然后通过特定设计的泛化损失作为正则化项，对网络进行进一步增强。不同领域的训练样本通过调整特征分布距离，可以无缝地学习广义特征表示。我们使用不同的数据库并采用不同的实验设置，对我们提出的的框架进行了评价。实验结果表明，与现有的方法相比，我们的方法能够学习到更多的判别信息和广义信息。

Index Terms—Face spoofing, deep learning, 3D CNN, domain generalization.

术语索引--------面部欺骗，深度学习，三维CNN，领域泛化。

I. INTRODUCTION（引言）

BIOMETRICS offers a powerful and practical solution to authentication-required applications. Due to the breakthrough of biometrics authentication via deep learning and its better security capability compared with traditional authentication methods (e.g., password, secret question, token code), more and more attention has been attracted from both academia and industry nowadays. Typical biometric modalities include fingerprint, iris, face and voice print, among which “face” is the most popular one as it does not require any additional hardware infrastructure and almost all mobile phones are equipped with a front-facing camera. Despite the success of face recognition, it is still vulnerable to the presentation attacks due to the popularity of social media from which facial images are easy to acquire [1]. For instance, a presentation attack can record the face information of a person by printing (printing attack), replaying on screen (replay attack) or even counterfeiting the face via 3D masking [2] and VR [3], which brings extremely challenging security issues.

生物识别技术为有认证需求的应用程序提供了一个强大而实用的解决方案。由于生物特征认证的深度学习突破及其与传统认证方法(密码、秘密问题、令牌码等)相比具有更好的安全性，近年来从学术界到工业节都受到越来越多的关注。典型的生物识别方式包括指纹、虹膜、人脸和语音打印，其中“脸”是最受欢迎的，因为它不需要任何附加的硬件基础设施，几乎所有的手机都配备了正面摄像头（ front-facing camera）。尽管人脸识别取得了成功，但由于社交媒体的普及，面部图像很容易从社交媒体中获取，因此仍然容易受到演示攻击（ the presentation attacks） [1]。例如，演示攻击可以通过打印(打印攻击)、在屏幕上重放(重放攻击)，甚至通过3D面具[2]和VR[3]伪造人脸来记录人的面部信息，这就带来了极具挑战性的安全问题。

Security concerns of face recognition systems have motivated a number of studies for face spoofing detection. From the perspective of evaluating the disturbance information injected into the spoofing media, a series of approaches aim at extracting the distortion information, which may appear on spoofed face samples. Typical spoofing artifacts include texture artifacts [4], motion artifacts [5] and image quality relevant artifacts [6]. Other approaches focus on the system level in which specific sensors (e.g., gravity sensor) can be utilized for auxiliary assistance [7] or additional hardware can be incorporated into the verification system (e.g., infrared sensor [8]). Moreover, human-computer interaction may also be required for spoofing detection (head moving, eye blinking, etc.) [9], [10].

人脸识别系统的安全性问题引发了大量人脸欺骗检测的研究，从对注入到欺骗介质中的干扰信息进行评估的角度出发，提出了一系列针对伪人脸样本中可能出现的失真信息的提取方法。典型的欺骗工件包括纹理伪影[4]、运动伪影[5]和与图像质量相关的伪影（relevant artifacts）[6]。其他方法侧重于系统一级，其中可利用特定传感器(例如重力传感器)辅助协助[7]，或将额外硬件纳入核查系统(例如，红外传感器[8])。此外，欺骗检测(头部移动、眨眼等)也可能需要人机交互[9]、[10]。

With numerous approaches proposed to deal with the artifacts within a single image, there are still two important issues in face anti-spoofing. On one hand, how to generalize well to the “unseen data” becomes pivotal, as obtaining enough data with sufficient variability in the training process is not always practical. On the other hand, much less work has been dedicated to extracting information along the temporal direction, which can also provide valuable cues (liveness information, unexpected motion [9], [10], temporal aliasing, etc.). More importantly, learning spatial plus temporal features would become more difficult, as more training data would be necessary and the lack of generalization could be even more pronounced. All these issues cast challenges on the generalization capability of robust feature representation. In view of this, we focus on deep feature representation in a generalized way by exploiting the information from both spatial and temporal dimensions. In particular, 3D convolutional neural networks (3D CNN), which have been proved to be efficient for action recognition task [11], are employed to learn spoofing-specific information based on typical printed and replay video attacks.The solution incorporates 2D and 3D features related to the presentation attack problem, and learns not only spatial variations associated with attacks but also artifacts that takeplace over time. More specifically, we employ the 3D CNN architecture with a data augmentation strategy for the spoofing detection task. To obtain a more robust and generalized 3D CNN model, the lack of generalization is dealt with by introducing a regularization mechanism, which focuses on improving classification accuracy during training as well as

generalizing to unknown conditions by minimizing the feature distribution dissimilarity across domains. These capabilities allow us to make a further step regarding the detection of attacks under unknown or different conditions.

虽然众多处理单一图像中的真伪的方法已经被提出，但是面对反欺骗仍然存在两个重要的问题。一方面，如何很好地泛化到“看不见的数据”成为关键，因为在训练过程中获得足够的、具有足够可变性的数据并不总是切实可行的。另一方面，更少的工作是沿着时间方向提取信息，这也可以提供有价值的线索(活性信息、意外运动[9]、[10]、时间混叠等)。另一方面，很少的工作是从时间的角度提取信息，而这也可以提供有价值的线索(活性信息、意外运动[9]、[10]、时间混叠等)。更重要的是，学习空间加上时间特征将变得更加困难，因为需要更多的训练数据，而缺乏泛化的情况可能更加明显。所有这些问题都对鲁棒特征表示的泛化能力提出了挑战，为此，我们从空间和时间两个维度出发，对深度特征表示进行了广义的研究。特别是，已被证明对行动识别任务[11]有效的三维卷积神经网络(3D CNN)，被用于学习基于典型打印和重放视频攻击的特定欺骗信息。该解决方案结合了与表示攻击问题相关的2d和3d特征，不仅学习了与攻击相关的空间变化，而且还学习了随时间而发生的伪影信息（artifacts）。更具体地说，我们采用了带有数据增强策略的3D CNN结构来完成欺骗检测任务，为了获得一个更鲁棒、更泛化的3D CNN模型，通过引入正则化机制来解决其泛化不足的问题，该机制的重点是在训练过程中提高分类精度，并通过最小化域间的特征分布差异来泛化到未知条件。这些能力使我们能够进一步探测未知或不同条件下的攻击。

The main contributions of our work are as follows.

we apply a 3D CNN network which take both spatial and temporal information into consideration with a specifically designed data augmentation method for face spoofing detection.
To further improve the generalization performance, we employ a generalization regularization by minimizing the Maximum Mean Discrepancy distance among different domains.
We conduct extensive experimental analysis on four different datasets as well as our proposed cross-camera based protocol. The results show that our proposed framework can achieve significantly better performance compared with other state-of-the-art methods.

我们工作的主要贡献如下。

我们采用一种三维cnn网络，该网络考虑了时间和空间信息，采用了一种专门设计的数据增强方法进行人脸欺骗检测。
为了进一步提高泛化性能，我们采用了一种泛化正则化方法，使不同区域间的最大平均差异距离最小。
我们对四种不同的数据集和基于交叉摄像机的协议进行了广泛的实验分析，结果表明，与其他先进的方法相比，我们提出的框架可以获得更好的性能。

II. RELATED WORK（相关工作）

A. Face Anti-Spoofing（人脸反欺骗）

In terms of various application scenarios, we roughly categorize existing face spoofing detection methods into three categories, including motion analysis based [5] (which may require user cooperation), texture analysis based [4], [12], and sensor-assisted detection [7]. The first two categories can be generally applied to face verification/registration task with personal computers and mobile phones, while the last one requires extra hardwares. To further enhance the robustness

of biometric spoofing detection, some other biometrics information can be incorporated into the face antispoofing system (e.g. [13]–[16]).

在不同的应用场景中，我们将现有的人脸欺骗检测方法大致分为三类，包括基于的运动分析[5](可能需要用户合作)、基于的纹理分析[4]、[12]和传感器辅助检测[7]。前两类通常可以应用于个人计算机和移动电话的人脸验证/注册任务，而最后一类则需要额外的硬件。为了进一步增强生物识别欺骗的鲁棒性，检测时，还可以将其他一些生物特征信息纳入人脸反欺骗系统(例如[13]-[16])。

Motion analysis relies on extracting liveness information (e.g., eye blinking, lips movement, head rotation) for distinguishing between genuine and spoofed ones. For instance, such liveness information can be obtained via optical flow. In [5], Kollreider et al. reported that even subtle movement can be regarded as motion cues. For these kind of methods, the user assistance is usually required. Though motion analysis based methods are effective to counter printed photo attacks, they may suffer performance drops when the spoofing attack is conducted by video replay.

运动分析依赖于提取活跃度信息(如眨眼、嘴唇移动、头部旋转)，以区分真假脸。例如，这种活性信息可以通过光流获得。在[5]中，kolereider等人报告说，即使是细微的运动也可以看作是运动线索。对于这类方法，通常需要用户的帮助。虽然基于运动分析的方法能够有效地抵抗印刷照片的攻击，但当通过视频重放进行欺骗攻击时，它们的性能可能会下降。

The idea of facial texture and distortion analysis originates from the assumption that the spoofed medium is likely to lack high-frequency information, due to the face media reproduction process. By analyzing the texture artifacts left behind during an attack, we can extract useful information such that the genuine and spoofed faces can be properly distinguished.In [17], a texture analysis method based on two dimensional Fourier spectrum is conducted. In [18], Tan et al. proposed a total-variation based decomposition method and extracted the different-of-Gaussian (DoG) information on the high-frequency part. The final model is learned in a bilinear sparse low-rank regression manner. Texture features designed for object detection/recognition tasks have also been proved to be effective for face spoofing detection. In [4], multi-scale Local Binary Pattern (LBP) with Support Vector Machine (SVM) classifier was proposed, achieving superior performance on NUAA [18] and Idiap REPLAY-ATTACK databases [19]. The multi-scale LBP feature was further extended to facial component based method followed by fisher vector [20], such that more discriminative information can be extracted. Other texture features, such as Scale Invariant Feature Transform (SIFT) and Speed Up Robust feature (SURF) [21], can also be applied to the face anti-spoofing task. As the high-frequency information can also be discarded in the temporal domain, the texture features based on 2-D plane can be extended to 3-D plane [22]. By jointly exploring color and texture information, the face anti-spoofing performance can be largely improved [12], [23]. Recently, a dynamic texture face spoofing was proposed [24] by considering volume local binary count patterns. Moreover, by incorporating flash light, the texture pattern can be detected more readily [25]. Another stream of feature design is based on image quality methods. In [6], 25 quality assessment based metrics were employed as the discriminative features for face spoofing detection. In [26], the authors extended the method in a regression manner to tackle the problem whereby samples were taken from multiple camera models. In [27], a feature concatenation based method was proposed by considering specular, blurriness and color distortion. However, both texture-based and distortion-based features are likely to be overfitted to one particular setup, which may limit their application for practical scenarios when confronting diverse image/video capturing conditions.

人脸纹理和失真分析的思想来源于这样一种假设，即由于人脸媒体的再现过程，欺骗介质很可能缺乏高频信息。通过分析攻击过程中留下的纹理伪影，我们可以提取有用的信息，从而正确区分真假人脸。在[17]中，提出了一种基于二维傅立叶谱的纹理分析方法。在[18]中，tan等人提出了一种基于全变差的分解方法，并提取了高频部分不同的高斯(DOG)信息。最后的模型采用双线性稀疏低秩回归方法学习，为目标检测/识别任务设计的纹理特征也被证明对于人脸欺骗检测有效。在[4]中，提出了使用支持向量机分类器的多尺度局部二值模式(LBP)，在NUAA[18]和Idiap重播攻击数据库[19]上取得了较好的性能。将多尺度LBP特征进一步扩展到基于人脸分量的方法中，然后采用Fisher向量[20]，从而提取出更多的判别信息。其他纹理特征，如尺度不变特征变换(cale Invariant Feature Transform---Sift)和加速鲁棒特征( Speed Up Robust feature---SURF)[21]，也可应用于人脸防欺骗任务。由于高频信息在时域上也可以被丢弃，基于二维平面的纹理特征可以扩展到三维平面[22]。通过对颜色和纹理信息的联合研究，可以大大提高人脸的抗欺骗性能[12]，[23]。最近，人们提出了一种考虑体积局部二进制计数模式的动态纹理人脸欺骗。此外，通过结合闪光灯，可以更容易地检测纹理模式[25]。另一种特征设计流基于图像质量方法。在文献[6]中，采用了25个基于质量评估的度量作为人脸欺骗检测的判别特征，在[26]中，作者将该方法进行了回归扩展，以解决从多个摄像机模型中抽取样本的问题。

在[27]中，提出了一种考虑镜面、模糊和颜色失真的基于特征级联的方法。然而，基于纹理的特征和基于失真的特征都可能被过拟合于特定的设置，这可能限制了它们在实际场景中的应用，当他们在面对不同的图像/视频捕获条件时。

In addition to motion analysis and texture analysis methods, additional sensors can also be leveraged for face spoofing detection. Compared with face images directly captured by the popular camera models, 3D depth information [28], [29], multi-spectrum and infrared images [8], and even vein flow information [30] can be obtained if additional sensors are deployed. Such methods can be enhanced by audio information [31], which can further improve the robustness of face spoofing detection. However, as additional equipments are required in such methods, they are usually more expensive

除了运动分析和纹理分析方法之外，还可以利用额外的传感器来进行人脸欺骗检测。与传统摄像机模型直接获取的人脸图像相比，增加传感器可以获得三维深度信息[28]、[29]、多光谱和红外图像[8]，甚至静脉流信息[30]。这些方法可以通过音频信息[31]得到增强，从而进一步提高鲁棒性。然而，由于这些方法需要额外的设备，所以通常成本更高。

Deep learning based methods have also been proved to be effective for biometric spoofing detection tasks. Yang et al. [32] first proposed to use Convolutional Neural Network (CNN) for face spoofing detection. Some other works [33]–[36] have been proposed to modify the network architecture directly, which can further improve the detection accuracy. In [37], a CNN has been proved to be effective for face, fingerprint, and iris spoofing detection. Nogueira et al. [38] further showed that a pre-trained CNN model based on ImageNet [39] can be transferred to fingerprint spoofing detection without any fine-tuning process. In [2],

a deep dictionary learning based method was proposed for mask attacking detection. Additional information (e.g., eye blinking) can also be considered as auxiliary information by associating it with deep learning [40], which further improves the face spoofing detection performance. More recently, Atoum et al. [41] proposed a depth-based CNN for face spoofing detection to extract depth information based on RGB face images. Gan et al. [42] proposed a 3D CNN based framework to jointly capture the spatial and temporal information. As [42] also deals with 3D CNN for the PAD problem, it is important to highlight the differences between their method and the one we propose herein. In summary, our technique prioritizes 3×3×3 convolutions for better efficiency, and a streamlined strategy for temporal feature learning is adopted with different pre-preprocessing and augmentation mechanisms. In general, deep learning methods can achieve desirable performance when the training and testing samples are acquired in very similar conditions (e.g., captured with the same type of phone). However, such environment cannot be always ensured due to the diverse capturing devices, illumination conditions and shooting angles [43].

基于深度学习的方法对于生物识别欺骗检测任务也被证明是有效的。[32]首次提出将卷积神经网络(CNN)用于人脸欺骗检测，文[33]-[36]提出了直接修改网络结构的方法，进一步提高了检测精度。在[37]中，CNN被证明是一种有效的人脸、指纹和虹膜欺骗检测方法。Nogueira等人[38]进一步表明，基于ImageNet[39]的预先训练的cnn模型可以在没有任何微调过程的情况下转移到指纹欺骗检测中。文[2]中提出了一种基于深度字典学习的面具攻击检测方法。额外的信息(如眨眼)也可以被认为是辅助信息，通过将其与深度学习联系起来[40]，这进一步提高了人脸欺骗检测性能。最近，阿图姆等人[41]提出了一种基于深度的cnn人脸欺骗检测方法，用于提取基于RGB人脸图像的深度信息。42]提出了一种基于3D CNN的联合捕获时空信息的框架。由于文[42]也针对PAD问题提出了3D CNN，因此必须强调它们与本文提出的方法之间的区别。总之，为了提高效率，我们对3×3×3卷积进行了排序，并针对不同的预处理和增强机制，采用了一种简化（流线型）的时态特征学习策略。一般来说，当训练和测试样本是在非常相似的条件下获得的时候(例如，用同一类型的手机捕捉到的)，深度学习方法可以获得理想的性能。然而，由于捕获设备、光照条件和拍摄角度的不同，这种环境并不总是被保证。

B. Multimedia Recapturing Detection（多媒体重捕检测）

Multimedia recapturing aims at reproducing the content illegally from the perspective of security. During the multimedia content reproduction process, the camera, display screen as well as the lighting condition are carefully tuned to obtain the reproduced content with the best quality. To the best of our knowledge, the first work addressing the problem of image recapturing detection on LCD screens was proposed in [44], whereby three distortion types, including the texture

pattern caused by aliasing, the loss-of-detail pattern caused by the low resolution of LCD screens and the color distortion caused by the device gamut were analyzed. To address this problem, LBP, multi-scale wavelet statistics as well as color channel statistics were combined as a single feature vector for classification. As claimed in [45], although the texture pattern can be eliminated by setting the recapturing condition properly, the loss-of-detail artifact cannot be avoided during recapturing, which can be further employed as discriminative features for image reproduction detection. Recently, Li et al. [46] proposed a CNN+RNN framework to exploit the deep representation of recapturing artifacts, which was proved to be effective when using 32×32 image block as the input of the network. For video reproduction, Wang and Farid [47] proposed to explore geometry principles based on the motivation that the recaptured scene is constrained to a planar surface, while the original video was taken by projecting objects from the real world to the camera. In [47], both mathematical analysis and experimental results showed that the reproduction process can cause “non-zero” skew in the projection matrix by assumin that the skew value of camera for the original capturing was zero. Along this vein, the algorithm proposed in [48]detected the radial lens distortion based on the geometry principle. A mathematical model was built for lens distortion and distorted line based on the edge of video frame, which was regarded as discriminative cue for reproduction identification. In [48], the characteristic ghosting artifact, which is generated

从安全的角度来看，多媒体重捕的目的是非法复制内容。在多媒体内容再现过程中，对摄像机、显示屏以及光照条件进行了精心的调整，可以获得最优质的再现内容。据我们所知，文章 [44]首次提出了解决LCD屏幕上图像重建检测问题的工作，其中分析了三种失真类型，包括混叠引起的纹理模式、液晶显示屏低分辨率引起的细节丢失和器件色域引起的颜色失真。针对这一问题，将LBP、多尺度小波统计和彩色信道统计相结合，作为单一的特征向量进行分类。正如在[45]中所声称的那样，虽然通过适当设置恢复条件可以消除纹理模式，但在恢复过程中无法避免细节伪像的丢失，这可以进一步用作图像再现检测中的鉴别特征。.最近，Li等人。[46]提出了一种CNN+RNN的框架，当该框架以32×32图像块作为网络的输入，可以有效地利用了再现伪影的深度表示。对于视频再现，Wang和Farid[47]提出了一种探索几何原理的方法，他们将再现的场景限制在平面上，而原始的视频则是通过将物体从现实世界投射到摄像机上来实现的。在[47]中，无论是数学分析还是实验结果都表明，在投影矩阵中，通过假设摄像机的偏斜值为零，再现过程会导致投影矩阵中的“非零”偏斜。沿着这一思路，[48]中提出的基于几何原理的径向透镜畸变检测算法。基于视频帧的边缘，建立了镜头畸变和畸变线的数学模型，作为识别再现的依据。在[48]中，由于摄像机和投影屏幕之间缺乏同步而产生的特征重影伪影，可以作为鉴别信息被由两个Dirac脉冲组成的滤波器检测出来。

III. METHODOLOGY（方法）

Generally speaking, both spatial and temporal artifacts (e.g., unexpected texture patterns, color distortions and blurring [44], [49]) may occur during the face spoofing process.Regarding the texture pattern, such pattern appearing in spatial dimension is caused by the mismatch of the replay device resolution and the capturing device resolution [17] and texture distortion appeared on replay medium due to blurring artifact [27] and surface/glasses reflection [50], while

in temporal domain it is derived from the divergence between flash frequency of display device (e.g., 120 Hz) and the sampling frequency of video signal (e.g., 25 Hz). The color distortion is due to the mismatch of color gamut between the display medium and the recapturing model [51], [52]. Besides the texture pattern and color distortion, the unexpected motion such as display device shaking along the temporal dimension can also be beneficial for spoofing detection. Instead

of using the hand-crafted features in inferring the distinctive information, applying Convolutional Neural Network (CNN) to spoofing detection has shown promising results for different spoofing setups. However, as most of the current adopted CNN models for spoofing detection are based on 2D images

trained in a label-guided manner [37], [38], [41], there are two outstanding limitations:

Due to the limitation of the 2D CNN structure, the tem-poral statistics encoded in contiguous frames are ignored.
Directly applying the classification loss with label information can lead to overfitting problem to a certain database collection. In this scenario, the trained model cannot generalize well to the unseen data.

一般来说，在人脸欺骗过程中，可能会出现时空伪影(例如，意料之外的纹理模式、颜色畸变和模糊环[44]、[49])。关于纹理模式，这种模式出现在空间维中是由于重放设备分辨率和捕获设备分辨率[17]的不匹配造成的，而纹理失真则是由于模糊伪影[27]和表面/眼镜反射[50]而出现在重放介质上的。。而在时域，它是由显示设备的闪光灯频率(例如120赫兹)和视频信号的采样频率(例如25赫兹)之间的差异导致的。颜色失真是由于显示介质与再现模型[51]、[52]之间色域不匹配造成的，除了纹理模式和颜色失真外，显示装置沿时间方向抖动等意想不到的运动也有利于欺骗检测。将卷积神经网络(Cnn)应用于欺骗检测，而不是利用手工构造的特征来推断不同的信息，在不同的欺骗机制中显示出了很好的效果。然而，由于目前采用的cnn欺骗检测模型大多是基于以标签引导方式训练的2d图像[37]、[38]、[41]，因此存在两个突出的局限性：

由于二维CNN结构的局限性，忽略了连续帧编码的统计量。
直接将分类损失与标签信息相结合会导致对某一数据库集合的过度拟合问题，在这种情况下，经过训练的模型不能很好地泛化到未见数据。

In view of these limitations, we develop a 3D CNN architecture such that discriminative information can be learned from both spatial and temporal dimensions. In particular, when training and testing samples are captured under similar environments, our model can achieve lower error rate compared with 2D CNN models as well as other handcrafted features used in prior art. More importantly, when training a CNN by considering face samples collected from different cameras under diverse illumination conditions, the extracted featuresacross domains are expected to lie in a similar manifold such that a classifier trained with such features will have better generalization ability. In view of this, we also take advantage of domain generalization in network training by introducing a regularization term, which forces the learned features to share similar distributions. The pipeline of our proposed scheme is shown in Fig. 1.

鉴于这些局限性，我们开发了一种三维cnn结构，可以从空间和时间两方面学习鉴别信息。特别是，当训练和测试样本在类似的环境下被捕获时，我们的模型可以获得比2d cnn模型以及现有技术中使用的其他手工制作的特征的方法更低的误差率。更重要的是，当训练cnn时，考虑在不同的光照条件下从不同的摄像机采集的人脸样本，所提取的区域特征将位于一个相似的流形中，因此使用这些特征训练的分类器具有更好的泛化能力。鉴于此，我们还在网络训练中引入了一个正则化项，使学习到的特征共享相似的分布，从而利用了网络训练中的领域泛化，并在图1中给出了该方案的流水线图。

A. 3D Convolutional Neural Network（3D卷积神经网络）

In the 2D convolutional neural network, the convolution process is only applied on the 2D feature maps to compute the response in the spatial dimension, which has largely ignored the temporal information. In contrast with 2D CNN, the 3D CNN is conducted by convolving an input cube,which is stacked by multiple contiguous frames with a 3D kernel. We refer to the 3D convolution kernel size in the l−th layer by W l × H l × T l , where T l denotes the temporal depth and W l × H l represents the spatial size of the kernel. As such, the temporal information can also be preserved in the feature map. By jointly considering the temporal information, we can achieve better feature learning capability for face spoofing detection. In particular, each convolution operation is performed followed by a non-linear activation function such as ReLU. Mathematically, such process can be formulated as ：

在二维卷积神经网络中，卷积过程只应用在二维特征映射上来计算空间维上的响应，而忽略了时间信息。与二维CNN相比，三维CNN是通过一个输入立方体来进行的，输入立方体由多个连续帧叠加而成，该立方体由一个三维核组成，我们将1层−第四层中的三维卷积核尺寸称为 W l × H l × T l ，其中Tl表示时间深度，Wl×Hl表示核的空间大小。因此，时间信息也可以保存在特征映射中。通过同时考虑时间信息，我们可以获得更好的人脸欺骗检测的特征学习能力。特别是当每次卷积运算之后都会有一个非线性激活函数时，如relu。从数学上讲，这样的过程可以表述为：

where is the value of a unit at position (i, j,k) in the d1−th feature map from the (l−1)-th layer, is the value of the element at position (m,n, p) of the 3D convolution kernel connected to the d 2 -th feature map in the l−th layer, is the bias term, and σ(·) denotes a non-linear activation layer. Subsequently, a 3D pooling layer is applied to reduce the resolution of feature maps and enhance the invariance of the input signals to distortions. According to the research in [53], smaller receptive fields of 3D convolution kernels with deeper architectures can yield better performance for video classification. Although our problem is different from [53], we found out that adopting a smaller receptive field leads to better results for face spoofing detection as well. Therefore, in the 3D CNN architecture, we only consider the spatial-temporal receptive field as 3 × 3 × 3. The proposed 3D CNN model is detailed in Table I. This architecture has five

convolutional layers followed by the fully connected layer. The study regarding the appropriate number of convolutional layers is presented in Section IV-D.

其中，是在第(l−1)层的第d1个特征途图中位置为(i，j，k)的一个单元的值，是连接到第l层中第d2个特征图的3d卷积核位于(m，n，p)的元素的值。为偏置项，σ(·)表示非线性激活层。然后，采用3D池层来降低特征映射的分辨率，提高输入信号对失真的不变性。根据文献[53]的研究，结构较深的三维卷积核的接受域较小，可以获得更好的视频分类性能。虽然我们的问题与[53]不同，但我们发现，采用较小的接收场也可以获得更好的人脸欺骗检测结果，因此，在三维CNN结构中，我们只考虑3×3×3的时空接受场。所提出的三维CNN模型详见表一。该体系结构有五个卷积层，然后是完全连接层。在第IV-D节中对适当的卷积层数进行了研究。

表1、提出的3D卷积神经网络的结构

图1、本文提出的人脸欺骗检测方案的流水线，最终目标函数由分类损失和广义损失共同决定，fc2层的输出作为潜在的判别特征进行分类。三维卷积层包括三维卷积模式、三维批量归一化、LeakyReLU层和三维最大池化层，第二完全连通层(Fc2)用于潜在判别特征提取。

B. Data Augmentation（数据增强）

As it can be observed from Table I, our proposed 3D CNN model has more than 4M parameters to be optimized. However, existing samples in public databases are not enough to train such model. Therefore, the underfitting problem can not be avoided due to the large number of parameters in the model and the sparsity of training samples. To address this issue, we propose a data augmentation method based on video cubes to increase the number of training data. It should be noted that traditional augmentation methods such as injecting additional noise may not be feasible for the spoofing detection problem, given that the distortion information plays a key role in face spoofing detection. Therefore, the strategy of augmenting the video cubes is developed concerning this task.

从表一可以看出，我们提出的三维cnn模型有超过4M个参数需要优化，但是现有的公共数据库样本不足以训练这类模型，因此，由于模型中大量参数和训练样本的稀疏性，无法避免模型的欠拟合问题。针对这一问题，我们提出了一种基于视频立方体的数据增强方法，以增加训练数据的数量。需要注意的是，传统的增强方法，如注入附加噪声等，对于欺骗检测问题并不可行，因为失真信息在人脸欺骗检测中起着关键的作用。因此，针对这一任务，提出了一种增强视频立方体的策略。

1) Spatial Augmentation: To mitigate the variation of background for face spoofing detection, face detection is usually conducted as a pre-processing step [19]. However, variations of background near face regions can even be beneficial to face spoofing detection when considering deep learning approaches, as spoofing artifacts can be from the background region or the bezel of spoofing medium. Therefore, we propose to shift the boundingbox in four different directions (up, down, right and left) by α · l, where l is equal to the width/height of bounding box. The parameter α is a predefined scaling factor, which is empirically set to 0.2 in our work. We stop the spatial augmentation if the bounding box moves out of the image boundary. We show an example of spatial augmentation in Fig. 2.

1)空间增强：为了减少人脸欺骗检测背景的变化，人脸检测通常是作为预处理步骤进行的[19]，但是，在考虑深入学习的方法时，人脸区域附近背景的变化甚至有利于人脸欺骗检测，因为欺骗伪影可以来自背景区域或欺骗介质的边框。因此，我们提出用α·l将边框在四个不同方向(上、下、右、左)移动，其中l等于边框的宽度/高度，参数α是一个预定义的缩放因子，在我们的工作中经验地设置为0.2，如果边框移出图像边界，我们停止空间增强，我们在图2中给出了一个空间增强的例子。

图2、基于空间增强的数据说明。

2) Gamma Correction Based Augmentation: To take the display medium diversity due to different types of capturing devices into consideration, we conduct a gamma correction based augmentation on each individual frame of a given video cube. Considering the face captured by a certain camera model with gamma value γ 1 , the gamma correction process to γ 2 can be represented as

2）基于伽马校正的增强：为了考虑由于不同类型的捕获设备而产生的显示介质的多样性，我们对给定的视频立方体的每个帧进行伽马校正增强。考虑到用γ值为γ1的摄像机模型捕捉到的人脸，对γ2的伽马校正过程可以表示为：

where I and I aug are the original pixel and augmented pixel, respectively, in RGB space. ‘|·|’ denotes the round and truncation operations, where the output value is truncated into the range [0,255]. Since the camera performs linear correction (γ = 1.0) and exponential gamma correction (e.g. γ = 2.2) before display, 1 we choose the ratio γ 2 /γ 1 to be 1.0/2.2 and 2.2/1.0 for augmentation in our work. We show an example 。

0of gamma correction based augmentation in Fig. 3.

其中I和I aug分别是RGB空间中的原始像素和增广像素。“|·|”表示圆形和截断操作（机下取整），其中输出值被截断到范围[0，255]。因为摄像机执行线性校正(γ=1.0)并在显示前进行了指数伽玛校正(如γ=2.2)，所以我们选择γ2/γ1为1.0/2.2和2.2/1 0作为增强，图3给出了基于γ校正的增强图。

图3、基于伽玛校正基础上的数据增强的图解。(A)原始脸；(B)伽马校正比1.0/2.2的脸；(C)伽马校正比2.2/1.0的脸。

C. Model Generalization（模型泛化）

Although deep learning is powerful in learning representative information when training data are diverse, it may still suffer from performance degradation when test data are “unseen”, such as the test samples obtained from a different environment from the training data. Generally speaking, it is impossible to involve face samples captured by all types of cameras from every potential scenario. In view of this,we leverage the advantage of domain generalization [54] to solve this problem. More specifically, given face samples from a few different capturing conditions, by partitioning the face samples into different domains based on the capturing conditions, we aim at learning a robust representation across different domains for face spoofing detection by introducing the generalization loss as the regularization term. As such, the generalization capability of the network can be better enhanced.

尽管在训练数据多样化的情况下，深度学习在学习表示信息方面有很强的作用，但是当测试数据“看不见”时，它仍然会受到性能下降的影响，例如，从与训练数据中不同的环境中获取的测试样本。一般来说，不可能获得从每一种可能的场景中并涉及到所有类型的摄像机捕捉到的面部样本。鉴于此，我们利用领域泛化[54]的优势来解决这个问题。更具体地说，给出几个不同捕获条件下的人脸样本，根据捕获条件将人脸样本划分成不同的区域，通过引入泛化损失作为正则化项，学习不同域间的鲁棒表示来进行人脸欺骗检测。

因此，可以更好地提高网络的泛化能力。

假设有来自L个训练域的样本，用 X = [X 1 ,X 2 ,...,X L ]表示，Xi代表区域I中的样本，x中的样本总数为 N 1 + N 2 + ... + N L，其中N 1 , N 2 ,..., NL 是来自每个区域的样本数。另外，假定网络的第f层的特征输入为，其中是指从域i（的数据）得到的第f个全连通层的特征。我们进一步表示，作为中第k个样本的输入特征。为了使来自不同领域的特征分布对齐，我们采用了最大平均偏差(Maximum Mean Discrepancy---MMD)[55]，这是衡量两种分布之间相似性的一种流行的度量方法，以最小化区域间的特征分布差异。因此，给定两个分布，如果它们之间的MMD距离等于零，它们是相同的。为了学习广义特征表示，我们的目标是优化网络，将输入样本X嵌入Yf，使不同区域之间的MMD距离最小化[55]。

这里给出了多个区域间的MMD距离的定义：

它可以进一步重写为：

其中Kf是基于Yf的 Gram矩阵，Kf=，而Q定义为：

Q是基于域对样本定义的系数矩阵。特别地，给出了域i和j的矩阵块Qi，j的定义：

其中，表示维数为的全1矩阵.泛化损失相对于网络参数Θ的梯度可以计算为：

其中，可通过反向传播方法获得[56]。

为了学习我们提出的三维CNN网络的广义特征表示，我们从零开始对从多个区域采集的具有交叉熵损失(L)[57]的人脸样本进行训练。此外，需要同时最小化各区域之间的MMD距离。因此，网络参数可以通过下式进行学习：

其中，θ是网络参数，而R的定义如下：

这里f是网络中完全连接层的数目，在我们的工作中设置为2，因为我们建议的网络中有两个完全连接的层。

---------------------------------------------------------未完待续---------------------------------------------------------------------

你可能感兴趣的:(反欺诈技术,论文翻译,Learning,Generalized,Deep,Feat,论文翻译,中英对照,人脸反欺诈)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
2019-11-04复盘——飞来山上千寻塔，闻说鸡鸣见日升。那一叶秋
1、大盘篇先上老图，看习惯了，也就知道走势了图1上证指数日线图还是那张老图，自己可以在自己的相关软件上画出来，快变盘了。2、个股篇未加仓、未减仓。分析量能的时候，突然发现这么一个东西：“放量突破年线，缩量回调。”合众科技日线图其实，最近的N只个股，在技术分析上，都到了变盘的临界时候。结合这么久的走势，特别是ZJH不断放开IPO的申请，本质上说是融资难度变大，或者说是为企业的融资开创便利。但现在市场
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
教育用心灵温暖心灵
@陈春丽长期学习班冯倩。今天一早就听到说高职合并，取消中专教育的教育信息。感觉是虽然知道，再听还是吓一跳。国家重视职业教育为何还要取消中专技术学校的教育？再听高中就要进行技术教育了，一部分人学习好继续努力学习考大学，一部分人在高中就可以进行职业教育接受职业教育了还要中专技术教育学校干什么呢！a有些职业教育学校转型升级快，不是孩子上完给找工作，而是学校帮孩子创业，我觉得是不错的方向！新闻新你得实时更
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
EIO国际确定性的交易（3/10）资管，资金委托安全吗？古城鹏哥
大家可能都知道资金托管，账户是自己开，钱在自己的账户上，密码是由自己掌控，别人提不走你账户的资金，每天可以看下到自己的账户，也可以看到交易流水。现金只能提到自己的银行卡中。账户由技术人员或操作人员，或者是机构团队帮你操作账户，产生盈利和收入，以获得的利润来分配盈利，技术强硬和做的时间久了过硬技术团队，会保证你的资金本金，不会让你的本金亏损的按照一定比例分配收入。所以在这个过程当中一定要看清楚技术的
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
【六】阿伟开始搭建Kafka学习环境能源恒观中间件学习 kafka spring
阿伟开始搭建Kafka学习环境概述上一篇文章阿伟学习了Kafka的核心概念，并且把市面上流行的消息中间件特性进行了梳理和对比，方便大家在学习过程中进行对比学习，最后梳理了一些Kafka使用中经常遇到的Kafka难题以及解决思路，经过上一篇的学习我相信大家对Kafka有了初步的认识，本篇将继续学习Kafka。一、安装和配置学习一项技术首先要搭建一套服务，而Kafka的运行主要需要部署jdk、zook
提高教师信息素养，提高道德与法治课教学效益长白159宋彦红
提高教师信息素养，提高道德与法治课教学效益随着经济和社会的发展，信息技术已经运用到课堂教学中，为课堂教学展示了一个崭新的天地。的确，信息技术形象、生动、直观性强，能够将课本中的一些抽想的概念直接展示在学生面前，从而调动学生的眼、耳、脑，让他们兴奋起来，变被动学习为主动学习，充分发挥教师的教育引导作用，创造一个可以使学生积极参与的场景。在制作、使用信息技术的实践过程中，本文拟就教师提升信息素养的必要
ExpRe[25] bash外的其它shell：zsh和fish tritone ExpRe bash linux ubuntu shell
文章目录zsh基础配置实用特性插件`autojump`语法高亮自动补全fish优点缺点时效性本篇撰写时间为2021.12.15，由于计算机技术日新月异，博客中所有内容都有时效和版本限制，具体做法不一定总行得通，链接可能改动失效，各种软件的用法可能有修改。但是其中透露的思想往往是值得学习的。本篇前置：ExpRe[10]Ubuntu[2]准备神秘软件、备份恢复软件https://www.cnblogs
TDengine 签约前晨汽车，解锁智能出行的无限潜力涛思数据（TDengine） tdengine 汽车大数据
在全球汽车产业转型升级的背景下，智能网联和新能源技术正迅速成为商用车行业的重要发展方向。随着市场对环保和智能化需求的日益增强，企业必须在技术创新和数据管理上不断突破，以满足客户对高效、安全和智能出行的期待。在这一背景下，前晨汽车凭借其在新能源智能商用车领域的前瞻性布局和技术实力，成为行业中的佼佼者。前晨汽车采用整车数据采集和全车数据打通策略，能够实时将数据推送至APP端客户。然而，这导致整体写入和
你可能遗漏的一些C#/.NET/.NET Core知识点追逐时光者 C#.NET DotNetGuide编程指南 c#.net .netcore microsoft
前言在这个快速发展的技术世界中，时常会有一些重要的知识点、信息或细节被忽略或遗漏。《C#/.NET/.NETCore拾遗补漏》专栏我们将探讨一些可能被忽略或遗漏的重要知识点、信息或细节，以帮助大家更全面地了解这些技术栈的特性和发展方向。拾遗补漏GitHub开源地址https://github.com/YSGStudyHards/DotNetGuide/blob/main/docs/DotNet/D
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n