uuu_柚子

MARLIN: Masked Autoencoder for facial video Representation LearnINg

题目	MARLIN: Masked Autoencoder for facial video Representation LearnINg
译题	MARLIN：用于面部视频表示的 maked 自动编码器 LearnINg
时间	2023年
期刊/会议	CVPR

论文链接：MARLIN_MASKED_Autoencoder_for_Facial_Video_Representation_Learning

MARLIN：用于面部视频表示的 maked 自动编码器 Learning

摘要：本文提出了一种从视频中学习通用面部表示的自监督方法，该方法可以在各种面部分析任务中进行转换，如面部属性识别（FAR）、面部表情识别（FER）、深度伪造检测（DFD）和嘴唇同步（LS）。我们提出的框架名为 MARLIN ，是一种面部视频屏蔽自动编码器，它从大量可用的无注释网络爬行面部视频中学习高度鲁棒和通用的面部嵌入。作为一项具有挑战性的辅助任务，MARLIN 从主要包括眼睛、鼻子、嘴巴、嘴唇和皮肤的密集面部区域重建面部的时空细节，以捕捉局部和全局方面，进而帮助编码通用和可转移特征。通过对不同下游任务的各种实验，我们证明 MARLIN 是一款出色的面部视频编码器和特征提取器，在各种情况下都能始终如一地表现良好，包括FAR（比监督基准增益1.13%）、FER（比无监督基准增益2.64%）、DFD（比无监管基准增益1.86%），LS（Frechet Inception Distance 增益29.36%），甚至在低数据状态下也是如此。

1 Introduction

面部分析任务[34，43，70，85]为人类非言语行为分析提供了基本线索，并有助于展开关于社交[36]、沟通[40]、认知[68]的有意义的见解，在人机交互（HCI）和情感计算领域具有潜在应用。最近，我们见证了深度神经网络模型在解决面部分析任务方面的重大进展，如面部属性识别（FAR）[34，85]、面部表情识别（FER）[48]、深度伪造检测（DFD）[70]和嘴唇同步（LS）[43]。虽然这些深度模型可以实现可注释的性能，但它们通常需要大规模的注释数据集，这不仅是一个资源昂贵和耗时的过程，而且对于一些需要领域专业知识进行注释的应用程序（例如 FER ）来说也是不可行的。

为此，自监督预训练[26，37，71]最近成为解决完全监督方法局限性的有效策略，因为它能够从非注释数据中进行通用表示学习，然后可以在具有有限标签的任务之间进行转移。对于自然场景和物体的图像，使用自蒸馏[14]、对比学习[18，19]、解决拼图等文本前任务[53]以及最近的自动编码[37，71]的自监督学习方法甚至优于监督学习方法。

尽管这些自监督方法在学习自然场景图像和视频的可伸缩和通用表示方面做出了承诺，但尚未对这些方法从面部视频数据中学习表示进行研究。面部表示学习需要跟踪精细的面部特定细节，而线性管掩蔽可能无法完美捕捉这些细节[71]。到目前为止，大多数与面部分析任务相关的现有方法都是高度专业化的，并开发了以完全监督的方式训练的任务特定模型[46，54，63]，而最近很少有人致力于学习基于图像的通用面部编码[10，84]。这些密切相关的工作[10，84]要么专注于探索训练数据集在大小和质量方面的属性[10]，要么以视觉语言的方式进行预训练[84]。这些工作[10，84]很难缩放，因为它们使用静态图像级的面部信息，并且图像字幕对与上下文信息而不是面部高度相关。

在本文中，我们的目标是以自监督的方式学习人脸相关下游任务的通用和任务无关表示（见图1）。为此，我们使用了一种具有面部引导掩蔽策略的掩蔽自动编码器[37，71]，该策略学习使用未注释的视频从密集掩蔽的面部区域重建面部的时空细节。与现有的自然场景视频方法[71]不同，在现有方法中，tubemasking 是用没有任何语义信息的视频的静态部分初始化的，我们的方法动态跟踪面部，然后使用现成的面部解析器（即 FaceXZoo [75]）开发面部部分引导的 Tubemask 策略。因此，我们提出了一项更具挑战性的任务，鼓励模型学习时空表示，以覆盖局部和全局信息。受先前工作[27，60]的启发，这些工作显示了高质量的重建结果以及丰富和通用的潜在特征，我们在掩蔽编码的基础上加入了对抗性损失，以提高重建质量。我们的实验结果表明，我们提出的框架 MARLIN 学习了高度通用的面部编码，该编码可以在不同的面部分析任务（如 FER、DFD、FAR 和 LS ）之间很好地扩展和传输，并相对于最先进的基准实现了有利的性能增益。总之，我们的主要贡献是：

我们提出了 MARLIN ，这是一种通用的、与任务无关的面部编码器，它以自监督的方式从大量可用的无注释网络爬行面部视频中学习鲁棒和可转移的面部表示。
作为一项具有挑战性的辅助任务，我们建议从密集的面部区域重建面部的时空细节。所提出的面部区域引导管掩蔽（又名 Fasking ）策略旨在从面部视频中学习局部和全局方面，这反过来又有助于对通用和可转移特征进行编码。
通过广泛的定量和定性分析，我们发现 MARLIN 学习了丰富、通用、可转移和鲁棒的面部表示，它在各种下游任务中始终表现良好，包括 FAR （比监督基准提高1.13%）、FER（比无监督基准提高2.64%）、DFD（比无监管基准提高1.86%），LS（Frechet Inception Distance增益29.36%），甚至在少数镜头设置中也是如此。

2 Related work

屏蔽自动编码器。基于掩蔽区域重构的假设，掩蔽自动编码器学习鲁棒和可转移的表示。掩码自动编码的动机是上下文编码器[56]和去噪编码器[73]。在基于 BERT [26]的掩蔽成功后，视觉界还探索了掩蔽自动编码的不同设计选择，如像素级掩蔽[17，37，80]、令牌级掩蔽[29]和基于深度特征的掩蔽[6，77]，使用视觉转换器[44，52]。类似地，为了对输入数据的时空模式进行建模，最近引入了掩蔽运动建模[69]和管掩蔽[71]策略。沿着这条线，MARLIN 掩蔽并重建特定领域的面部部分，以学习通用的面部表示。

面部表征学习。到目前为止，大多数现有的面部分析方法都是以特定任务的方式，以完全监督的方式[46，54，63]对手动注释的数据进行的，以提高性能。任何最先进的模型在基准数据集上的性能都会受到训练期间使用的注释数据的质量和数量的影响。表1显示了过去十年[1]中为促进面部验证（ LFW[39]、MS-cele1M[34]、VGG-Face[54]、VGGFace2[13]）、面部属性识别（CelebA[50]、CelebV-HQ[85]）、面部情绪识别（CMU-MOSEI[83]）、，深度伪造检测（FF++[62]）和嘴唇同步（LRS2[22]）。然而，数据管理遇到了一些挑战，例如对专用硬件的要求（例如，FER和行动单元数据），阻止多个数据集合并的数据分布差异[10]，以及最重要的耗时和资源昂贵的注释过程。为了消除这些缺点，一些现有的方法[20，81，82]采用了通过图像或视频合成的数据增强策略，因为生成对抗性网络（GAN）[20，67，81，82]和其他生成技术[16，35]推动的人脸生成技术的激增有助于逼真的人脸生成，即使可以控制面部属性。这些生成技术在数量上增加了训练集的变化，但在某些情况下，由于特定领域的不一致性和更重要的是高网络复杂性，它在定性方面仍然滞后。

为此，最近很少有工作旨在在有限的监督下学习基于图像的任务特定面部编码[3，9，10，65，84，86，86]。最密切相关的现有工作[10，84]要么专注于探索训练数据集在大小和质量方面的属性[10]，要么以视觉语言的方式进行预训练[84]。这些工作10，84]很难缩放，因为它们使用静态图像级的面部信息，并且图像字幕对与上下文信息而不是面部高度相关。在这项工作中，我们的目标是开发一种通用的、通用的、与任务无关的面部编码器，该编码器可以从网络抓取的无注释数据中学习。我们的实验分析表明，MARLIN 可以将潜在空间流形与任何所需的下游任务特定标签空间对齐。因此，MARLIN 有能力在许多低资源的现实世界应用中充当强大的面部编码器或特征提取器。

3 MARLIN

我们的目标是从大量可用的非注释面部视频数据中学习稳健和可转移的通用面部表示[78]。如果我们从整体上思考，面部特定任务涉及两个不同的方面：a）面部外观相关属性，如面部的部分（鼻子、眼睛、嘴唇、头发等）、面部形状和纹理，这些主要需要空间调查；以及b）面部动作，例如情绪、面部动作编码系统（FACS）、需要时间信息的嘴唇同步。因此，为了学习强、鲁棒和可转移的表示，时空建模是非常可取的。为此，我们提出的框架 MARLIN 采用了面部区域引导的掩蔽策略，这为自监督表示学习提出了一项具有挑战性的辅助重建任务（见图2）。为了便于从掩蔽自动编码器中学习，我们主要选择 YouTube Faces[78]数据集，该数据集使用来自具有变体的 YouTuber 的网络爬行面部视频，该视频在不同的现实生活条件下具有变化。

3.1 面部表示学习

准备工作。MARLIN 由编码器（ $\mathcal{F}_{\phi_\epsilon}$ ）、解码器（ $\mathcal{F}_{\phi_\mathcal{D}}$ ）和鉴别器（ $\mathcal{F}_{\phi_\Gamma}$ ）组成，分别具有嵌入参数 $\phi_\epsilon$ 、 $\phi_\mathcal{D}$ 和 $\phi_\Gamma$ 。给定训练数据集 $\mathcal{D}=\{ V_i \}_{i=1}^N$ ，其中 $N$ 是数据集中视频的数量， $\in \mathcal{R}^{C*T_0*H_0*W_0}$ ， $C, T_0, H_0, W_0 )$ 分别是原始视频的通道、时间深度、高度和宽度。从原始输入视频 $V$ 中，我们跟踪并裁剪面部区域[75]，然后进行随机时间采样，表示为 $\in \mathcal{R}^{(C*T*H*W)}$ （ $T ， H ， W$ 分别是导出视频剪辑的修改后的时间深度、高度和宽度）。导出的视频剪辑 $v$ 进一步映射到 $(k - n)$ 个可见的和 $n$ 个掩蔽的令牌，通过具有预定义掩蔽比 $r=\dfrac{n}{k}$ 的面域引导掩蔽策略 $\mathcal{F}_{\phi_f} )$ 表示为 $\{ \tilde{X}_v \in \mathbb{R}^{(k-n)*e}, \tilde{X}_m \in \mathbb{R}^{n*e} \}$ 。这里， $e$ 是嵌入维度， $k$ 是从 $v$ 导出的令牌的总数，即 $k=\dfrac{T}{t}*\dfrac{H}{h}*\dfrac{W}{w}$ ，给定的三维立方体令牌的每个维度为 $t * h * w$ 。因此， MARLIN 在上述令牌空间中注入面部区域特定的领域知识，以通过掩蔽来指导表示学习。

可见标记 $\tilde{X}_v$ 通过以下映射函数 $\mathcal{F}_{\phi_\epsilon} : \tilde{X}_v \to z$ 映射到潜在空间 $z$ 。潜在空间特征 $z$ 被进一步馈送到解码器 $\mathcal{F}_{\phi_\mathcal{D}}$ ，解码器 $\mathcal{F}_{\phi_\mathcal{D}}$ 通过以下映射 $\mathcal{F}_{\phi_\mathcal{d}}$ ：将 $z$ 重构为 $n$ 个掩蔽令牌 $\mathcal{F}_{\phi_d}: z \to X'_m$ 。在解码器中，相应的可见和掩蔽的 3D 立方体包含表示为 $e ＝ Ct h w$ 的平坦原始像素。简言之，给定可见令牌 $\tilde{X}_v$ ，我们通过以下函数重建掩蔽令牌：
$X'_m = \mathcal{F}_{\phi_\mathcal{D}} \circ \mathcal{F}_{\phi_\epsilon}(\tilde{X}_v) \kern10em(1)$
从原始像素重建时空面部模式是非常具有挑战性的，我们部署了一个具有对抗性训练的鉴别器 $\mathcal{F}_{\phi_{\Gamma}}$ 以进行更好的合成。

3.2 自监督的表征学习

MARLIN 的自监督预训练策略由以下三个主要组成部分组成：a）面部区域引导管式蒙面（Fasking）。为了捕捉时空对应关系，我们部署了面部区域特定的管道掩蔽策略，如下[71]。我们为每个时空立方体在时间轴上动态跟踪和掩盖面部成分。我们基于面部区域的管状掩蔽策略确保在整个时间立方体中掩蔽相同的面部区域，从而提出了一项具有挑战性的重建任务，并促进了局部和全局面部细节的学习（见Alg.1）。由于掩蔽的时空立方体看起来像可变形的弯曲管，我们将其称为面部区域引导管掩蔽，也称为 Fasking 。

我们从使用 FaceXZoo [75]库进行人脸解析开始，该库将面部区域划分为以下部分{左眼、右眼、鼻子、嘴巴、头发、皮肤、背景}（图第2（b）段）。在面部区域中，我们将以下集合 $P={左眼、右眼、鼻子、嘴巴、头发}$ 优先于皮肤和背景，以保留面部特定的局部和稀疏特征。为了保持预定义的掩蔽比率 $r$ ，来自优先级集合 $P$ 的面部区域在帧之间被掩蔽，首先是 ${background，skin\}$ 掩蔽。因此， $F a s kin g$ 生成 $n$ 个掩蔽的和 $（ k - n ）$ 个可见的令牌。在输入 $v$ 的所有帧中，我们跟踪预定义集合中的特定面部区域，以编码和重建模型面部运动的时空变化。因此，在对特定主题的外观和细粒度细节进行编码的同时，时尚策略对重建提出了更多挑战。

b）屏蔽自动编码器。在 $F a s kin g$ 之后， $（ k - n ）$ 个可见令牌被输入到编码器 $\mathcal{F}_{\phi_\epsilon}$ ，编码器将令牌映射到潜在空间 $z$ 。可见令牌用作生成人脸的掩蔽对应物的参考。因此，解码 $\mathcal{F}_{\phi_\mathcal{D}}$ 将潜在空间 $z$ 映射到重新构建的掩蔽令牌 $X'_m$ 。请注意，与 VideoMAE [71]类似，我们采用 $Vi T$ [28]架构作为 MARLIN 的主干。在掩蔽立方体 $X_m$ 和它们的重构对应体 $X'_m$ 之间施加重构损失（ $\mathcal{L}_{recon}$ ）以指导学习目标。

c）对抗性适应战略。为了提高丰富表示学习的生成质量，我们在屏蔽自动编码器主干之上加入了对抗性自适应。根据先前的文献[27，60]，对抗性训练提高了生成质量，这反过来又导致了丰富的潜在特征 $z$ 。如图2所示的鉴别器 $\mathcal{F}_{\phi_\Gamma}$ 是一个基于MLP 的网络，它在 $X_m$ 和它们重构的对应物 $X'_m$ 之间施加对抗性损失 $\mathcal{L}_{adv}$ 。

3.3 总的 MARLIN Loss

算法 2 总结了 MARLIN 框架的培训过程。MARLIN 主要施加（a）重建损失和（b）对抗性损失，以促进训练。

a)重构损失。给定输入掩码令牌 $\tilde{X}_m$ ，掩码自动编码器模块将其重构 $X^{'} m$ 。为此，我们最小化 3D 令牌空间中的均方误差损失，以更新 $(\mathcal{F}_{\phi_{\Gamma}} \circ \mathcal{F}_{\phi_\epsilon} \circ \mathcal{F}_{\phi_f})$ 分支。损失定义为：
$\mathcal{L}_{recon}= \displaystyle\dfrac{1}{N} \displaystyle\sum_{i=1}^N \lVert X^{(i)}_m-X'^{(i)}_m \rVert_{2} \kern10em (2)$
其中 $N$ 是 $\mathbb{D}$ 中数据的总数， $X^{(i)}_m$ 和 $X'^{(i)}_m$ 是 $\mathbb{D}$ 中第 $i$ 个数据的掩码令牌和重构。

b)对抗性损失。对抗性自适应考虑了 Wassenstain GAN 损失[5]，以更好地重建时空面部模态，这反过来又有助于学习丰富的表示。损失定义如下：
$\mathcal{L}^{(d)}_{adv}=\displaystyle\dfrac{1}{Nn}\displaystyle\sum_{i=1}^N() \kern10em (3) \\ \mathcal{L}^{(g)}_{adv}=\displaystyle\dfrac{1}{Nn}\displaystyle\sum_{i=1}^N() \kern10em (4)$
因此，整体学习目标 $\mathcal{L}$ 公式如下，其中 $λ_{W}$ 是加权参数：
$\mathcal{L}^{(g)} = \mathcal{L}_{recon}+λ_{W}\mathcal{L}_{adv}^{(g)} \kern10em (5) \\ \mathcal{L}^{(d)} = \mathcal{L}^{(d)}_{adv} \kern10em (6)$
在 MARLIN 的预训练阶段， $\mathcal{L}^{(d)}$ 更新参数 $\phi_{dis}$ ， $\mathcal{L}^{(g)}$ 更新参数 $\phi_{e}, \phi_{d}$ 。

3.4 下游适应

我们提出的 MARLIN 框架以自监督的方式从面部视频中学习鲁棒和可转移的面部表示。根据标准评估协议，我们采用线性探测（LP）和微调（FT）对不同的人脸相关任务进行下游自适应（见图 2 推理模块）。给定任何特定于任务的下游数据集 $\mathbb{D}_{down} = \{ v_j, y_j \}^N_{j=1}$ ，我们部署具有嵌入参数 $θ$ 的线性全连接（FC）层，以将潜在空间与编码器模块 $F$ 的顶部的下游特定于任务标签空间对齐。对于线性探测，我们冻结骨干网络 $\mathcal{F}_{\phi_{\epsilon}}$ ，只更新 $\mathcal{F}_θ$ 。另一方面，对于 $FT$ ，我们微调整个模块，即（ $\mathcal{F}_{\phi_{\epsilon}} \circ \mathcal{F}_θ$ ）。当 MARLIN 被用作 LP 的特征提取器时，它使用滑动时间窗口来提取输入人脸裁剪视频 $V$ 的特征 $Z$ ，如图 2 所示。不同下游面部任务的细节如下所述：

面部属性识别（FAR）预测给定面部视频的外观和动作属性的存在，例如性别、种族、头发颜色和情绪。预测面部属性的问题可以被提出为一个高度依赖于丰富的空间编码的多标签学习问题。出于下游适应的目的，我们使用了来自 $C e l e bV H Q$ [85]数据集的 28532 个训练、 3567 个验证视频和 3567 个测试视频。根据先前的工作[33，50，84]，我们报告了平均精度(↑)，曲线下面积（AUC↑) 所有属性。

面部表情识别（FER）任务对时空面部肌肉运动模式进行编码，以预测给定面部视频的相关对象的情绪（6类）和情绪（7类和2类）。我们在 $CM U - MOSE I$ 数据集[7]上评估了 MARLIN 的性能，该数据集是一个会话语料库，具有 16726 个训练、1871 个验证数据和 4662 个测试数据。在之前的工作[7，25]之后，我们使用整体准确性(↑) 作为度量。

深度伪造检测（DFD）任务在给定来自 $FF + +$ （LQ）数据集的面部视频的情况下预测时空面部伪造[62]。对于下游适应，我们使用来自 $FF + +$ （LQ）数据集的 3600 个训练、 700 个验证样本和 700 个测试样本视频[62]。根据先前的文献[12，58，76]，我们使用准确性(↑) 和AUC(↑) 作为评价指标。

嘴唇同步（LS）是另一个需要面部区域特定时空同步的研究领域。这种下游适应进一步阐述了 MARLIN 对人脸生成任务的适应能力。为了适应，我们用 MARLIN 替换了 Wav2Lip [57]中的面部编码器模块，并相应地调整时间窗口，即从 5 帧调整到 $T$ 帧。为了进行评估，我们使用 $L RS 2$ [22]数据集，该数据集具有 45838 个训练、1082 个验证视频和 1243 个测试视频。根据先前的文献[57，74]，我们使用唇同步误差距离（LSE-D↓), 唇同步误差置信度（LSE-C↑) 和 Frechet 起始距离（FID↓) [38]作为评估矩阵。

4.实验和结果

我们从定量（见第 4.2 节）和定性（见第 4.3 节）的角度全面比较了我们在不同下游适应任务上的方法。此外，我们还进行了广泛的消融研究，为我们的设计选择提供理由。

4.1 实验协议

数据集。我们在第 3.4 节中描述的不同面部分析任务上评估 MARLIN 框架。简言之，我们使用 $C e l e bV - H Q$ [85]进行面部属性和动作预测，使用 $CM U - MOSE I$ 数据集[7]进行会话情绪和情绪预测，使用 $FF + +$ （LQ）数据集[62]进行深度伪造检测，使用 $L RS 2$ [22]进行嘴唇同步。

设置。为了进行公平的比较，我们遵循特定于任务的先前文献[7，22，33，50，62，84]中提到的特定于数据集的实验协议。除了传统的评估之外，我们还执行了少镜头自适应策略，以显示 MARLIN 的鲁棒性和可转移性。

实现细节。我们用 $N v i d ia RTX A 6000 GP U$ 在 $P y T orc h$ [55]上实现了该方法。首先，给定面部视频的任何时间块，连续帧都是高度冗余的。因此，为了考虑在帧之间具有显著运动的语义上有意义的帧，我们采用最小时间步长值为 2 。给定输入视频（维度为3×16×224×224），立方体嵌入层生成维度为 2×16×16 的 8×14×14 个 3D 标记，以保存时空模式。使用 Fasking 策略（参见算法1）， MARLIN 以预定义的掩蔽比率密集地掩蔽这些令牌。我们的经验分析表明， MARLIN 在高掩蔽率（90%）下工作良好。 MARLIN 的目标是从稀疏的可见标记生成掩蔽部分。在 Fasking 之后，每个令牌被映射到 768 的潜在空间嵌入维度。根据该潜在嵌入，在 3D 令牌空间中重建掩蔽部分，该 3D 令牌空间可以进一步映射到原始视频。为了进行公平的比较，我们使用 ViT-B 作为主干编码器，尽管消融研究中描述了其他 ViT 变体的影响。预训练超参数如下：基本学习率相对于整个批量大小线性缩放，学习率（ lr ）=基本学习率×批量大小/256。

对于自监督预训练，我们使用基本学习率为 $1.5 e - 4$ ，动量 $β_1=0.9，β_2=0.95$ 的 AdamW 优化器和学习率调度器（余弦衰减）[51]。对于线性探测，我们使用 Adam 优化器，其中 $β_1=0.5，β_2=0.9$ ，基本学习率 $1 e - 4$ ，权重衰减 $0$ 。对于微调，我们使用 Adam 优化器，其中 $β_1=0.5，β_2=0.9$ ，基本学习率 $1 e - 4$ ，没有任何权重衰减。

4.2定量分析

4.2.1 与最新（SOTA）面部分析任务的比较。

我们根据标准任务特定评估协议[7，22，33，50，62，84]，比较了 MARLIN 与不同下游面部分析任务的性能。
面部属性。在表 2 中，我们比较了 MARLIN 与流行的反式异构体（即 MViT-v1 [30]和 MViT-v2 [49]）和细胞神经网络（即 R3D [72]）在 CelebV-HQ [85]数据集上的 LP 和 FT 适应性能。从表中可以看出，MARLIN 的 FT 版本比有监督的 MViT-v2 [49]变压器架构高1.13%（92.77%→ 93.90%）和0.33%（95.15%）→ 95.48%）。R3D CNN 模块也观察到了类似的模式。我们将 MARLIN 的性能增益归因于预训练策略，该策略对来自任何输入面部视频的通用、鲁棒和可转移特征进行编码。

情绪和情感。在表 3 中，我们同样比较了会话情感和情感在准确性方面的 LP 和 FT 适应表现(↑) 和 AUC (↑) 在 CMU-MOSEI [83]数据集上。请注意，MARLIN 是一种仅限视觉模态的编码器。结果表明，MARLIN 的表现与 SOTA 方法相比具有竞争力[25，45，49]，尤其是它比无监督的 SOTA CAE-LR [45]强 2.64%（71.06%→ 73.70%）。对于情绪和 7 类情绪，它略微优于监督基准[49]。这些结果还表明，MARLIN 从预训练中学习到了高度通用、鲁棒和可转移的特征表示。

DeepFake检测。在表 4 中，我们比较了 FaceForensics++ [62]数据集上视频操作的性能，并根据视频级别的准确性报告了结果(↑) 和AUC(↑)。结果表明，MARLIN 的性能优于监督 SOTA 方法[2，8，15，21，24，32，47，59，61，72]。这是第一个只使用时空视觉信息异常来检测视频操纵的 SSL 工作。除非 F3Net，它在时间维度上使用频率感知模式以监督的方式检测伪造品。而 MARLIN 与频率模式无关地学习面部表示，并可以从时空信号中检测异常。

嘴唇同步。为了进行公平的比较，我们采用了以下实验设置：1） $Wa v 2 L i p + Vi T$ ：比较 $Vi T$ 架构[28]对 $SOT A CNN s$ 和 MARLIN 的贡献，其中 $Vi T$ 的权重是在 $L RS 2$ [22]数据集上从头开始训练的。2） $Wa v 2 L i p + Vi T + Vi d eo M A E$ ：比较香草 VideoMAE 与在 YTF [78]数据集上预先训练的 ViT 主干的贡献。2） $Wa v 2 L i p + Vi T + M A R L I N$ ：比较在 YTF [78]与 SOTA [57，66，74]和不同设计方面预先训练的 MARLIN 的贡献。实验结果如表 5 所示。LSE-D↓, LSE-C公司↑ 和FID↓ 作为遵循标准协议的评估指标[38，57，66，74]。唇同步分数的提高（LSE-D↓: 7.521→ 7.127；FID↓: 4.887→ 3.452）表明 MARLIN 学习了丰富的时空模式，这些模式是可转移的和鲁棒的。同样有趣的是， MARLIN 也适用于面部特有的细粒度特征。

4.2.2 很少镜头适应

最近很少有镜头适应受到关注，因为它的适应能力非常低[9，65，84，86]。根据标准评估协议[9，65，84，86]，我们还研究了 MARLIN 的适应能力。给定任何下游数据集，我们使用有限的训练集标签来对齐输出歧管，同时通过 LP（MOSEI，CelebV-HQ）和 FT（FF+）策略保持测试集固定。从表 6 中可以看出，在不同的任务中，性能略有下降，这进一步表明 MARLIN 学习通用、可转移和自适应信息。

4.2.3消融实验

我们进行了广泛的消融研究，以显示每个组件的有效性。

1）遮蔽比例。我们在 [0.05-0.95] 范围内使用不同的掩蔽比，并在 CMU-MOSEI [83]数据集上重复预训练，然后进行 LP 。从图 3 中，我们可以看出，大约 90% 的掩蔽比对于 MARLIN 来说是最佳的。在较小的掩蔽比（即≤0.5）下，重建任务可以获得更多的信息，这会降低特征质量。同样，超过 90% ，重建任务变得更具挑战性，导致性能下降。根据经验证据，我们在所有实验中都将掩蔽率设置为 90% 。

2）蒙面策略。我们进一步将所提出的 Fasking 策略与现有的掩蔽策略[31，71]进行了比较，即帧掩蔽、随机掩蔽和管掩蔽。表 7 中的实证结果表明 Fasking 更好。

3）不同的模块。我们逐步集成每个模块，并观察其对 CMU-MOSEI [83]和 FF++ [62]下游性能的影响，同时保持其他组件不变。从表 7 中，我们可以看出，Fasking 和对抗性训练（AT）的加入提高了性能，反映了每个组成部分的重要性。

4）编码器架构。研究骨干编码器架构的影响，并比较 ViT-S、ViT-B 和 ViT-L（见表 7 ）。我们观察到，更大的模型尺寸提高了性能。为了公平比较，我们使用了 ViT-B 编码器。

4.3 质量方面

为了了解学习特征的有效性，我们进一步进行了以下定性分析。

1）面部属性。我们使用梯度加权类激活映射（Grad-CAM）[64]可视化 MARLIN 关注的重要区域。在图 4 顶部，热图结果基于 CelebV-HQ [85]数据集（外观任务）上 MARLIN 特征之上的 LP，表明 MARLIN 专注于面部属性，如头发、眼镜、帽子等。

2）嘴唇同步。在图 4 底部，我们给出了面部下部的生成结果，这是一项具有挑战性的任务。顶部、中间和底部的行分别显示了地面实况、香草 Wav2Lip [57]的输出和 MARLIN 的输出以及特写镜头。在这里，Wav2Lip 的 CNN 编码器未能定位唇部区域（如图 4 的 Wav2Lip 行所示，红色突出显示），而 MARLIN 尽管 fasking 策略上进行了预训练，但其自适应性足以为 MARLIN 的面部嘴唇同步任务生成更有效的结果。

5 总结

在本文中，我们旨在学习一种通用的面部编码器 MARLIN ，它具有自适应、鲁棒性和可转移性，适用于不同的面部分析任务。作为一项具有挑战性的辅助任务，MARLIN 从密集掩蔽的面部区域重建面部的时空细节，以捕捉局部和全局方面，这反过来又有助于编码通用和可转移特征。更广泛的影响。

我们相信 MARLIN 可以作为不同下游面部分析任务的良好特征提取器。由于其丰富的面部特征，可以很容易地将 MARLIN 部署在低资源（例如移动设备、Jetson Nano平台）设备中，用于现实世界的应用。局限性由于该模型是在 YouTube Face 数据集[78]上训练的，因此在身份的种族和文化背景方面可能存在潜在的偏见。当我们使用现有的人脸检测库[75]时，也可以在模型中引入潜在的偏差。我们将在更新后的版本中消除这些限制。

你可能感兴趣的:(研究性论文相关笔记,人工智能)

C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
入门html这篇文章就够了 ξ流ぁ星ぷ132 html 前端
HTML笔记文章目录HTML笔记html介绍什么是htmlhtml的作用HTML标签介绍常用标签标签and标签and标签u标签del删除线br标签用于换行pre标签，预处理标签span标签div标签sub标签andsup标签hr标签h1,h2...h6标签：HTML5中的语义标签：特殊字符img标签a标签第一种用法：超链接第二种用法：锚点video标签表格标签：form标签input标签selec
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
vue3面试题(个人笔记) 武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js java 学习
vue3比vue2有什么优势？性能更好，打包体积更小，更好的ts支持，更好的代码组织，更好的逻辑抽离，更多的新功能。描述Vue3生命周期CompositionAPI的生命周期：onMounted()onUpdated()onUnmounted()onBeforeMount()onBeforeUpdate()onBeforeUnmount()onErrorCaptured()onRenderTrac
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
swagger【个人笔记】撰卢笔记 java
文章目录swagger导入mave坐标在配置类(WebMvcConfiguration)中加入knife4j相关配置设置静态资源映射，主要是让拦截器放行swagger常用注解@Api(tags="\[描述这个类的作用]")@ApiModel(description="\[描述这个类的作用]")@ApiModelProPerty("描述这个类的作用")@ApiOperation("\[描述方法的作用
【个人笔记】负载均衡撰卢笔记负载均衡运维
文章目录nginx反向代理的好处负载均衡负载均很的配置方式均衡负载的方式nginx反向代理的好处提高访问速度进行负载均衡保证后端服务安全负载均衡负载均衡，就是把大量的请求按照我们指定的方式均衡的分配给集群中的每台服务器负载均很的配置方式upstreamwebservers{server192.168.100.128:8080server192.168.100.129:8080}server{lis
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
5G标准学习笔记14 - CSI--RS概述刘孬孬沉迷学习 5G 学习笔记信息与通信
5G标准学习笔记14-CSI–RS概述大家好~，这里是刘孬孬，今天带着大家一起学习一下5GNR中一个非常非常重要的参考信号------------------CSI-RS信号，CSI-RS不是持续发送，UE只能在网络明确配置了CSI-RS的情况下才能使用其进行信道测量。前言对于CSI-RS，肯定还离不开前面所说的CSI（channelstateinformation），前面也讲过CSI对于MIMO
5G标准学习笔记06-基于AI/ML波束管理刘孬孬沉迷学习 5G 学习笔记
5G标准学习笔记06-基于AI/ML波束管理前言前面对于孬孬学习了波束管理的概述，下面要进一步来看一下传统波束管理和现在3GPP中推动的AL/ML波束管理之前的区别联系。一、传统波束管理方法流程传统BM流程主要包括以下步骤：波束扫描（BeamSweeping）：gNB通过顺序发送多个窄波束（SSB或CSI-RS），覆盖整个服务区域，UE测量每个波束的信号质量（如L1-RSRP或L1-SINR）。波
5G标准学习笔记03- CSI 反馈增强概述刘孬孬沉迷学习 5G 笔记学习
5G标准学习笔记03-CSI反馈增强概述大家好，最近在研究AI/ML3gpp标准NR空口的有关内容，后面可能会给大家介绍一下对应的有关内容AI/ML在3GPP标准中的研究进展在AI/ML在NR空口的应用中，对应标准主要聚焦了3个case进行讨论研究分别是：CSI反馈增强；波束管理；定位精度增强；这三个内容可能比较涉及RAN1/2的具体内容，后面会基于这个进行一定的介绍。今天主要是主要介绍CSI反馈
运维笔记＜4＞ xxl-job打通 GeminiJM 运维 java xxl-job
新的一天，来点新的运维业务，今天是xxl-job的打通其实在非集群中，xxl-job的使用相对是比较简单的，相信很多人都有使用的经验这次我们的业务场景是在k8s集群中，用xxl-job来做定时调度加上第一次倒腾，也是遇到了不少问题，在这里做一些记录1.xxl-job的集群安装首先是xxl-job的集群安装先贴上xxl-jobsql初始化文件的地址：xxl-job/doc/db/tables_xxl
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
两台pc如何高速度传输大文件费城之鹰其他两台电脑高速传输文件局域网不适用U盘传输资料网线直连两台电脑传资料
今天笔记本跑一个大一点的项目，8G的内存直接100%，i5的CPU直接75%并且在超频工作了，原本1.6Ghz的频率直接飙到了3.8Ghz，由于项目性质原因，采用的是公司配的笔记本，但是年初采购的联想E480，还在三包时间段内，公司不允许拆机增加内存，只能换一台新的台式机，听起来挺爽，有新设备，但是办公区域不准使用U盘这一类的存储设备，这就蛋疼了，大半年了项目代码，资料全在这个不够用的笔记本里，问
学习笔记(33):matplotlib绘制简单图表-绘制混淆矩阵热图宁儿数据安全 #机器学习学习笔记 matplotlib
学习笔记(33):matplotlib绘制简单图表-绘制混淆矩阵热图一、绘制混淆矩阵热图代码解析1.1、导入必要的库importmatplotlib.pyplotaspltfromsklearn.metricsimportconfusion_matriximportseabornassnsmatplotlib.pyplot：Python中最常用的绘图库，用于创建各种图表confusion_matr
玩转Docker | 使用Docker部署NotepadMX笔记应用程序心随_风动玩转Docker docker 笔记 eureka
玩转Docker|使用Docker部署NotepadMX笔记应用程序前言一、NotepadMX介绍工具简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署NotepadMX服务下载NotepadMX镜像编辑部署文件创建容器检查容器状态检查服务端口安全设置四、访问NotepadMX服务访问NotepadMX首页设置访问验证编辑笔记总结前言在如今快节奏的工作与学习中，一
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str