海盗pk武龙

Full-Face Appearance-Based Gaze Estimation论文翻译

It’s Written All Over Your Face:Full-Face Appearance-Based Gaze Estimation论文翻译

1.摘要

眼睛注视是人类情感分析的重要非语言线索。最近的注视估计工作表明，来自全脸区域的信息可以提高性能。进一步推动这一想法，我们提出了一种基于外观的方法，与计算机视觉领域的长期工作相比，该方法仅将全脸图像作为输入。我们的方法使用卷积神经网络对面部图像进行编码，空间权重应用于特征图，以灵活地抑制或增强不同面部区域的信息。通过广泛的评估，我们表明我们的全脸方法在 2D 和 3D 凝视估计方面显着优于最先进的方法，在 MPIIGaze 上实现了高达 14.3% 的改进，在与人无关的 3D 凝视估计上实现了 27.7% 的 EYEDIAP 改进。我们进一步表明，这种改进在不同的照明条件和凝视方向上是一致的，对于最具挑战性的极端头部姿势尤其明显。

1、介绍

鉴于人机交互 [21]、情感计算 [4] 和社会信号处理 [30] 等不同应用的重要性，计算机视觉领域的大量作品研究了估计人眼凝视 [7] 的问题。 .虽然早期的方法通常需要可以控制照明条件或头部姿势的设置 [17、22、27、31]，但使用卷积神经网络 (CNN) 的最新基于外观的方法为日常环境中的注视估计铺平了道路以大量的照明和外观变化为特征[36]。尽管有这些进步，以前基于外观的方法只使用从一只或两只眼睛编码的图像信息。
Krafka 等人的最新结果。表明将眼睛和面部图像作为输入的多区域 CNN 架构可以有益于凝视估计性能 [13]。虽然直观上，人类注视与眼球姿势密切相关，因此眼睛图像应该足以估计注视方向，但确实可以想象，特别是基于机器学习的方法可以利用来自其他面部区域的附加信息。例如，这些区域可以在比眼睛区域可用的图像区域更大的图像区域上对头部姿势或照明特定信息进行编码。然而，（更有效和优雅的）仅面部方法是否可行，哪些面部区域对于这种基于全脸外观的方法最重要，以及当前的深层架构是否可以将信息编码在这些地区。此外，[13] 中的视线估计任务仅限于简单的 2D 屏幕映射，因此全脸方法用于 3D 视线估计的潜力仍不清楚。

这项工作的目标是通过对基于 2D 和 3D 外观的注视估计的全脸方法的潜力进行详细分析来阐明这些问题（见图 1）。这项工作的具体贡献有两个方面。首先，我们提出了一种用于凝视估计的全脸 CNN 架构，与凝视估计的长期传统形成鲜明对比，它将全脸图像作为输入并直接回归到 2D 或 3D 凝视估计。我们将我们的全脸方法与现有的仅眼睛 [36] 和多区域 [13] 方法进行定量比较，并表明它可以在具有挑战性的 MPIIGaze 数据集上实现 4.8° 的独立于人的 3D 凝视估计精度，从而提高比现有技术高 14.3%。其次，我们提出了一种空间权重机制，以将有关全脸不同区域的信息有效地编码到标准的 CNN 架构中。该机制在卷积层的激活图上学习空间权重，反映不同面部区域中包含的信息 [[...]] 通过进一步的定量和定性评估，我们表明所提出的空间权重网络有助于学习估计器对当前数据集中可用的照明条件以及头部姿势和注视方向的显着变化具有鲁棒性。

图 1：建议的基于全脸外观的凝视估计管道的概述。我们的方法仅将人脸图像作为输入，并使用卷积神经网络对特征图应用空间权重来执行 2D 和 3D 凝视估计。

2、先关工作

我们的工作与之前针对 2D 和 3D 凝视估计任务的基于外观的凝视估计有关，特别是最近的多区域方法，以及在 CNN 中编码空间信息的方法。
Appearance-Based Gaze Estimation：注视估计方法通常分为基于模型或基于外观。虽然基于模型的方法使用眼睛和面部的几何模型来估计注视方向 [3, 29, 34]，但基于外观的方法直接从眼睛图像回归到注视方向。早期的基于外观的方法假设每个用户都有固定的头部姿势和训练数据 [2, 27, 31]。后来的工作侧重于从单眼 RGB [16, 26] 或深度图像 [5] 进行的与姿势无关的注视估计，但仍需要针对个人的训练。实现姿势和个人独立的一个有希望的方向是基于学习的方法，但这些方法需要大量标记的训练数据 [13、20、25、36]。
因此，近年来在日常环境中收集的凝视估计数据集越来越多 [9, 19, 24]，包括一些大规模 [13, 36]，或由合成数据组成 [25, 32, 33]。在这项工作中，我们还使用留一人交叉验证方案专注于这一最具挑战性的姿势和个人独立凝视估计任务。

2D vs. 3D Gaze Estimation ：基于外观的凝视估计方法可以根据回归目标是 2D 还是 3D 进一步分类。早期的工作假设目标人的头部姿势是固定的 [2, 27, 29, 31]，因此专注于 2D 凝视估计任务，其中训练估计器以输出屏幕上的凝视位置。虽然最近的方法使用 3D 头部姿势 [18, 26] 或面部边界框 [13] 的大小和位置来允许头部自由移动，但它们仍将任务制定为直接映射到 2D 屏幕注视位置。这些 2D 方法背后的基本假设是目标屏幕平面在相机坐标系中是固定的。因此，它不允许在训练后自由移动相机，这可能是一个实际限制，尤其是对于基于学习的独立于人的估计器。

相比之下，在 3D 凝视估计中，估计器被训练为在相机坐标系中输出 3D 凝视方向 [5, 16, 18, 20, 33, 36]。 3D 公式与姿势和人无关的训练方法密切相关，最重要的技术挑战是如何在不需要太多训练数据的情况下有效地训练估计器。为了促进模型训练，Sugano 等人。提出了一种数据归一化技术，将外观变化限制在一个单一的、归一化的训练空间中 [25]。虽然它需要额外的技术组件，例如 3D 头部姿势估计，但 3D 方法具有技术优势，因为它们可以估计任何目标对象和相机设置的注视位置。由于这两种方法处理几何信息的方式不同，因此 2D 和 3D 方法之间全脸输入的作用也可能不同。

多区域注视估计： 尽管有这些进步，但以前的大多数工作都使用单眼图像作为回归器的输入，并且只有少数考虑过替代方法，例如使用两个图像、每只眼睛一个 [10] 或覆盖双眼的单个图像 [9]。克拉夫卡等人。最近提出了一种多区域 2D 凝视估计方法，该方法将单个眼睛图像、面部图像和面部网格作为输入 [13]。他们的结果表明，添加人脸图像可能有益于基于外观的凝视估计。我们的工作首先探索使用全脸信息进行 2D 和 3D 基于外观的凝视估计的潜力。推进这一想法，我们进一步提出了第一种方法，该方法仅以真正端到端的方式从全脸图像中学习注视估计器。

CNN 中的空间编码：卷积神经网络不仅在分类 [14] 上成功，而且在回归 [23] 中也很成功，包括注视估计 [36]。之前的一些工作更有效地编码了空间信息，例如通过裁剪图像的子区域 [6, 11] 或同等对待图像上的不同区域 [8]。汤普森等人。在全连接层之前使用空间 dropout 以避免在训练过程中过度拟合，但 dropout 扩展到整个特征图而不是一个单元 [28]。相反，我们提出了一种空间权重机制，该机制对全脸不同区域的权重进行编码，抑制噪声并增强低激活区域的贡献。

3.注视估计任务
在详细介绍基于全脸外观的凝视估计的模型架构之前，我们首先制定并讨论两种不同的凝视估计任务：2D 和 3D 凝视估计。这项工作的一个关键贡献是研究这两项任务的基于全脸外观的凝视估计。这不仅导致了通用模型架构，而且还提供了对从两种任务公式的全面信息中获得的差异和好处的宝贵见解。
尽管 3D 任务公式为正确处理复杂的 3D 几何体带来了额外的技术挑战，但它可以应用于不同的设备和设置，而无需假设固定的相机屏幕关系。因此，这种表述是最通用的，也是最实用的。如果应用场景能够承受固定的屏幕位置，那么 2D 公式在技术上的要求较低，因此有望显示出更好的精度。

3.1.二维注视估计
作为最直接的策略，二维注视估计任务被表述为从输入图像 I 到二维屏幕注视位置 p 的回归，如 p = f(I)，其中 f 是回归函数。通常 p 在目标屏幕的坐标系中直接定义 [17, 26, 27, 29] 或更一般地，在相机坐标系 [13] 中定义的虚拟平面。由于眼睛外观和注视位置之间的关系取决于头部的位置，因此回归函数除了眼睛和面部图像之外，通常还需要 3D 头部姿势 [29] 或面部边界框位置 [10, 13]。
需要注意的是，除了固定目标平面之外，该公式中的另一个重要假设是输入图像 I 始终来自具有固定内在参数的同一相机。尽管之前的工作没有明确讨论这个问题，但如果不对投影模型的差异进行适当的处理，训练后的回归函数就不能直接应用于不同的相机。

3.2. 3D 凝视估计
相比之下，3D 凝视估计任务被表述为从输入图像 I 到 3D 凝视向量 g = f(I) 的回归。与 2D 情况类似，回归函数 f 通常将 3D 头部姿势作为附加输入。注视向量 g 通常定义为源自 3D 参考点 x 的单位向量，例如眼睛的中心 [5, 16, 18, 33, 36]。通过假设一个校准过的相机和目标平面的 3D 姿态信息，可以通过将凝视位置 p 投影到相机坐标系来转换 3D 凝视向量 g。可以通过将 3D 视线矢量 g 与目标平面相交来获得 2D 情况下的视线位置 p。

图像归一化：为了处理不同的相机参数并有效地解决跨人训练的任务，Sugano 等人。提出了一种用于基于 3D 外观的凝视估计的数据归一化程序 [25]。基本思想是对输入图像应用透视扭曲，以便可以在具有固定相机参数和参考点位置的归一化空间中执行估计。给定输入图像 I 和参考点 x 的位置，任务是计算转换矩阵 M = SR。

R 是旋转矩阵的逆矩阵，该矩阵旋转相机，使其观察参考点，并且相机和头部坐标系的 x 轴变得平行。缩放矩阵 S 被定义为使得参考点位于距归一化相机坐标系原点的距离为 ds 处。

缩放矩阵 S 被定义为使得参考点位于距归一化相机坐标系原点的距离为 ds 处。转换矩阵 M 将输入相机坐标系中的任何 3D 点旋转和缩放到归一化坐标系，并且可以使用图像转换矩阵 W = CsMC-1 r 通过透视扭曲将相同的转换应用于输入图像 I。 Cr 是对应于从相机校准获得的输入图像的投影矩阵，Cs 是另一个预定义参数，用于定义归一化空间中的相机投影矩阵。

在训练期间，所有具有真实注视向量 g 的训练图像 I 在训练空间中归一化或直接合成 [25, 33]，由 ds 和 Cs 定义。地面真实注视向量也被归一化为 gˆ = M g，而在实践中，它们被进一步转换为假设单位长度的角度表示（水平和垂直注视方向）。在测试时，测试图像以相同的方式归一化，并通过归一化空间中训练的回归函数估计归一化空间中它们对应的注视向量。然后通过 g = M−1gˆ 将估计的注视向量转换回输入相机坐标。

4. Full-Face Gaze Estimation with a Spatial Weights CNN

对于 2D 和 3D 凝视估计情况，核心挑战是学习回归函数 f。虽然大量工作只考虑使用眼睛区域完成这项任务，但我们的目标是探索从全脸提取信息的潜力。
我们的假设是眼睛以外的面部其他区域包含用于注视估计的有价值的信息。

图 2：用于基于全脸外观的凝视估计的空间权重 CNN。输入图像通过多个卷积层以生成特征张量 U。所提出的空间权重机制将 U 作为输入以生成权重映射 W，该权重映射 W 使用元素级乘法应用于 U。输出特征张量 V 被馈送到以下全连接层，以根据任务输出最终的 2D 或 3D 凝视估计。

如图 2 所示，为此我们提出了一个具有空间权重（spatial weights CNN）的 CNN，用于基于全脸外观的 2D 和 3D 凝视估计。为了有效地使用来自全脸图像的信息，我们建议使用额外的层来学习空间权重以激活最后一个卷积层。这种空间加权背后的动机是双重的。首先，可能有一些图像区域对注视估计任务没有贡献，例如背景区域，必须抑制来自这些区域的激活以获得更好的性能。其次，更重要的是，与预期总是有助于凝视估计性能的眼睛区域相比，来自其他面部区域的激活预计是微妙的。面部外观的作用还取决于各种输入相关条件，例如头部姿势、注视方向和光照，因此必须根据输入图像外观进行适当增强。虽然从理论上讲，这种差异可以通过普通网络学习，但我们选择引入一种机制，强制网络更明确地学习和理解面部的不同区域对于估计给定测试样本的凝视具有不同的重要性。为了实现这种更强的监督，我们使用了 [28] 中的三个 1 × 1 卷积层加上整流线性单元层的概念作为基础，并将其调整到我们的全脸注视估计任务中。具体来说，我们没有生成多个热图（一个用于定位每个身体关节），我们只生成了一个热图，对整个面部图像的重要性进行了编码。然后，我们将该权重图与前一个卷积层的特征图进行元素级乘法。图 2 显示了一个示例权重图，从 MPIIGaze 数据集的所有样本中取平均值。

4.1. Spatial Weights Mechanism

提出的空间权重机制包括三个额外的卷积层，过滤器大小为 1×1，后跟一个整流线性单元层（见图 2）。给定大小为 N ×H ×W 的激活张量 U 作为来自卷积层的输入，其中 N 是特征通道的数量，H 和 W 是输出的高度和宽度，空间权重机制生成一个 H × W 空间权重矩阵 W. 加权激活图是从 W 与原始激活 U 的逐元素乘法获得的

其中Uc是U的第c个通道，Vc对应同一个通道的加权激活图。这些图被堆叠起来形成加权激活张量 V ，并被送入下一层。与空间丢失 [28] 不同，空间权重机制不断对信息进行加权，并保留来自不同区域的信息。相同的权重应用于所有特征通道，因此估计的权重直接对应于输入图像中的面部区域。

在训练过程中，前两个卷积层的滤波器权重从均值和 0.01 的高斯分布随机初始化，恒定偏差为 0.1。最后一个卷积层的滤波器权重从高斯分布中随机初始化，均值为 0，方差为 0.001，偏差为 1。
关于 U 和 W 的梯度是

and

相对于 W 的梯度由特征图的总数 N 归一化，因为权重图 W 同等影响 U 中的所有特征图。

4.2. 实施细则
作为基线 CNN 架构，我们使用 AlexNet [14]，它由五个卷积层和两个全连接层组成。我们在最后一个全连接层之上训练了一个额外的线性回归层，以预测 2D 凝视估计的屏幕坐标中的 p 或 3D 凝视估计任务的归一化凝视向量 gˆ。我们使用 LSVRC-2010 ImageNet 训练集 [14] 上的预训练结果来初始化五个卷积层，并在 MPIIGaze 数据集 [36] 上微调整个网络。我们网络的输入图像大小为 448 × 448 像素，这导致在第 5 个卷积层的池化层之后大小为 256 × 13 × 13 的激活 U。

对于 2D 凝视估计，根据六个面部标志位置（四个眼角和两个嘴角）裁剪输入人脸图像。虽然在实践中这被假定为使用面部对齐方法（例如 [1]）来完成，但在以下实验中，我们使用了数据集提供的地标位置。以6个地标的质心为人脸中心，宽度为地标间最大距离1.5倍的矩形作为人脸边界框。损失函数是目标屏幕坐标系中预测和地面真实注视位置之间的ℓ1距离。

对于 3D 凝视估计，参考点 x 被定义为相同的六个面部标志的 3D 位置的中心。我们将 MPIIGaze 提供的通用 3D 面部模型拟合到地标位置以估计 3D 头部姿势。在图像归一化过程中，我们定义了 ds 和 Cs，使输入的人脸图像大小变为 448×448 像素。在初步实验中，我们注意到 Zhang 等人提出的附加头部姿势特征。 [36] 没有提高全脸情况下的性能。因此，在这项工作中，我们只使用了图像特征。损失函数是归一化空间中预测和地面真实注视角度向量之间的ℓ1距离。

5. 评估
为了评估我们用于 2D 和 3D 凝视估计任务的架构，我们对两个当前的凝视数据集进行了实验：MPIIGaze [36] 和 EYEDIAP [19]。对于 MPIIGaze 数据集，我们对所有 15 名参与者进行了留人交叉验证。为了消除人脸对齐引起的错误，我们手动注释了六个人脸地标，用于数据归一化和图像裁剪。在最初的评估中，每个参与者随机抽取了 1,500 个左眼和 1,500 个右眼样本。为了直接比较，我们获得了对应于相同评估集的人脸图像，并在它们来自右眼时翻转了人脸图像。我们基于面片的设置将面的中点（所有六个地标的中心）作为凝视方向的原点。

对于 EYEDIAP 数据集，我们使用屏幕目标会话进行评估，并从每个参与者的四个 VGA 视频中每 15 帧采样一张图像。我们使用数据集提供的头部姿势和眼睛中心注释进行图像归一化，并将参考点设置为两个眼睛中心的中点。眼睛图像的裁剪方式与 MPIIGaze 数据集相同。我们将 14 名参与者随机分为 5 组并进行了 5 折交叉验证。
我们将我们的全脸注视估计方法与两个最先进的基线进行了比较：仅使用从一只眼睛编码的信息的单眼方法 [36] 以及拍摄眼睛图像的多区域方法 [13] 、人脸图像和人脸网格作为输入。

单眼：基线方法之一是最先进的基于单眼外观的凝视估计方法 [36]，它最初使用 LeNet [12, 15] 架构。为了公平比较，我们改为使用 AlexNet 架构作为我们提出的模型（参见 4.2 小节）。以眼角中心为中心裁剪眼部图像，宽度为角间距的1.5倍，并按照[36]中的建议调整为60×36像素。在这种情况下，每只眼睛都成为模型的输入，参考点 x 被设置为内眼角和外眼角的中间。

iTracker：由于代码和模型都不可用，我们根据论文中提供的描述重新实现了 iTracker 架构 [13]。面部图像以与我们提出的方法相同的方式裁剪，并调整为 224 × 224 像素。以内眼角和外眼角的中点为图像中心，裁剪眼部图像，宽度为眼角间距的1.7倍，调整为224×224像素。对于 2D 凝视估计任务，我们还使用了大小为 25 × 25 像素的人脸网格特征 [13]。人脸网格对原始图像内的人脸大小和位置进行编码。为了与我们提出的架构进行公平比较，我们还使用与 iTracker (AlexNet) 相同的 AlexNet CNN 架构评估了模型。为了验证人脸输入的效果，我们还测试了 iTracker (AlexNet) 架构，仅将两只眼睛图像作为两只眼睛模型。

5.1.二维注视估计
图 3 总结了 2D 凝视估计任务的结果。每一行对应一种方法，如果没有另外说明，除了图像输入之外，还使用了人脸网格特征。左轴显示屏幕坐标系中估计和地面真实注视位置之间的欧几里得误差（以毫米为单位）。右轴显示了相应的角度误差，该误差是根据数据集提供的相机和监视器校准信息以及 3D 凝视估计任务的相同参考位置近似计算的。

图 3：以毫米（欧几里得误差）和度（角度误差）为单位的 MPIIGaze 数据集上的 2D 凝视估计误差。面部网格用作附加输入。误差棒表示标准偏差。

图 4：EYEDIAP 数据集上以毫米（欧几里得误差）和度数（角度误差）为单位的 2D 凝视估计误差。误差棒表示标准偏差。
从图 3 中可以看出，所有以全脸信息作为输入的方法都明显优于单眼基线。单人脸图像模型取得了与 iTracker 和 iTracker (AlexNet) 模型竞争的结果。通过合并提出的空间权重网络，性能得到了进一步提高。与第二好的单人脸模型相比，所提出的空间权重网络实现了 7.2% 的统计显着性能提升（配对 t 检验：p < 0.01）。这些发现通常反映在图 4 所示的 EYEDIAP 数据集上，而整体性能最差的原因很可能是分辨率较低和训练图像数量有限。尽管 iTracker 架构的性能比两眼模型差，但我们提出的模型仍然表现最好。

5.2. 3D 凝视估计
图 5 总结了 3D 凝视估计任务的结果。左轴显示了从估计的和真实的 3D 凝视向量直接计算的角度误差。右轴显示了相应的欧几里得误差，通过将估计的 3D 视线矢量与屏幕平面相交来近似计算。与2D凝视估计任务相比，iTracker与单人脸模型的性能差距更大（0.7度）。由于基于AlexNet的iTracker模型可以达到与单人脸模型相似的性能，因此性能下降似乎部分是由于到其网络架构。我们提出的模型比 iTracker 实现了 14.3%（配对 t 检验：p > 0.01）的显着性能提升，并且性能与 2D 情况一致。

图 5：以度（角度误差）和毫米（欧几里得误差）为单位的 MPIIGaze 数据集上的 3D 凝视估计误差。误差棒表示标准偏差。
如图 6 所示，所提出的模型在 EYEDIAP 数据集上的 3D 凝视估计任务中也取得了最佳性能。

图 6：EYEDIAP 数据集上的 3D 凝视估计误差，以度（角度误差）和毫米（欧几里得误差）为单位。误差棒表示标准偏差。

5.3.头部姿势和面部外观
关于为什么全脸输入可以帮助凝视估计任务的一个自然假设是它带来了头部姿势信息，这可以作为推断凝视方向的先验。在本节中，我们通过比较使用没有眼睛区域的人脸图像与简单的基于头部姿势的基线的性能来提供对这一假设的更多见解。更具体地说，使用 MPIIGaze 数据集，我们创建了面部图像，其中根据面部标志注释，两个眼睛区域都被灰色框遮挡。我们将使用眼睛遮挡面部图像的估计性能与：1) 直接将头部姿势视为凝视方向的朴素估计器，以及 2) 训练为从头部姿势输入输出凝视方向的线性回归函数。
这些方法用于 3D 估计任务的角度误差如图 7 所示。虽然使用眼部遮挡人脸图像的误差大于原始单人脸架构（5.5 度），但其性能优于基于头部姿势的基线估计器。这有点令人惊讶地表明，全脸输入的影响大于头部姿势信息，而面部外观本身有利于推断注视方向。

图 7：来自与头部姿势相关的不同模型的凝视估计误差。这些数字是以度为单位的 3D 凝视估计的角度误差。误差棒表示标准偏差。

5.4.不同面部区域的重要性
为了进一步分析不同面部区域对整体性能的贡献，我们针对 3D 凝视估计的不同因素生成了全脸模型的区域重要性图。如 [35] 中提出的，区域重要性图是通过在屏蔽部分输入图像后评估估计误差来生成的。具体来说，给定 448 × 448 的输入人脸图像，我们使用了一个大小为 64 × 64 像素的灰色蒙版，并以 32 像素步长的滑动窗口方式在整个图像上移动了这个蒙版。每个图像区域的重要性图是通过使用盒式滤波器平滑获得的 64 × 64 误差分布来获得的。凝视估计精度的下降幅度越大，面部该区域的重要性就越高。然后通过使用三个面部标志位置（眼角和嘴角的中心）扭曲整个图像来对齐各个人脸图像及其重要性图。最后，通过对所有图像求平均值来计算平均人脸块和平均区域重要性图。为了说明人脸图像输入的效果，我们将这些区域重要性图与两只眼睛（基线）和我们提出的全脸模型（我们的）之间的定量性能比较进行了比较。

光照条件: 最初的 MPIIGaze 论文根据不同的光照条件和注视范围对数据集进行了表征 [36]。因此，我们首先探讨了是否以及哪些面部区域对这些照明条件的信息进行了编码。与原始论文一样，我们使用脸部左右半部的平均强度值差异作为推断定向光的代理。我们使用 k-means 聚类根据光照差异对所有 15 × 3, 000 图像进行聚类，并计算每个聚类的平均人脸图像和平均重要性图。图 8 显示了相对于照明条件的结果样本区域重要性图。从图中可以看出，在强烈的定向照明下（最左边和最右边的例子），脸部较亮的一侧需要眼睛周围更广泛的区域。在所有光照条件下，所提出的方法始终比两眼模型表现得更好。

图 8：根据 MPIIGaze 数据集的光照条件，基于面部补丁聚类的区域重要性图和相应的平均面部补丁：从面部右侧的定向光（左）、正面光（中心）到定向脸部左侧（右侧）的光。条形图显示了两眼模型（基线）和建议的空间权重 CNN（我们的）的估计误差，以及右上角的性能增益百分比。误差棒表示标准偏差。

注视方向：另一个可能影响不同面部区域重要性的因素是注视方向。因此，我们以与以前相同的方式根据注视方向对图像进行聚类。图 9 的顶部两行显示了取决于水平凝视方向的相应区域重要性图，而底部两行显示了取决于垂直凝视方向的地图。如图所示，根据要推断的凝视方向，面部的不同部分变得重要。如果注视方向是正前方，则眼睛区域最重要，而如果注视方向变得更极端，则模型对其他区域的重要性更高。

图 9：根据 MPIIGaze 数据集的真实水平（顶部）和垂直（底部）注视方向，基于图像聚类的区域重要性图和相应的平均面部补丁。条形图以与图 8 中相同的方式显示估计误差。

头部姿势：虽然 MPIIGaze 中的头部姿势范围因录制设置而受到限制，但 EYEDIAP 数据集包含了广泛的头部姿势范围。
因此，我们最终以与以前相同的方式根据头部姿势在 EYEDIAP 中聚类图像。图 10 的顶部两行显示了取决于水平头部姿势的相应区域重要性图，而底部两行显示了取决于垂直头部姿势的地图。在这些情况下，可以清楚地看到，全脸输入特别有利于提高极端头部姿势的估计性能。与 MPIIGaze 相比，非眼睛面部区域通常也具有更高的重要性，这表明对低分辨率图像使用全脸输入的好处。

图 10：根据 EYEDIAP 数据集的真实水平（顶部）和垂直（底部）头部姿势，基于图像聚类的区域重要性图。条形图以与图 8 中相同的方式显示估计误差。

我们的方法对由极端头部姿势和注视方向以及照明引起的面部外观变化更加鲁棒。我们的方法分别在具有挑战性的野外 MPIIGaze 和 EYEDIAP 数据集上实现了 4.8 ◦ 和 6.0 ◦ 的精度，用于独立于人的 3D 凝视估计——比现有技术显着提高了 14.3% 和 27.7%。我们认为基于全脸外观的凝视估计与相关的计算机视觉任务密切相关，例如面部和面部特征检测、面部表情分析或头部姿势估计。因此，这项工作指向了未来基于学习的方法，可以共同解决多个这些任务。

7. 致谢
这项工作部分由德国萨尔大学的多模态计算和交互卓越集群 (MMCI) 和日本的 JST CREST 研究基金 (JPMJCR14E1) 资助。

你可能感兴趣的:(计算机视觉,目标跟踪,自动驾驶)

车牌识别与标注：基于百度OCR与OpenCV的实现（一）喜欢踢足球的老罗大模型应用开发实践之旅 ocr opencv 人工智能
车牌识别与标注：基于百度OCR与OpenCV的实现在计算机视觉领域，车牌识别是一项极具实用价值的技术，广泛应用于交通监控、智能停车场管理等领域。本文将介绍如何在macOS系统下，利用百度OCRAPI进行车牌识别，并结合OpenCV库在图片上绘制标注框和车牌号码，实现一个完整的车牌识别与标注流程。整个工程将使用PyCharm进行组织和开发。一、系统环境与工程结构系统环境操作系统：macOS开发工具：
Python助力自动驾驶：深度学习模型优化全攻略 Echo_Wish Python！实战！python 自动驾驶深度学习
Python助力自动驾驶：深度学习模型优化全攻略说起自动驾驶，大家第一反应往往是“高精地图”“传感器融合”“路径规划”等等，背后真正的“大脑”其实是各式各样的深度学习模型。它们负责感知环境、识别路况、预测行为，甚至实时做出决策。可是，跑在车上的这些模型不仅要精准，还得轻量、实时、稳定，这可不是简单的“丢GPU就能解决”的问题。今天，咱们就从Python开发者的视角，聊聊自动驾驶里深度学习模型的优化
TensorFlow：开启智能时代的引擎科技林总 DeepSeek学AI 人工智能
想象一下，计算机能看懂病历、汽车能自动驾驶、机器能创作艺术——这一切的核心，正是深度学习的力量。而推动这场革命的引擎之一，就是今天的主角：**TensorFlow**。---###**一、背景：为什么需要TensorFlow？1.**深度学习的爆发**-传统编程无法解决图像识别、自然语言处理等复杂问题。-神经网络需要高效工具处理海量数据和计算。2.**Google的答案**-2015年开源Tens
深度剖析AI人工智能在自动驾驶中的系统优化 AI云原生与云计算技术学院人工智能自动驾驶机器学习 ai
深度剖析AI人工智能在自动驾驶中的系统优化关键词：AI人工智能、自动驾驶、系统优化、传感器融合、决策算法摘要：本文深入探讨了AI人工智能在自动驾驶系统中的优化问题。从自动驾驶的背景入手，详细解释了相关核心概念，如传感器、决策算法等。阐述了这些核心概念之间的关系，介绍了核心算法原理和具体操作步骤，还通过数学模型和公式进行了理论支持。给出了项目实战案例，分析了实际应用场景，推荐了相关工具和资源，最后探
OpenCV实战：图像颜色识别与提取、掩膜制作
前言在计算机视觉和图像处理领域，颜色识别是一项基础而重要的技术。无论是交通标志识别、工业分拣还是美颜滤镜开发，都离不开对特定颜色的处理。本文将带你全面掌握使用OpenCV进行颜色识别的关键技术，包含完整的代码实现和原理讲解。一、颜色空间基础1.1RGB颜色空间在图像处理中，最常见的就是RGB颜色空间。RGB颜色空间是我们接触最多的颜色空间，是一种用于表示和显示彩色图像的一种颜色模型。RGB代表红色
OpenCV图像添加水印
一、前言在数字图像处理中，为图片添加水印是一项常见且重要的技术。无论是版权保护、品牌宣传还是防止未经授权的使用，水印都能发挥重要作用。OpenCV作为一款强大的计算机视觉库，提供了丰富的功能来实现各种水印效果。本教程将详细介绍如何使用OpenCV为图像添加文字水印和图片水印。二、环境准备在开始之前，请确保已安装以下环境：Python3.xOpenCV库（可通过pipinstallopencv-py
MCP 与 AI 任务分解：如何让 AI 高效执行复杂任务？ Echo_Wish Python 进阶人工智能
MCP与AI任务分解：如何让AI高效执行复杂任务？在人工智能应用中，任务分解（TaskDecomposition）是一个绕不开的话题。无论是自动驾驶、智能客服，还是代码生成，AI都需要将复杂问题拆解成可执行的小任务，逐步完成目标。而在AI领域，MCP（Multi-StepCognitiveProcessing，多步认知处理）是一种前沿技术，旨在提升AI的任务分解能力，使其能够更精准、高效地执行复杂
数据标注师学习内容汇总试着数据标注师学习数据标注师
目录文本标注图像标注语音标注文本标注词性标注1词性标注2实体标注关系标注事件标注1事件标注2意图标注关键词标注分类标注问答标注对话标注图像标注拉框标注关键点标注2D标注3D标注线标注目标跟踪标注OCR标注图像分类标注语音标注语音切割转写语音校对标注拼音和停顿标注
【数据标注师】目标跟踪标注试着数据标注师目标跟踪人工智能计算机视觉数据标注师目标跟踪标注
目录一、**目标跟踪标注的四大核心挑战**二、**五阶能力培养体系**▶**阶段1：基础规则内化（1-2周）**▶**阶段2：复杂场景处理技能**▶**阶段3：专业工具mastery**▶**阶段4：领域深度专精▶**阶段5：效率突破方案三、**精度控制五大核心技术**四、**质检与错误防御体系**1.**四维质检法**：2.**高频错误防御表**：五、**持续进阶体系**1.**复杂场景专项**
浅谈卷积神经网络(CNN) cyc&阿灿 cnn 人工智能神经网络
卷积神经网络(ConvolutionalNeuralNetworks,CNN)作为深度学习领域最具影响力的架构之一，已在计算机视觉、自然语言处理、医学影像分析等领域取得了革命性突破。本文将系统全面地剖析CNN的核心原理、关键组件、经典模型、数学基础、训练技巧以及最新进展，通过理论解析与代码实践相结合的方式，帮助读者深入掌握这一重要技术。一、CNN基础与核心思想1.1传统神经网络的局限性在处理图像等
Alluxio在数据索引和模型分发中的核心价值与应用 Alluxio 人工智能深度学习机器学习
在当前的技术环境下，搜索、推荐、广告、大模型、自动驾驶等领域的业务依赖于海量数据的处理和复杂模型的训练。这些任务通常涉及从用户行为数据和社交网络数据中提取大量信息，进行模型训练和推理。这一过程需要强大的数据分发能力，尤其是在多个服务器同时拉取同一份数据时，更是考验基础设施的性能。在这样的背景下，AlluxioEnterpriseAI在数据索引与模型分发/部署方面展示了其独特的优势，特别是在处理海量
LSNet: 基于侧向抑制的神经网络碳酸的唐模型养成与叙述有意思的py库神经网络人工智能深度学习
引言在计算机视觉领域，我们一直在寻找灵感来源以提高图像处理和识别的效果。而人类视觉系统作为经过数百万年进化的精密系统，无疑是最好的参考对象之一。今天，我要向大家介绍一个名为LSNet（LateralSuppressionNetwork，侧向抑制网络）的技术，它模拟了人类视觉系统中的侧向抑制机制，为计算机视觉任务带来了新的可能性。什么是侧向抑制？侧向抑制（LateralSuppression），也被
OpenCV 三维重建实战：从工业检测到自动驾驶，3 大场景代码全解析从零开始学习人工智能 opencv 自动驾驶数码相机
：工业零部件三维建模与检测案例背景：在汽车制造工厂，对于复杂形状的发动机零部件质量检测与逆向工程需求，需要高精度的三维模型。传统检测方法效率低且精度有限，而三维重建技术可快速获取零部件三维信息，实现高效检测与设计优化。技术实现：使用多个相机从不同角度拍摄零部件，利用calib3d模块进行相机标定，获取准确的相机内参和外参。通过特征点检测与匹配算法（如SIFT、ORB等）找到不同图像间的对应点，再用
这份「零基础」机器学习实战课程，帮你彻底搞懂AI不再迷茫！——深度解析ML-For-Beginners wylee 人工智能机器学习
引言：告别迷茫，拥抱AI未来在当今科技浪潮之巅，人工智能（AI）无疑是最璀璨的明星。机器学习（MachineLearning），作为AI的核心驱动力，正以前所未有的速度渗透到我们生活的方方面面：从智能推荐系统到自动驾驶，从疾病诊断到金融风控，其应用场景几乎无处不在。然而，对于无数渴望投身AI领域的学习者而言，机器学习的门槛似乎一直高不可攀。你是否也曾有过这样的困惑：面对海量的在线课程和资料，眼花缭
微软人工智能证书AI-102 | 如何快速通过？全球认证考试中心人工智能微软
微软AI-102考试，全称“DesigningandImplementingaMicrosoftAzureAISolution”，是微软推出的用于验证考生在Azure平台上设计和实施AI解决方案核心能力的认证考试。以下是具体介绍：考试描述：考试主要衡量考生实施计划和管理Azure认知服务解决方案、计算机视觉解决方案、自然语言处理解决方案、知识挖掘解决方案、对话式AI解决方案的能力。考试题型通常包括
基于opencv的鱼群检测和数量统计识别鱼群密度带界面
完整项目点文末名片查看获取一、项目简介本项目旨在通过计算机视觉技术，实现对视频中鱼类数量的自动检测与计数。利用OpenCV库进行图像处理，包括背景减除、形态学操作、轮廓检测等步骤，最终在视频帧中标记出鱼类并统计其数量。该系统可广泛应用于水产养殖、生态监测等领域，有助于提高工作效率和数据准确性。二、环境准备在开始项目之前，需要确保以下环境和工具已安装：Python：推荐使用Python3.6及以上版
目标跟踪领域经典论文解析 ♢.＊目标跟踪人工智能计算机视觉
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！目标跟踪是计算机视觉领域的一个
基于均值偏移算法的动态目标跟踪研究 Zoiny_楠算法均值算法目标跟踪
摘要：目标跟踪技术是计算机视觉领域中重要研究课题之一,在人类生活、军事侦察、工业生产、医疗诊断、交通管理等多方面,都有广泛的应用,研究目标跟踪对人类生活、工程应用等具有现实的指导意义。在基于视觉的目标跟踪算法中,经典的Mean-Shift算法以其理论科学有效、操作简单易实现,跟踪性能较好等优势,一直是众多学者研究的热点。可算法也存在着许多缺陷。例如目标模型中混有背景信息的干扰,给目标定位带来了偏差
目标跟踪存在问题以及解决方案选与握 #目标跟踪目标跟踪人工智能计算机视觉
3D跟踪一、数据特性引发的跟踪挑战1.点云稀疏性与远距离特征缺失问题表现：激光雷达点云密度随距离平方衰减（如100米外车辆点云数不足近距离的1/10），导致远距离目标几何特征（如车轮、车顶轮廓）不完整，跟踪时易因特征匹配失败导致ID丢失。典型案例：在高速公路场景中，200米外的卡车因点云稀疏（仅约50个点），跟踪算法难以区分其与大型货车的形状差异，导致轨迹跳跃或ID切换。技术方案：稀疏点云增强与特
AI伦理与自动驾驶：当机器掌握方向盘时的道德抉择 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能自动驾驶 unix ai
AI伦理与自动驾驶：当机器掌握方向盘时的道德抉择关键词：AI伦理、自动驾驶、道德算法、电车难题、责任归属、技术监管、人机协作摘要：本文深入探讨自动驾驶技术发展过程中面临的伦理挑战，从经典的"电车难题"出发，分析AI决策系统在生死抉择中的道德困境。我们将剖析自动驾驶的伦理框架设计原则，探讨技术实现方案，并通过代码示例展示伦理算法如何嵌入自动驾驶系统。文章还将讨论法律责任划分、社会接受度等现实问题，最
day39 心落薄荷糖 Python训练营 python
#先继续之前的代码importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorch.utils.dataimportDataLoader,Dataset#DataLoader是PyTorch中用于加载数据的工具fromtorchvisionimportdatasets,transforms#torchvision是一个用于计算机视觉的库，
基于OpenCv的图片倾斜校正系统详细设计与具体代码实现 AI大模型应用之禅人工智能数学基础计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于OpenCv的图片倾斜校正系统详细设计与具体代码实现1.背景介绍1.1图像处理的重要性在当今数字时代,图像处理技术在各个领域都扮演着重要角色。无论是在计算机视觉、模式识别、医学影像、遥感探测还是多媒体处理等领域,图像处理都是不可或缺的核心技术。通过对图像进行预处理、增强、分割、特征提取等操作,可以从图像中获取有价值的信息,为后续的分析和决策提供支持。1.2图像倾斜问题及其影响在实际应用中,由于
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
10个基于Python的计算机视觉实战项目云博士的AI课堂基于Python计算机视觉 python 计算机视觉机器视觉人工智能
10个基于Python的计算机视觉实战项目，涵盖多个领域和应用场景，每个项目均附有GitHub地址、概述、解决的问题及应用场景：1.PCV图像处理与计算机视觉库GitHub地址:jesolem/PCV概述:提供计算机视觉基础算法的Python实现，包括图像分割、直方图均衡化、图像增强等。解决的问题:简化图像处理流程，支持快速实现算法原型。应用场景:学术研究、教学实验、图像预处理任务。2.基于朴素贝
使用YOLOv5-ONNX-PyQT-EXE: 全栈式对象检测应用的构建与部署
使用YOLOv5-ONNX-PyQT-EXE:全栈式对象检测应用的构建与部署去发现同类优质开源项目:https://gitcode.com/在计算机视觉领域，实时对象检测是一个至关重要的任务。是一个开源项目，它将流行的YOLOv5对象检测模型集成到ONNX(OpenNeuralNetworkExchange)中，并通过PyQT构建了一个可执行的应用程序，使得非开发人员也能轻松地进行对象检测。项目简
OpenCV实现相机标定的棋盘格制作与应用 BIG-HO
本文还有配套的精品资源，点击获取简介：在计算机视觉领域，棋盘格标定板用于获取相机参数，实现图像校正和三维重建。OpenCV库提供了绘制棋盘格和相机标定的功能。本文将详细介绍如何使用OpenCV制作棋盘格标定板，包括设计、绘制、保存、相机标定过程和应用。通过实际案例，如畸变矫正、三维重建、AR应用和机器人导航，展示棋盘格标定板在视觉技术中的关键作用。1.棋盘格设计与绘制1.1棋盘格的基本概念与应用棋
从0开始学习计算机视觉--Day04--线性分类 Chef_Chen 学习计算机视觉分类
从宏观来看，卷积网络可以看做是由一个个不同的神经网络组件组合而成，就像积木一样通过不同类型的组件搭建形成，其中线性分类器是一个很重要的组件，在很多卷积网络中都有用到，所以了解清楚它的工作原理对我们后续的学习会有很大的帮助。线性分类器是参数模型中最简单，最基础的例子，下面我们用输入图片输出图片分类的模型的例子来更进一步地了解它。首先，我们输入一张图片到模型中，输入后我们就会得到f(x,W)，x指的是
MIAOYUN | 每周AI新鲜事儿（06.14-06.20）人工智能算法机器学习深度学习
紧跟技术浪潮，洞察行业未来，MIAOYUN《每周AI新鲜事儿》，为您精选全球AI领域的最新动态，涵盖AI技术突破、行业动态、趋势发展、前沿政策与学术研究，带您走在智能时代前沿，一起来回顾本周发生的AI新鲜事儿吧！AI开源大模型腾讯混元3D2.1大模型全链路开源6月14日，在CVPR2025（计算机视觉领域顶会之一）上，腾讯混元3D2.1大模型对外全链路开源，其模型权重及架构、训练代码、数据处理流程
【人工智能】微调的秘密武器：释放大模型的无限潜能蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在人工智能迅猛发展的今天，大规模语言模型（LLMs）以其强大的通用能力席卷各行各业。然而，如何让这些通用模型在特定领域或任务中发挥最大潜力？答案是微调（Fine-tuning）。本文深入探讨微调的理论基础、技术细节与实践方法，揭示其作为解锁大模型隐藏潜力
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少