Houchaoqun_XMU

【Active Learning - 10】图像分类技术和主动学习方法概述

主动学习系列博文：

【Active Learning - 00】主动学习重要资源总结、分享（提供源码的论文、一些AL相关的研究者）：https://blog.csdn.net/Houchaoqun_XMU/article/details/85245714

【Active Learning - 01】深入学习“主动学习”：如何显著地减少标注代价：https://blog.csdn.net/Houchaoqun_XMU/article/details/80146710

【Active Learning - 02】Fine-tuning Convolutional Neural Networks for Biomedical Image Analysis: Actively and Incrementally：https://blog.csdn.net/Houchaoqun_XMU/article/details/78874834

【Active Learning - 03】Adaptive Active Learning for Image Classification：https://blog.csdn.net/Houchaoqun_XMU/article/details/89553144

【Active Learning - 04】Generative Adversarial Active Learning：https://blog.csdn.net/Houchaoqun_XMU/article/details/89631986

【Active Learning - 05】Adversarial Sampling for Active Learning：https://blog.csdn.net/Houchaoqun_XMU/article/details/89736607

【Active Learning - 06】面向图像分类任务的主动学习系统（理论篇）：https://blog.csdn.net/Houchaoqun_XMU/article/details/89717028

【Active Learning - 07】面向图像分类任务的主动学习系统（实践篇 - 展示）：https://blog.csdn.net/Houchaoqun_XMU/article/details/89955561

【Active Learning - 08】主动学习（Active Learning）资料汇总与分享：https://blog.csdn.net/Houchaoqun_XMU/article/details/96210160

【Active Learning - 09】主动学习策略研究及其在图像分类中的应用：研究背景与研究意义：https://blog.csdn.net/Houchaoqun_XMU/article/details/100177750

【Active Learning - 10】图像分类技术和主动学习方法概述：https://blog.csdn.net/Houchaoqun_XMU/article/details/101126055

【Active Learning - 11】一种噪声鲁棒的半监督主动学习框架：https://blog.csdn.net/Houchaoqun_XMU/article/details/102417465

【Active Learning - 12】一种基于生成对抗网络的二阶段主动学习方法：https://blog.csdn.net/Houchaoqun_XMU/article/details/103093810

【Active Learning - 13】总结与展望 & 参考文献的整理与分享（The End...）：https://blog.csdn.net/Houchaoqun_XMU/article/details/103094113

2.1 导言

机器学习方法根据模型在训练过程中是否使用标注样本，可进一步细分为监督学习和无监督学习等训练方式。监督学习利用大量的高质量标注样本训练模型，在计算机视觉领域中取得了许多显著的成绩。近几年，大量以监督学习为训练方式的机器学习算法不断被提出并应用到不同的领域中，同时产生了对大量标注样本的高度需求。因此，如何在保证不降低模型性能的情况下，显著地减少标注成本是个亟待解决的挑战，并逐渐引起了业界的广泛关注。无监督学习旨在挖掘未标注样本之间的内在联系，如 K-Means 聚类算法[54]。此外，半监督学习是介于监督学习和无监督学习的一种学习方式，基本思想是使用少量的标注样本进行预训练，并充分利用未标注样本训练模型，如自训练算法[55]。主动学习方法和图像分类技术都能够以上述三种训练方法应用到不同的需求中，本章将分别详细地概述。

2.2 图像分类技术

目前，主流的图像分类技术可划分为基于传统机器学习的方法以及基于深层网络模型的深度学习方法。如图2.1所示，传统机器学习方法首先对预处理完后的数据进行特征提取；紧接着，分类器基于提取后的特征进行训练。由于手工提取特征（Hand-crafted）方法和分类器都是基于一定的理论基础进行设计，因此具有较好的可解释性。但是，传统机器学习方法的效果过度依赖于特征，而手工设计的特征具有较大的局限性且难于设计，因此仍无法胜任一些复杂的任务。深度学习算法通过深层的网络结构将特征提取任务和分类器以端到端的方式整合到同一个网络中，并使用大量的标注样本通过反向传播机制不断更新模型参数，从而同时提升模型的特征提取和分类的能力。目前，深度学习方法在实际应用方面取得了很多突破性的成绩，逐渐成为了人工智能的重要工具。本节将围绕传统机器学习方法和深度学习方法对图像分类技术展开介绍。值得一提的是，数据预处理对图像分类任务同样至关重要，由于不是本文的重点，因此不展开详细地讨论。

2.2.1 基于传统机器学习的图像分类技术

传统的机器学习方法主要由两个核心部分组成，即特征提取和分类器。数据和特征工程决定了机器学习相关模型的上限，并通过合适的算法不断地逼近上限。本节将分别对当前部分主流的手工提取特征方法和分类器展开介绍。手工提取特征方法主要介绍局部二值模式（Local Binary Pattern， LBP） [56]，方向梯度直方图（Histogram of Oriented Gradient， HOG） [57]以及尺度不变特征变换（Scale-Invariant Feature Transform， SIFT） [58]等。

（1）局部二值模式（Local Binary Pattern， LBP）： Ojala 等[56] 于 1994 年提出了 LBP 特征，并将其用于提取局部纹理特征。 LBP 的核心思想定义在一个像素大小为 3x3 的邻域中，将中心位置（2， 2）的像素值设置为阈值；邻域内的其余 8个位置的值取决于各自的像素值，若像素值大于阈值则为 1，否则为 0；最终将得到一个 8 位数的二进制值（代表中心位置的 LBP 值），并且能够反映该像素周围的纹理信息。随后，大量基于 LBP 的改进算法层出不穷。例如， Ojala 等[59] 尝试将 3×3邻域扩展到任意邻域，使其能够适应不同尺度的纹理特征，具有灰度和旋转不变性的特点。如图2.2（a）和（b）分别表示原图及其对应的 LBP 特征示意图。在实际应用中， LBP 及其改进方法常用于纹理分类，人脸识别[60]以及目标检测[61]等领域。

（2）方向梯度直方图（Histogram of Oriented Gradient， HOG）： Dalal等[57]认为梯度或边缘的方向密度分布能够较好的表达局部目标的表象和形状，提出了 HOG 特征并将其应用在静态图像行人检测任务中。 HOG 特征对图像几何的形变以及光学的形变都具有良好的不变性，常与 SVM 分类器结合并应用在图像的行人检测任务中。如图2.2（c）展示了 HOG 特征示意图。

（3）尺度不变特征变换（Scale-Invariant Feature Transform， SIFT）：Lowe 等[58] 于 1999 年提出了 SIFT 特征，并于 2004 年进一步完善。 SIFT 特征被广泛应用于关键点检测，具有旋转、尺度、平移、视角和亮度不变性等特点。 SIFT特征提取的核心步骤包括： 1）检测尺度空间中的极值； 2）定位特征点； 3）赋值特征方向； 4）描述特征点。如图2.2（d）展示了 SIFT 特征示意图。

模型的学习能力关系到分类器在目标领域数据的拟合程度，比如，学习能力较弱的模型容易发生欠拟合情况。因此，在不同任务中，分类器的选择也至关重要。下文将围绕 K 邻近算法（K-Nearest Neighbor， KNN） [62] 和支持向量机（SupportVector Machine， SVM） [63]等部分主流的分类器展开介绍。

（1） K 邻近算法（K-Nearest Neighbor， KNN）： KNN 是一种常用的监督学习方法。其思想是基于某种合适的距离度量算法找出待测样本与训练集中最相近的 k 个样本，并根据这 k 个样本对待测样本进行预测。例如，通过投票的方式对 k个训练样本进行统计，并将票数最多的类别作为待测样本的类别。此外， KNN 是“懒惰学习”（Lazy Learning）的著名代表，它不需要像其他的监督模型进行前向和反向训练，即没有显式的训练过程，训练时间成本为零。如图2.3（a）所示，对于一组给定的训练数据集（三角形和圆形表示不同的类别）并指定 k 值，分类的过程中需要找到与待分类样本最相邻的 k 个样本，然后进行投票并统计，最后直接将票数最多的类别作为待分类样本的类别。值得注意的是，不同的 k 值可能得到不一样的预测结果。例如：当 k 等于图2.3（a）中的 k1 时，待分类样本的类别为圆形；当 k 等于 k2 时，则类别为三角形。由于简易性和有效性， KNN 及其改进方法常与主动学习方法结合应用到图像识别和分类任务中[64,65]。

（2）支持向量机（Support Vector Machine， SVM）：基本的 SVM 是一种线性分类器，旨在从特征空间中寻找出潜在的最优超平面 !Tx + b = 0，并以最大间隔将两个类分开。其中， ! 表示法向量， b 表示超平面到原点之间的距离。式（2.1）表示样本空间中任意样本 x 到超平面之间的距离。

如图2.3（b）所示，中间的实线表示所要寻找的最优超平面（Optimal Hyper Plane），超平面到两条虚线的距离 margin 相等，虚线上的训练样本表示支持向量。此外，核函数通过将数据映射到高维空间，从而将 SVM 推广到非线性分类问题。SVM 及其改进算法凭借较好的分类性能，被广泛应用到主动学习中[66,67]。

2.2.2 基于卷积神经网络的图像分类技术

Hubel 和 Wiesel 在 20 世纪 60 年代提出了卷积神经网络（Convolutional Neural Networks， CNNs），在研究猫脑皮层中用于局部敏感和方向选择的神经元时，发现其独特的网络结构可以有效地降低反馈神经网络的复杂性。 CNNs 经过数十年的发展，性能及其实际应用价值发生了质的飞跃，特别是在图像处理任务中取得了大量卓越的成果。值得一提的是， CNNs 在图像处理领域中取得的效果，可以进一步总结为如下原因： 1）挖掘一张图像中潜在的模式（patterns）只需要让模型观察局部区域，不需要像全连接层与图像中所有的像素点都相连； 2）同一种模式可能出现在同一张图像中的不同区域，模型学习到的同一种模式可以应用到图像的不同区域，能够减少模型的参数量； 3）视觉对来自于图像物体的理解中，下采样处理对其影响很小，同样能够减少大量的参数量。目前主流的 CNNs 架构中，上述前两点观察主要体现在卷积层（下文将围绕卷积的“权值共享机制”展开讨论）。第三点观察主要体现在 CNNs 网络结构中的池化层，属于一种特殊的卷积下采样层。

CNNs 直接将图像作为模型的输入，在一定程度上避免了图像前期复杂的预处理，引起大量研究员的广泛关注。 1994 年， LeCun 提出了 LeNet[68]，并将其应用于银行识别和分类手写体字符。如图2.4所示， LeNet 的诞生奠定了当代 CNNs 的基础，但由于当时计算能力和数据量的限制， CNNs 又经历了一次寒冬期。直到 2012 年，比 LeNet 更深层的 AlexNet[69] 模型以决定性的优势取得 ImageNet 竞赛的冠军，证明了 CNNs 应用于复杂模型的有效性，确立了 CNNs 在计算机视觉中的地位。随后，大量不同形式的改进模型层出不穷并应用于不同的领域。例如， ZFNet[70] 采用DeconvNet 和可视化（Visualization）技术监控学习过程； VGGNet[71] 采用大小为3x3 的滤波器去取代大小为 5x5 和 7x7 的滤波器从而降低计算复杂度； GoogleNet[72]推广了 NIN（Network in Network） [73]的思路并定义 Inception 模块，采用多尺度变换和不同尺寸（1x1， 3x3， 5x5）的滤波器构建网络模型； Highway Networks[74]借鉴了 LSTM[75] 的 gaiting 单元； ResNet[76] 借鉴了 Highway Networks 的跳跃连接（Skip Connection）思想，通过训练更深层的模型提升性能，并且计算复杂度变小；Inception-V3 和 V4 用 1x7 和 1x5 取代大滤波器 5x5 和 7x7， 1x1 滤波器做之前的特征瓶颈，使得卷积操作变成像跨通道（Cross Channel）的相关操作； DenseNet[77]主要通过跨层链接缓解了梯度消失（Vanishing Gradient）问题。综上所述， CNNs取得显著成绩的原因，除了计算能力的提升以及大数据等外界因素以外，网络模型的设计同样是重要因素之一。本节将结合 AlexNet 模型，重点围绕卷积及其权值共享机制展开讨论。

卷积及其权值共享机制：CNNs 的权值共享机制减少了大量的参数，为处理更复杂的图像和网络模型带来了可能性。如图2.5（a）为全连接层和卷积层的对比。在全连接层中，图像的每个像素都与全连接层中的每个神经元通过权值连接。卷积层通过滑动窗口的形式提取图像的局部特征，每个卷积核都会关注一种图像特征，如边缘、颜色和纹理等常见的图像特征。如图2.5（b）展示了 Sobel 滤波器提取边缘特征的示意图，原图像经过与 3x3 的 Sobel 滤波器进行卷积操作后，得到了提取后的边缘特征。每个滤波器的权值通过卷积操作同时作用到图像的所有像素上，所需参数量不随图像的尺寸改变，这就是权值共享机制的基本思想。举例说明：假设需要处理一张像素为 100x100 的图像，与之连接的全连接层中有 100 个神经元，总共需要一百万个参数。相较之下，使用一个 10x10 的卷积核也能够表示边缘等底层特征并且仅需 100 个参数。我们可以通过增加卷积核的数量得到不同的特征， 10 个10x10 的卷积核仅需 1000 个参数。由此可见，以卷积滑动窗口的连接形式相较于全连接方式能够显著地减少参数量。

基于 PyTorch 框架的 AlexNet 模型： Krizhevsky 在 2012 年使用 AlexNet 模型[69]赢得了 ImageNet 竞赛的冠军。 AlexNet 模型的网络结构主要包括卷积层、池化层、激活函数、全连接层、 Dropout 层以及连接输出层的 softmax 函数。当时Krizhevsky 在两块 GPU 上进行训练，使用 ReLU 作为激活函数缓解深层网络带来的梯度弥散问题，并利用数据增强技术和 LRN 层防止模型学习过程中的过拟合问题。本文第三章和第四章使用 PyTorch 框架提供的 AlexNet 模型[78]，如图2.6所示的网络结构中，包括 5 个卷积层， 3 个最大池化层（MaxPooling）和 2 个全连接层。图2.6将分布在两块 GPU 上的结构整合到同一块 GPU 上进行展示，与最原始的 AlexNet 示意图有细微的区别。

CNNs 的设计过程中，通常需要将卷积层提取的图像特征与若干个全连接层相连，使其映射到一个固定大小的特征向量。以本文使用的 AlexNet 模型为例，表2.1展示了卷积核参数（例如， 64@11x11x3 表示有 64 组大小为 11x11x3 的卷积核， 3为通道数），移动步长及其移动方式，以及输入图像依次经过卷积操作和最大池化操作后输出图像的大小。

此外，式（2.2）给出了输入图像（InputSize）经过卷积层后对应输出图像大小（OutputSize）的计算方式。其中， KernelSize 表示卷积核的大小， Padding 表示步长的移动方式（0 表示不在原始图像周围添加像素点， 1、 2分别表示在所有通道周围添加 1 或者 2 圈像素点）， Stride 为卷积核滑动窗口的移动步长（数值代表每次窗口滑动时跳跃的像素个数）。

2.3 主动学习方法

如图2.7（a）所示，红色实线表示理想情况下模型性能随着训练标注样本数量的增多而无限地提升。然而，实际情况下往往是如图2.7（b）的红色实线所示，模型的性能不是随着标注数据量的增多而无限地提升。此外，每个模型都会有与之对应的瓶颈性能（peak performance），研究者通过增加训练数据以及调参使之不断逼近瓶颈性能。主动学习关注的正是如何使用尽可能少的标注数据达到模型的瓶颈性能，从而减少不必要的标注成本。如图2.7（b）的蓝色虚线所示，主动学习根据合适的策略筛选出最具有价值的样本优先标注并给模型训练，从而以更少的标注样本达到模型的瓶颈性能。

2.3.1 主动学习基本框架

随着互联网的普及和数据采集技术提升，使得很多领域能够以廉价的成本获取大量未标注数据。基于未标注样本池的主动学习方法成为目前最流行且应用最广泛的场景。基本的主动学习方法主要由五个核心部分组成，包括： 1）未标注样本池U（图2.8中的第 1 部分）， 2）筛选策略 Q（图2.8中的第 2 部分）， 3）相关领域的标注专家 S（图2.8中的第 3 部分）， 4）标注数据集 L（图2.8中的第 4 部分）， 5）目标模型 G（图2.8中的第 5 部分）。主动学习方法将上述五个部分组合到一个框架中，并通过如图2.8所示的顺序，以不断迭代的训练方式更新模型性能、未标注样本池以及标注数据集，直到目标模型达到预设的性能或者不再提供标注数据为止。本节将围绕主动学习的基本框架展开讨论。

在实际应用中，首先需要根据特定领域的数据采集方法收集到大量的未标注样本，经过数据清洗后组成未标注样本池 U。一般情况下，为了验证模型的性能，将划分部分数据集作为模型的验证集和测试集，剩余的样本作为训练集。因此，首先，可以通过随机抽样法从未标注样本池 U 中选择部分样本给相关领域的专家 S 进行标注，并将其作为模型的验证集和测试集。然后，选择合适的模型作为分类器 G，例如基于传统机器学习算法的 SVM 或者基于深度学习方法的 AlexNet 模型。紧接着，根据具体应用场景选择合适的策略 Q（例如，不确定性策略）作为筛选样本的依据，从而产生一批待标注样本集 X 并交给相关领域的专家进行标注。值得注意的是，标注者在主动学习环节中至关重要，应该尽量保证提供准确性较高的样本标签。但是，一个鲁棒的主动学习算法需要考虑标注过程中不可避免的意外因素，比如产生少量的错误标签等因素，因此设计算法的时候也应考虑到模型的抗噪能力。最后，待标注样本集 X 将以增量式的方式加入标注数据集 L 中并提供给模型 G 进行训练，同时根据未被选中的样本更新未标注样本集合 U。至此，完成了主动学习的一次迭代过程，模型 G 将通过新增的标注样本不断提升性能，标注数据集 L 也将不断增加，未标注样本数据集 U 将不断减少。通过反复执行上述的迭代过程，直到满足预期设定的条件，比如模型达到预定的准确率或者标注成本达到上限等条件。算法2-1给出了基于未标注样本池的主动学习方法的基本框架。

2.3.2 主动学习基本策略

样本的筛选策略直接关系到模型能够节约标注成本的程度。例如，使用不确定性策略比随机采样策略能够节约更多的标注样本[4,5]。因为随机采样策略既没有利用到模型的预测信息，也没有利用到大量未标注样本池的结构信息，仅凭随机采样决定优先标注的样本。而不确定性策略通过与模型的预测信息进行交互，优先筛选出相对当前模型最有价值的样本。本节将围绕部分经典的筛选策略展开讨论。

（1）随机采样策略（Random Sampling， RS）： RS 不需要跟模型的预测结果做任何交互，直接通过随机数从未标注样本池筛选出一批样本给专家标注，常作为主动学习算法中最基础的对比实验。

（2）不确定性策略（Uncertainty Strategy， US）： US 假设最靠近分类超平面的样本相对分类器具有较丰富的信息量，根据当前模型对样本的预测值筛选出最不确定的样本。 US 包含了一些基础的衡量指标： 1）最不确定指标（LeastConfdence， LC）将预测概率的最大值的相反数作为样本的不确定性分数。 2）边缘采样（Margin Sampling， MS）认为距离分类超平面越近的样本具有越高的不确定性，常与 SVM 结合并用于解决二分类任务，但在多分类任务上的表现不佳。3）多类别不确定采样（Multi-Class Level Uncertainty， MCLU）是 MS 在多分类问题上的扩展， MCLU 选择离分类界面最远的两个样本，并将它们的距离差值作为评判标准。 MCLU 能够在混合类别区域中筛选出最不确信度的样本，如式（2.3）所示。其中， x j 表示被选中的样本， C 表示样本 xi 所属的类别集合， c+ 表示最大预测概率对应的类别， f (xi; c) 表示样本 xi 到分类超平面的距离。 4）熵值最大化（Maximize Entropy， ME）优先筛选具有更大熵值的样本，熵值可以通过计算 EntropyS core = - ∑Ci=1 pi × log(pi) 得到，其中 pi 表示第 i 个类别的预测值。 5）样本最优次优类别（Best vs Second Best, BvSB） [79]主要是针对多分类问题的一种衡量指标，并且能够缓解 ME 在多分类问题上效果不佳的情况。 BvSB 只考虑样本预测值最大的两个类别，忽略了其他预测类别的影响，从而在多分类问题上的效果更佳。

（3）委员会投票（Query by Committee， QBC）： QBC[31]是一种基于版本空间缩减的采样策略，核心思想是优先选择能够最大程度缩减版本空间的未标记样本。 QBC 包括两个基本步骤： 1）使用多个模型构成委员会； 2）委员会中所有的模型依次对未标注样本进行预测并优先筛选出投票最不一致的样本进行标注。由于QBC 在实际应用的过程中需要训练若干个模型，导致具有较高的计算复杂度。基于此，熵值装袋算法（Entropy Query-By-Bagging， EQB） [80]和自适应不一致最大化（Adaptive Maximize Disagree， AMD）被提出并缓解了计算复杂度问题。其中，EQB 同时引入了 bagging 继承方法以及 bootstrap 采样； AMD 主要针对高维数据，将特征空间划分为一定数量的子集并构造委员会。

（4）部分其他经典的策略：梯度长度期望（Expected Gradient Length， EGL）策略根据未标注样本对当前模型的影响程度优先筛选出对模型影响最大的样本；EGL[4]是代表性方法之一，能够应用在任意基于梯度下降方法的模型中。方差最小（Variance Reduction， VR）策略通过减少输出方差能够降低模型的泛化误差[81,82]；Ji 等[82]提出了一种基于图的 VR 衡量指标的主动学习方法，通过将所有未标注样本构建在同一个图中，每个样本分布在图中每个结点上。紧接着，通过调和高斯随机场分类器直接预测未标注样本所属的标签；在优化的过程中，通过挑选一组未标注样本进行预测并获得对应的预测类别，使得未标注样本的预测类别方差最小。

2.3.3 主动学习的扩展方法

近年来，主动学习策略在很多实际应用场景中取得显著的效果。但同时也存在一些亟需解决的挑战。例如，不确定性策略只关注样本的不确定性，在 BMAL 场景下会产生大量具有冗余信息的样本。因此，仅使用单一的策略尚未能最大程度地节约标注成本。本节将围绕本文的核心工作简要地介绍几种主动学习的扩展方法。

（1）组合多种基本策略的主动学习方法：组合策略将多个基本策略以互补的方式进行融合，广泛应用于图像分类任务中[36,37,38,83]。其中， Li 等[36]基于概率分类模型提出一种自适应的组合策略框架。 Li 等[36]通过信息密度指标（Information DensityMeasure）将未标注样本的信息考虑在内，弥补了不确定性策略的不足。如算法2-2所示，该框架能够扩展到更多的组合策略，本文第三章借鉴了组合策略的思想。

（2）结合半监督学习（Semi-Supervised Learning）的主动学习方法：自训练（Self-training）算法作为半监督学习的一种基础方法，其核心步骤如算法 2-3所示。

由于自训练算法在训练过程中会根据模型的预测信息，挑选合适的样本及其对应的预测标签加入训练集，而且初始化少量的标注样本能够保证模型的初始性能，因此初始化训练环节对其后续的学习过程至关重要。半监督学习算法需要解决的挑战之一是：在训练的过程中容易引入大量的噪声样本，导致模型学习不到正确的信息。部分研究员们通过构建多个分类器的协同训练算法缓解噪声样本，如Co-Training[84] 和 Tri-Training[85]。本文在第三章从另一种思路入手，提出了一个噪声鲁棒的半监督主动学习框架，分别从减少噪声样本数量以及自动调整噪声样本等角度进行了充分地考虑，并将其与主动学习算法结合。此外，半监督学习方法与主动学习方法结合的相关工作已介绍于第一章，此处不再赘述。

（3）结合生成对抗网络的主动学习方法：生成对抗网络（Generative Adversarial Networks， GAN）模型以无监督的训练方式对大量未标注样本进行训练，并通过生成器产生新的样本。经典的 GAN[15] 主要包括生成器和判别器等两个核心部分，两者以互相博弈的方式进行对抗训练，直到两者达到一个动态均衡的状态。 GAN 的目标函数如式（2.4）所示，其中， V (G; D) = Ex∼Pdata [logD (x)] + Ex∼PG [log (1 - D (x))] 表示数据真实分布 x ∼ Pdata 与生成模型得到的分布 x ∼ PG 之间的差异。文献[19,50]将生成器和主动学习策略进行融合并构建目标函数，通过解决优化问题控制生成器产生的样本。本文第四章将重点介绍上述两种方法及其对应的目标函数，并在此基础上提出一个基于生成对抗网络的二阶段主动学习方法。

2.3.4 主动学习方法的基本评价指标

本文使用的评价指标：本文侧重研究主动学习方法在保证不损失模型准确率的情况下，节约标注成本的性能，评价指标如式（2.5）所示。其中， S avedRate 表示主动学习方法相对于全样本训练减少的标注成本； ExpertAnnotated 表示当模型达到预定的目标性能时专家标注的样本数量； FullS amples 表示当前数据集提供的未标注样本数量，即全样本训练时所使用的标注样本数量。本文的第三章将对上述五组数据集进行全样本训练，并分别记录最佳验证集准确率作为主动学习相关算法的目标准确率。例如，在某组数据集中使用 AlexNet 模型对 FullS amples 张标注图像进行训练，记录训练过程中最佳的验证准确率（best accuracy）并将其作为主动学习的目标准确率（target accuracy）；随后，模型通过迭代过程不断提升性能，当达到目标准确率时，记录专家所标注的样本数量 ExpertAnnotated；此时，就可以算出SavedRate 的值，即该方法能够节约多少标注成本。此外，我们也会将主动学习方法与一些常见的方法进行比较，比如 RS 策略常用于基准对比实验（baseline）。

C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
《分片终章的哈希裂痕：藏在数据拼接里的隐形逻辑》前端
在大文件分片传输里，有一个令人费解的现象：当所有分片的校验都显示正常，拼接后的整体文件却与源文件的哈希值不符，而问题往往精准地指向最后一片。这并非偶然的技术故障，而是数据传输链条中多重隐形逻辑交织的必然结果，如同钟表的齿轮在最后一圈突然出现难以察觉的错位。文件被切割成固定大小的分片时，最后一片往往是规则的例外。它如同拼图中形状特异的收尾piece，尺寸可能小于其他分片，却承担着衔接整体的关键作用。
基于架构的软件设计（Architecture-Based Software Design，ABSD）是一种以架构为核心的软件开发方法
ABSD方法与生命周期基于架构的软件设计（Architecture-BasedSoftwareDesign，ABSD）是一种以架构为核心的软件开发方法，强调在开发的各个阶段都要以架构为中心，确保系统的整体结构和质量属性得到有效管理。ABSD方法是一个自顶向下、递归细化的过程，软件系统的架构通过该方法得到细化，直到能产生软件构件和类。ABSD方法的三个基础功能的分解：使用基于模块的内聚和耦合技术，将
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
无线鼠标产品整体技术分析总结悟空胆好小计算机外设
无线鼠标产品对比分析，以小米为例文章目录无线鼠标产品对比分析，以小米为例一.小米无线鼠标产品对比1.1小米无线鼠标XMSMSB05YM2.4G单模款1.2小米无线鼠标XMSMSB01YM2.4G+BT双模款二.**单模鼠标与双模的区别****1.连接方式****2.通信性能与可靠性****3.功耗管理****4.适用场景****5.技术扩展性**6.**小结**三.无线鼠标产品技术重点分析3.1.
cvc降噪和主动降噪_音频知识：CVC降噪和ANC主动降噪的区别和应用汪国 cvc降噪和主动降噪
原标题：音频知识：CVC降噪和ANC主动降噪的区别和应用降噪，对于需要长时间戴耳机的人群来讲，起到了很好的保护作用。然而在购买蓝牙耳机时总会听到商家在宣传耳机所具备的CVC、ANC降噪功能，尽管听过很多商家描述，有些小伙伴依然不是很明白这两者之间的区别以及应用。现在简单和大家介绍这两个看不懂的降噪名词。CVC降噪(ClearVoiceCapture)是通话软件降噪技术。工作原理是是通过耳机内置的消
利用技术分享提升个人影响力 AI天才研究院计算 AI人工智能与大数据 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《利用技术分享提升个人影响力》关键词：技术分享、个人品牌、影响力、内容创作、互动反馈、持续成长摘要：本文将深入探讨技术分享在个人发展中的重要作用，通过详细分析技术分享的意义、平台选择、内容创作、互动反馈及个人影响力提升策略，帮助读者掌握利用技术分享提升个人影响力的实用方法。第一部分：引言与基础第1章：技术分享的意义与价值1.1.1技术分享的历史与发展技术分享作为一种知识传播的方式，其历史可以追溯到
小林渗透入门：burpsuite+proxifier抓取小程序流量 ξ流ぁ星ぷ132 小程序 web安全安全性测试网络安全安全
目录前提：代理：proxifier：步骤：bp证书安装bp设置代理端口：proxifier设置规则：proxifier应用规则：结果：前提：在介绍这两个工具具体实现方法之前，有个很重要的技术必须要大概了解才行---代理。代理：个人觉得代理，简而言之，就是在你和服务器中间的一个中间人，来转达信息。那为什么要代理呢，因为这里的burpsuite要抓包，burpsuite只有做为中间代理人才可以进行拦截
Java 调用 HTTP 接口的 7 种方式：全网最全指南
Java调用HTTP接口的7种方式：全网最全指南在开发过程中，调用HTTP接口是最常见的需求之一。本文将详细介绍Java中7种主流的调用HTTP接口的方式，包括每种工具的优缺点和完整代码实现。1.使用RestTemplateRestTemplate是Spring提供的同步HTTP客户端，适用于传统项目。尽管从Spring5开始被标记为过时，它仍然是许多开发者的首选。示例代码importorg.sp
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
[特殊字符] 实时数据洪流突围战：Flink+Paimon实现毫秒级分析的架构革命（附压测报告）——日均百亿级数据处理成本降低60%的工业级方案 Lucas55555555 flink 大数据
引言：流批一体的时代拐点据阿里云2025白皮书显示，实时数据处理需求年增速达240%，但传统Lambda架构资源消耗占比超运维成本的70%。某电商平台借助Flink+Paimon重构实时数仓后，端到端延迟从分钟级压缩至800ms，计算资源节省5.6万核/月。技术红利窗口期：2025年ApachePaimon1.0正式发布，支持秒级快照与湖仓一体，成为替代Iceberg的新范式一、痛点深挖：实时数仓
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
等保测评中的物联网设备安全评估亿林数据物联网安全网络安全等保测评
随着物联网（IoT）技术的飞速发展，物联网设备已经广泛应用于智能家居、智慧城市、工业自动化等多个领域，极大地提升了社会生产力和生活便利性。然而，随着IoT设备数量的激增，其安全性问题也日益凸显，成为我们必须面对的重要课题。在这一背景下，等级保护（等保）测评中的物联网设备安全评估显得尤为重要，它为我们提供了一个有效的安全评估和管理机制。一、物联网设备安全评估的重要性物联网设备的核心理念是实现物物相连
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
音频被动降噪技术悟空胆好小音频相关音视频
音频被动降噪技术音频被动降噪技术是一种通过物理结构和材料设计来减少或隔离外部噪声的降噪方式，其核心原理是通过物理屏障或吸声材料来阻断或吸收声波，从而降低环境噪声对听觉体验的影响。以下将从技术原理、应用场景、优缺点及与其他降噪技术的对比等方面进行详细分析。一、被动降噪技术的原理被动降噪技术（PassiveNoiseCancellation,PNC）主要依赖于耳机的物理结构和材料设计，通过以下几种方式
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
《Java前端开发全栈指南：从Servlet到现代框架实战》
前言在当今Web开发领域，Java依然是后端开发的主力语言，而随着前后端分离架构的普及，Java开发者也需要掌握前端技术栈。本文将全面介绍JavaWeb前端开发的核心技术，包括传统Servlet/JSP体系、现代前端框架集成方案，以及全栈开发的最佳实践。通过本文，您将了解如何构建现代化的JavaWeb应用前端界面。一、JavaWeb前端技术演进1.1传统技术栈Servlet：JavaWeb基础，处
【Linux内核模块】Linux内核模块简介 byte轻骑兵 #嵌入式Linux驱动开发实战 linux arm开发运维
你是否好奇过，为什么Linux系统可以在不重启的情况下支持新硬件？为什么修改一个驱动程序不需要重新编译整个内核？这一切都离不开Linux的"模块化魔法"——内核模块（KernelModule）。作为Linux内核最灵活的特性之一，内核模块让开发者可以动态扩展内核功能，今天就来揭开这个神秘组件的面纱。目录一、什么是内核模块？1.1先打个比方：给内核装"插件"1.2技术定义：动态加载的内核代码段1.3
盲超分的核心概念小冷爱读书数学建模盲超分超分重建
一、盲超分的本质与数学建模1.退化过程的数学表达低分辨率图像（LR）可看作高分辨率图像（HR）经过退化模型后的结果：：观测到的低分辨率图像：待恢复的高分辨率图像：模糊核（BlurKernel）⊗：卷积操作↓：下采样（步长为）：加性噪声（如高斯噪声、泊松噪声等）盲超分的核心问题：在未知、、的情况下，从估计。2.为什么传统超分方法会失效？传统方法（如SRCNN、EDSR）假设退化是固定的（如双三次下采
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>