机器学习与AI生成创作

四两拨千斤！深度主动学习综述2020

点击上方“机器学习与生成对抗网络”，关注"星标"

获取有趣、好玩的前沿干货！

推荐阅读：

弱水三千，只取你标！AL（主动学习）结合GAN如何？

本文转载自知乎，为最近新出的论文 A Survey of Deep Active Learning 中文版介绍，原文作者调研了189 篇文献综述了深度主动学习的进展。文章较长，建议先收藏再阅读。

https://zhuanlan.zhihu.com/p/218011458

论文地址：

https://arxiv.org/pdf/2009.00236.pdf

Abstract

主动学习试图通过标记最少量的样本使得模型的性能收益最大化。而深度学习则对数据比较贪婪，需要大量的数据供给来优化海量的参数，从而使得模型学会如何提取高质量的特征。近年来，由于互联网技术的快速发展，使得我们处在一个信息洪流的时代，我们拥有海量的未标记数据。

借此，深度学习引起了研究人员的强烈兴趣，并且得到了快速的发展。和深度学习相比，研究人员对于主动学习的研究兴趣相对较低。这主要是由于在深度学习兴起之前，传统的机器学习所需要的标注样本相对较少。因此，早期的主动学习很难体现出应有的价值。尽管深度学习已经在各个领域取得了突破性进展，但是这绝大部分的成功都要归功于现有的大量标注数据集的公开。

然而，大量高质量的标注数据集的获取需要消耗大量的人力，在一些需要很高专业知识的领域这是不被允许的，尤其是在语音识别、信息提取、医学图像等领域。因此，主动学习逐渐受到了应有的重视。

一种很自然的想法是能否使用主动学习来减少样本标注的成本，同时保留深度学习强大的学习能力。

因此，深度主动学习出现了。尽管相关的研究已经相当的丰富，但是缺乏一个对深度主动学习全面的survey。本文正是要填补这项空白，我们为现有的工作提供了一个形式上统一的分类方法，并进行一个全面系统的概述。

此外，我们还从应用的角度对DAL的发展进行了分析和总结。最后，我们对DAL中存在的困惑、问题进行了讨论，并给出了一些DAL可能的发展方向。

Introductio

在机器学习社区中深度学习和主动学习都有着重要的应用。他们凭借着各自优异的特性吸引了大量研究人员的兴趣。具体来说，DL已经在各种具有挑战性的任务上取得了前所未有的突破，但这很大程度上归功于海量标注数据集的公开。

因此，DL在一些需要丰富知识的专业领域受限于高昂的样本标注代价。另一方面，从理论上讲，有效的AL算法可以实现在标注工作效率方面的指数级加速。这种巨大的标注代价节省潜力令人着迷。

此外，经典的AL算法也存在难以处理高维数据的困境。因此，这种明显互补的优势使得DL与AL的结合DAL被研究人员给予厚望。深度主动学习已经被广泛的应用在了各个领域，例如图像识别，目标检测等。

尽管相关的工作已经相当的丰富，但是深度主动学习仍然缺乏一个统一的分类框架。为了填补这项空白，在本文中我们将对现有的深度主动学习的相关工作做一个全面的概述，并提供一个形式化的分类方法。

接下来，我们将首先简要的回顾深度学习与主动学习在各自领域中的发展现状。然后，在Section 3中进一步给出DL与AL结合必要性和所面临的挑战。

(a)基于池的主动学习周期：使用查询策略在无标记池中查询样本交给oracle进行标注，然后将查询的样本添加到标记训练数据集中并训练，接着使用新学习的知识进行下一轮查询。重复这个过程，直到标注预算被耗尽或者达到预先设定的终止条件。

(b)一个常见的深度学习model：卷积神经网络

(c)深度主动学习的典型例子: 深度学习model的参数 θ 在初始化标签训练集上进行初始化或者预训练，无标记池的样本通过深度学习model提取特征。然后基于相应的查询策略挑选样本，并在oracle中查询标签，形成新的标签训练集，接着在上训练深度学习model，同时更新。重复这个过程，直到标注预算被耗尽或者达到预先设定的终止条件。

Deep Learning

深度学习试图通过模拟人类大脑的结构来构建相应的model。1943年，A提出的McCulloch-Pitts (MCP) model被认为是现代深度学习的开端。随后，1986年B将反向传播引入到神经网络的优化中，这为深度学习后来的蓬勃发展奠定了基础。同年，递归神经网络被提出。1990年，LeNet网络出现，它是最早使用深度神经网络（DNN）的工作之一。然而，早期的这些开创性工作受限于当时的计算资源并未得到应有的广泛的重视与应用。

2006年，深度信念网络（DBNs）被提出，并以此探究了比以往更深的网络，这促使将神经网络被命名为深度学习。在2012年，在ImageNet大赛上，深度学习模型AlexNet一举夺冠。它使用ReLU激活函数有效的抑制了梯度消失的问题，同时使用多GPU极大的提高了模型的训练速度。

随后，深度学习开始在各个大赛中斩获冠军并且在各种任务中不断刷新着记录。从自动化的角度来看，深度学习的出现使得原本机器学习中特征的手动设计转变为自动提取。正是由于深度学习强大的自动特征提取能力才使得它在众多的领域表现出前所未有的优势。深度学习经过数十年的发展，相关的研究工作已经相当的丰富。

在Fig.1a，我们显示了一个标准的深度学习模型示例：卷积神经网络。以此为基础类似的卷积神经网络被应用于各种图像处理任务。此外被广泛应用的还有循环神经网络、生产对抗性网络等。从2017年开始，深度学习从最初的特征提取自动化逐渐转变为模型架构设计的自动化。但是，这还需要很长的一段路要走。

得益于现有的大量标注数据集的公开，近年来，深度学习在机器翻译，语音识别，图像分类等各个领域中都取得了突破性进展。然而，这是以大量人工标注数据集为代价的，并且深度学习对数据有着很强的贪婪属性。

在现实世界中，大量未标注的数据集的获取是相对较为简单的，但是数据集的人工标注面临着高昂的代价。尤其是那些需要很高专业知识的领域，例如对COVID-19患者的肺部病变图像的标注以及描述工作就需要经验丰富的临床医生才能完成，显然要求他们完成大量医学图像标注工作是不可能的。类似的领域还包括语音识别、信息提取，卫星遥感等领域。因此，我们急需一种方法可以在注释少量样本的情况下使得模型获得最大的性能增益。

Active Learning

主动学习正是这样一种方法，它试图从未标记数据集中选择最有用的样本交给 oracle进行标注，从而在保持性能的情况下尽可能降低标注成本。主动学习从应用场景上来可以划分为membership query synthesis，stream-based selective sampling和pool-based active learning.

Membership query synthesis是指学习者可以请求查询输入空间中任何未标记样本的标签，包括学习者生成的样本。而stream-based selective sampling和pool-based的区别主要在于前者是对数据流中的每个样本独立作出判断是否需要查询未标记样本的标签，而后者则可以基于对整个数据集的评估和排名来选择最佳查询样本。

相比之下，pool-based的场景似乎在论文应用中更加常见，但很显然stream-based selective sampling的应用场景则更适合于要求时效性的小型的移动终端设备。在fig.1(a)中，我们展示了基于池的主动学习周期的框架图。初始状态下，我们可以从未标记池中随机挑选一个或多个样本并交给oracle查询标签得到标注数据集，然后在上以监督学习的方式训练model。接着，利用新知识选择下一个要查询的样本，并将新查询的样本添加到中并训练。重复这个过程，直到标注预算被耗尽或者达到预先设定的终止条件。

与深度学习通过使用手工或者自动的方法千方百计的设计具有高性能特征提取能力的模型不同。主动学习则从数据集入手，主要通过设计精妙的查询规则从未标记的数据集中选择最佳的样本并查询其标签，试图尽可能的降低标注代价。

因此，查询规则的设计对主动学习的性能是至关重要的。相关的研究也相当的丰富，例如，在给定的一组未标记数据集中，主要的查询策略有基于不确定性的方法，基于多样性的方法和预期的模型更改。

除此之外，还有很多的工作研究了混合查询策略,同时考虑查询样本的不确定性和多样性，并试图在这两种策略中找到平衡点。因为单独的基于不确定性的采样往往会造成采样偏差：即当前选择的样本在未标记数据集的分布中不具有代表性。

另一方面，仅考虑多样性策略则可能会导致标记成本增加：即可能有相当一部分信息量较低的样本会被选择。更多经典的查询策略可以在A中进行查询。虽然AL相关的研究已经相当丰富，但AL仍然面临着向高维数据（例如,图像、文本、视频等）拓展的难题，因此大多数主动学习的工作都主要集中在低维问题上。此外，AL往往基于事先提取好的特征来查询高价值的样本，其本身并不具有特征提取的能力。

The necessity and challenge of combining DL and AL

DL在高维数据处理以及自动特征提取方面有着强大的学习能力，AL在有效降低标注成本方面也有着巨大的潜力。因此，一种显而易见的想法是将DL与AL进行结合，这将极大的拓展它们的应用潜力。DAL正是考虑结合二者优势互补的特性而被提出的，相关的研究也被研究人员寄予厚望。尽管AL关于查询策略的研究已经相当丰富，但是想要直接将这种策略应用到深度学习中仍然是相当困难的。这主要是由于：

标签样本的数据不足。主动学习往往只依赖于少量的标记样本数据就可以实现学习和更新模型，而DL往往对数据有很强的贪婪性，经典AL方法所提供的标记训练样本不足以支持传统DL的训练。此外，在主动学习中常用的one by one样本查询方式在深度学习中也是不适用的。
模型不确定性问题。基于不确定性的查询策略是主动学习的一个重要方向。在分类任务当中，尽管深度学习可以使用softmax layer来获得标签上的概率分布，然而事实表明它们过于自信。最终输出的softmax 分数作为置信度度量方法是不可靠的，这种方法的性能甚至会比随机采样的效果更差。
处理管道不一致。AL和DL的处理管道是不一致的。大多数AL算法主要关注于分类器的训练，各种查询策略的很大程度上都是基于固定的特征表示。而在DL中，特征学习和分类器的训练是共同优化的。仅在AL框架中对DL模型进行微调或者将它们视作两个独立的问题可能会引起分歧问题。

针对第一个问题，研究者考虑使用生成网络来进行数据增强或者为高置信度样本分配伪标签等方式来扩充标记训练集。也有研究者考虑在跨AL周期上同时使用标记数据和未标记数据集进行监督训练与半监督训练的结合。

此外，基于启发式的AL查询策略已经被证明在应用于CNN时是无效的。因此，针对经典AL中one-by-one的查询策略，许多研究者聚焦于batch样本的查询策略的改进, 在批量的样本中同时考虑样本的信息量以及多样性。

为了解决深度学习对模型不确定性的忽视，一些研究者借助贝叶斯深度学习来处理主动学习语境下高维但查询数量较少的mini-batch样本，从而有效的缓解了DL模型对输出结果过于自信的问题。

对于处理管道不一致的问题，研究者考虑修改AL和DL的结合框架，使提出的DAL模型尽可能通用，方便可以拓展到各个应用领域。这对DAL的推广有着重要的意义。例如，A将主动学习的思想嵌入深度学习提出了一个与任务无关的架构设计。

我们将在下一节中集中对deep active learning中使用到的各种策略进行详细的讨论和总结。

Deep Active Learning

在本节中，我们将对DAL的相关工作进行全面系统的概述。Fig.1c显示了一个典型的深度主动学习的模型架构示例。深度主动学习的典型例子: 深度学习model的参数 θ 在初始化标签训练集上进行初始化或者预训练，无标记池的样本通过深度学习model提取特征。

然后基于相应的查询策略挑选样本，并在oracle中查询标签，形成新的标签训练集，接着在上训练深度学习model，同时更新。重复这个过程，直到标注预算被耗尽或者达到预先设定的终止条件。

从Fig.1c中的DAL框架示例中我们可以粗略的将DAL的框架分成两大部分：在未标注数据集上的主动学习查询策略以及deep learning model的训练方法。为此，我们将在接下来的3.1和3.2中分别对他们进行讨论和总结。最后，我们将在3.3中讨论deep active learning 在模型的泛化通用性上所做的努力。

Query Policy Optimization in DAL

在基于池的方法中，我们定义为有个样本的未标记数据集,其中，为样本空间，为标签空间（最初是未知的）, 为一个潜在的分布，其中。为有个样本的当前标记训练集。

在DAL的标准监督环境下的，我们的主要目标是设计一个查询策略， ,使用深度模型，监督环境下的DAL的优化问题可以被表述为

其中为给定的损失方程，并且期待。我们的目标是在保证一定精度的前提下，使得尽可能的小。因此，在DAL中查询策略对标注代价的减少是至关重要的。

Batch Mode Deep Active Learning (BMDAL)

DAL与经典AL的主要区别在于DAL采用的是基于batch的样本查询方式。在传统的AL中大部分算法采用 one by one 的方式进行查询，这导致学习模型被频繁训练，而训练数据却几乎没有变化。这种查询方式得到的训练集在DL模型的训练中不仅低效且极易引起过拟合。
因此，BMDAL的研究是必要的。在BMDAL的语境中，在每一个获取步骤，我们依据所使用的获取函数以及在上训练过的深度模型对候选的未标记数据样本的batch进行评分, 从而选择一批新的数据样本，这个问题可以被表述为：

一个天真的想法是基于one-by-one的策略，连续查询一个批次的样本。例如，A采用批量获取的方法，选择查询BALD获取分数最高的前个样本。显然，这种方法是不可行的，因为这极有可能选择一组信息丰富但却相似的样本。类似的样本为模型提供的信息基本上是相同的，这不仅浪费标注资源，模型也很难真正学到有用的信息。因此，BMDAL的核心在于查询一组信息丰富且多样的样本。Fig.2展示了这种想法的一个示意图。

基于batch查询策略构成了AL与DL相结合的基础，相关的研究也非常的丰富。我们将在下面几个小节中对BMDAL上的查询策略进行详细的概述与讨论。

Uncertainty and hybrid query strategy

由于基于不确定性的方法形式简单且较低的计算复杂度，它是AL中是非常受欢迎的一种查询策略。这种查询策略主要用在一些浅层的模型（如，SVM或KNN）当中，这主要是由于这种模型的不确定性可以通过传统的不确定性采样方法（Margin Sampling, Least Confidence and Entropy ）进行准确测量。

有很多DAL方法直接采用了这种基于不确定性的采样策略，但是，正如3.1.1所分析的那样这很容易导致批查询样本的多样性不足（没有充分利用数据分布的相关知识），进而导致DL模型训练性能低下甚至失效。一种可行的策略是在一个批查询中采用混合查询策略，以显式或者隐式的方式同时考虑样本的信息量、多样性或者表示形式。

早期的Batch Mode Active Learning (BMAL)算法性能往往过于依赖样本之间相似性的度量。此外，这些算法往往仅善于利用（学习者倾向于仅关注当前决策边界附近的样本，对应于高信息量的查询策略），导致查询到的批量样本集中的样本无法代表特征空间的真实数据分布（批量样本集的多样性不足）。

基于这个观察，A使用深度神经网络来学习样本的特征表示，并显式的计算样本之间的相似性。同时平衡利用和探索（在模型训练初期学习者采用随机采样的策略来进行探索）进程，从而更为准确的测量样本之间的相似度。

另一方面, DBAL通过将信息量以权重的方式添加到K-means的优化目标中，深入研究了在mini-batch的样本查询设置下同时考虑样本信息量与多样性的混合查询策略。DBAL可以方便的完成从广义线性模型到DL的拓展，不仅增加了DBAL的可拓展性且增加了小批量主动查询样本的多样性。

这种混合查询策略是相当流行的，例如，WI-DL 主要考虑深度信念网络（DBN）的两个阶段，在无监督特征学习阶段主要考虑数据的代表性，而在监督微调阶段来兼顾数据的不确定性，然后将两个指标进行整合，最后使用提出的weighted incremental dictionary learning （WI-DL）算法进行优化。

尽管上述改进已经取得了不错的性能，但是仍然存在一个待解的隐患。事实上，基于多样性的策略并非对于任何数据集都是合适的。数据集的类别内容越丰富批处理的大小越大，基于多样性的方法效果就越好。

反之，使用基于不确定性的查询策略表现效果则相对更好。这些特性取决于数据集的统计特性，而在BMAL中数据往往是不熟悉的且可能是无组织的。因此，无法知道具体哪种AL查询策略更加合适。基于此，Batch Active learning by Diverse Gradient Embeddings (BADGE)对在幻觉梯度空间中表示时不同且大小的点组进行采样，从而在一个批次中同时考虑模型的预测不确定性和样本的多样性。

最重要的是，BADGE可以实现在预测不确定性和样本多样性之间的自动平衡，而不需要手动的超参数调整。不同于BADGE以一种隐式的方式来考虑这种混合查询策略，Wasserstein Adversarial Active Learning (WAAL) 提出了一种在不确定性和多样性之间显式的折中的混合查询策略。此外，WAAL通过采用Wasserstein距离，将AL中的交互过程建模为分布匹配，并从中得出损失，进而将WAAL分解为两个阶段：DNN参数优化与查询批次选择。

TA-VAAL（2020）也探索这种混合查询策略的平衡。TA-VAAL认为基于不确定性的方法没有很好的利用整体的数据分布，而基于数据分布的方法往往忽视了任务中的结构。因此，TA-VAAL提出将损失预测模块和RankCGAN概念整合到变分对抗主动学习（VAAL）中，以便同时考虑数据分布和模型的不确定性。TA-VAAL在各种平衡和不平衡的基准数据集上都取得了很好的性能。TA-VAAL与VAAL的结构图被展示在fig6.

实际上，尽管混合查询策略表现出更为优异的性能。但相比之下由于基于不确定性的AL查询策略与DL的softmax层的输出结合更为方便，因此，基于不确定性的查询策略仍然被广泛使用。

Deep Bayesian Active Learning (DBAL)

正如2.3中的DL与AL相结合的挑战分析所述，基于不确定性的采集功能是许多经典的AL算法一个重要研究方向，而传统的DL方法很少代表这种模型不确定性。

为此，Deep Bayesian Active Learning 出现了。在给定的输入集合和属于类的输出 ,概率神经网络模型可以被定义为。是在参数空间（通常是高斯）上的先验，并且似然 θ ）通常由 θ 给出。我们的目标是获得在上的后验分布：

对于给定的新的数据点 , 通过以下方式进行预测：

DBAL将贝叶斯卷积神经网络同AL方法进行结合，使BALD适应了深度学习环境，从而为高维数据开发了一个新的AL框架。它正是采用上述方法首先对CNN权重将进行了高斯先验建模，然后使用变分推断来获得网络预测的后验分布。

此外，在实践当中，研究人员往往也使用一种功能强大成本低廉的Monte随机正则化技术来获得后验样本，并在真实数据集上有着很好的表现。并且，这种正则化技术已被证明等价于变分推理。

但是，A core-set approach 指出DBAL由于需要批量采样的存在，并不适合大型数据集。需要指出的是，DBAL为了获得更好的置信度估计允许在测试时使用dropout，但在Discriminative Active Learning的分析认为该方法的性能与使用神经网络的softmax分数作为不确定性采样的性能相似。这需要引起警惕。

此外，A指出基于不确定性的DBAL方法可能会受到对抗性示例的愚弄，一个微小的扰动可能会导致不可接受的性能损失。DEBAL认为在变分推断方法中的模式崩溃现象导致了DBAL方法的过度自信的预测。为此，DEBAL通过将集成方法的表达能力与MC-dropout相结合在没有交易代表性的情况下获得更好的不确定性。

另一方面，BatchBALD则选择拓展BALD到批量查询，不再计算单个样本与模型参数之间的互信息，而是重新计算了批量样本与模型参数之间的互信息来共同对批量的样本进行评分。因此BatchBALD可以更为准确的评估共同互信息。

受到有关贝叶斯核心集最新研究的启发，ACS-FW重新构建了批处理结构，以优化对整个数据集引起的对数后验的稀疏子集近似。ACS-FW通过使用这种相似性，同时使用Frank-Wolfe算法大规模启用有效的贝叶斯AL，并且使用随机投影使得ACS-FW得到了进一步的推广。ACS-FW和其他查询策略相比查询的样本在整个数据流行上拥有更好的覆盖。

DPEs则引入了一种可拓展的深度概率集合技术，它使用正则化的集合来逼近深度BNN，并在一系列大规模的视觉AL实验来评估DPEs的分类效果。

ActiveLink也是受到贝叶斯深度学习最新进展的启发。它对现有的神经链接预测因子采取贝叶斯的观点，通过利用知识图的基础结构拓展了不确定性采样的方法，从而实现了一个新颖的深度主动学习方法。并且ActiveLink注意到尽管AL可以采样高效的样本，但在AL的过程中每次迭代都需要从头开始重新训练模型，这对DL模型的训练是不可接受的。

一个直接的解决方案是使用新选择的数据增量地训练模型，或者将它与现有的训练数据 [66]结合起来。但这会导致模型要么偏向少量新选择的数据，要么偏向于过程早期选择的数据。

为了解决这种偏差问题，ActiveLink采用了一种基于元学习的有原则的无偏差增量训练方法。即，在每次AL迭代中，ActiveLink使用新选择的样本更新模型参数，并通过基于前一次迭代中选择的样本对模型进行泛化来逼近模型的未来预测的元目标。这使得ActiveLink可以在新选择的数据和之前选择的数据的重要性之间取得平衡，从而实现对模型参数的无偏估计。

除了上述DBAL工作外，由于BNN较少的参数量以及与传统AL相似的不确定性采样策略，使得DBAL的研究相当的广泛，相关的DBAL工作还有很多。

Density-based Methods

基于密度的方法主要是指从集合（核心集）的角度来考察样本的选择。核心集的构建正是这样一种具有代表性的查询策略。这种想法主要受到核心集数据集压缩思想的启发，试图使用核心集来代表整个原始数据集的特征空间的分布，从而降低AL的标注成本。Farthest First Active Learning (FF-Active) 正是基于这种想法使用表示层上神经激活空间中的最远优先遍历从池中查询连续点。值得一提的是，FF-Active与Exploration-P 类似在AL的早期阶段使用随机查询的方法增强AL的探索能力，从而避免AL陷入batch样本多样性不足的陷阱。

类似的为了解决批量查询中的采样偏差问题，增加批量查询样本的多样性。Core-set approach 尝试采用构建核心子集的方法来解决此问题。并进一步通过解决K中心问题来构建核心子集，使得在已选的核心集上学习的模型与其余数据相比更有竞争力。

但由于Core-set approach需要在未标记的数据集上构建一个较大的距离矩阵，因此这个搜索过程在计算上相当的昂贵。并且这种劣势在大规模的未标记数据集上将变得更加明显。[1]将DAL应用于高维且复杂的掌纹识别数据上。

与核心集的思想类似，将AL视为一个二分类任务，期待标注样本集与未标注样本集拥有相同的数据分布并使得二者难以区分，即试图找到与原始数据集具有相同分布的核心标记子集。

具体来说，由于启发式的生成模型模拟数据分布难以训练且不适合掌纹这种高维复杂的数据。因此作者考虑判断样本是否能被高度肯定的区分来自于未标注数据集还是标注数据集。那些可以被明确区分的样本明显与核心标注子集的数据分布有着显著的差异，这些样本将被的添加到标注数据集中，进行下一轮的训练。

先前的基于核心集的方法往往只是尝试查询的数据点尽可能的覆盖所有点的数据流行而没有考虑密度，导致查询到的数据点过度代表来自流行稀疏区域的样本点。与类似 [1]，Discriminative Active Learning (DAL) 也将主动学习是一个二元分类任务，试图使查询的标记数据集与未标记数据集无法区分。DAL突出的是它可以按照密度成比例的从未标记数据集中进行采样，而不会偏向位于稀疏流行域的样本点。并且DAL提出的方法并不局限于分类任务在概念上易于转移到其他新的任务上。

除了相应的查询策略外，一些研究者也考虑了批量查询大小对查询性能的影响，例如[2] ,[3] , [4], [5]主要研究了较小批量下查询策略的优化，而 [6] 建议扩大AL的查询规模进行大规模采样（一次采样10k或500k）。并通过集成了数百个模型并重用中间检查点方式用较小的计算代价高效的实现了在大规模标记数据集上的训练数据分布式搜索。[6]也证明了使用整个数据集进行训练的性能并不是性能的上限，基于子集的AL可能有更好的性能。

基于密度的方法主要从数据分布的角度来考虑核心子集的选择，相关的研究方法相对较少，它为样本的查询提供了一种新的可能。

Other methods

还有一些研究不像以上查询方法那样如此集中，我们将它们总结在下面。

A将启发式的AL算法重新定义为强化学习问题，通过明确的选择策略来引入一个新的描述。

与先前的大多数基于不确定性的方法不同，DFAL [7] 认为这些方法容易受到对抗性示例的愚弄，因此DFAL将重点放在决策边界附近示例的研究。并主动利用这些对抗性示例在输入空间分布上提供的信息来近似它们到决策边界的距离，这种对抗性查询策略可以有效提高训练CNN的收敛速度。

另一方面，AL旨在利用数据的相对重要性标注尽可能少的的数据高效的训练一个性能符合要求的模型。因此，数据集本身的属性对DAL的性能也有着重要的影响。为此，GA研究了常见数据集中图像数据的相对重要性，提出了一种通用的数据分析工具，可以帮助我们更好的了解数据集中训练示例的多样性。GA发现并非所有的数据集都可以在一个小的子样本集上完成训练，因为一些数据集中的样本重要性的相对差异几乎可以被忽略。因此，在AL中盲目的使用较小的子数据集也是不可取的。

[8]发现与MC-dropout和基于密度的方法相比，基于集合的AL可以在获取过程中有效的抵消数据集中的类别不平衡，导致更多的校准预测不确定性，从而获得更好的性能。

一些研究者也注意到在传统的AL工作流程中往往将获取函数视为固定的已知的先验，而这种获取函数是否合适，只有等标记预算被消耗殆尽才能进行观察。这导致无法对获取函数进行灵活快速的调优。因此使用强化学习对获取函数进行动态调优或许是一个不错的选择。

RAL提出选择将BNN作为获取函数的学习预测器。然后，BNN预测器提供的所有概率信息会被合并从而得到一个全面的概率分布，接着概率分布被送到一个BNN概率策略网络，该网络在每个标记回合中基于oracle的反馈进行强化学习。这种反馈会对采集函数进行微调从而不断改善获取函数的质量。在Fig4中展示了传统AL与RAL的管道对比。

标准的AL，RAL and DRAL的管道对比。

(a)标准的AL管道通常由三个部分组成。Oracle提供一组标记数据，预测器（此处为BNN）用来学习这些数据，并为指南提供了可预测的不确定性，该指南通常是固定的，硬编码的获取函数，它为Oracle挑选下一个样本从而重新开始循环。

(b）RAL用策略BNN代替固定获取函数，该策略BNN以概率状态进行学习，并从oracle获得反馈，以强化学习的方式学习如何选择下一个最优的样本点（红色的新部分）。因此，RAL可以更加灵活地调整获取函数以适应现有的数据集。

(c）DRAL为person Re-ID任务设计了一个深度强化主动学习框架。对于每个查询锚点（探针），代理（增强型主动学习者）将在主动学习过程中从图库池中选择实例交给oracle以获得带有二进制反馈（正/负）的人工注释。状态评估所有实例之间的相似关系，根据oracle的反馈计算奖励从而调整代理的查询。

DRAL采用了类似的想法，为person Re-ID任务设计了一个深度强化主动学习框架。DRAL使用强化学习的思想对获取函数进行动态的调整，从而获得高质量的查询样本。

另一方面，Active-iNAS注意到先前的大多数DAL方法都假定已经为当前的任务设计合适的DL模型，从而主要集中在研究如何设计有效的查询机制上。而事实上已有的DL模型对当前的DAL任务并不一定是最优的。为此Active-iNAS对这一假设发起挑战，在进行主动学习的同时使用神经架构搜索技术（NAS）动态地搜索有效的模型架构。

还有一些工作致力于为DAL提供一个方便性能对比的平台。[9]对DAL方法的鲁棒性和可复现性进行了详细的探讨和研究，并给出了许多有用的建议。

总的来说，这些查询策略并非相互独立，而是相互联系的。基于Batch的BMDAL为AL查询的样本在DL模型上的更新训练提供了基础。尽管DAL中的查询策略丰富且复杂，但它们大都是为了在BMDAL中兼顾查询批次的多样性与不确定性。

而先前基于不确定性的方法往往忽视batch中的多样性，因此，这些方法大致可以被归为两类。它们要么在输入或学习表示空间中设计明确鼓励批次多样性的机制，要么直接测量整个批次的互信息(MI)。

Insufficient Data in DAL

AL往往只需要少量的标记样本数据就可以实现学习和更新模型，而DL需要大量的标记数据才能进行有效的训练。因此，AL与DL的结合需要尽可能多的利用无需耗费过多人力资源的数据策略来实现对DAL 的模型训练。

先前的大多数DAL方法往往只在通过查询策略所采样的标记样本集上进行训练。而忽视了已有的未标记数据集的存在，并且相应的一些数据扩充和训练策略也没有得到充分的利用。这些策略有助于改善在DAL训练中标签数据不足的问题，且不会增加额外的人工标注代价。因此，这些策略的研究也是相当有意义的。

例如，CEAL（2017）除了使用通过查询策略采样的标记数据集外，还通过为具有高的模型预测置信度的样本分配伪标签的方式丰富训练集。使用扩充过的训练集一同训练DL模型。这种策略被展示在Fig.CEAL。

另一种非常流行的策略是在标记数据集和未标记数据集上进行无监督训练并结合其他策略来训练整个网络结构。

例如，WI-DL（2017）注意到对DBN进行完全训练需要大量的训练样本，将DBN应用于AL语境下有限的训练集上是不切实际的。于是为了提高DBN的训练效率，WI-DL采用在所有数据集上进行无监督特征学习与在标记数据集上进行有监督微调相结合的方式来训练DBN。

与此同时，也有研究者考虑借助生成对抗网络（GAN）来进行数据增强。例如，GAAL（2017）首次将生成对抗网络（GAN）引入到了AL的查询方法中。GAAL旨在希望使用生成学习生成比原始数据集中拥有更多信息量的样本。

然而，随意的数据增强并不能保证生成的样本比原始数据拥有更多的信息量，这反而会浪费计算资源。因此，BGADL（2019）拓展了GAAL的想法，提出了一种贝叶斯生成式主动深度学习的方法。

具体的，BGADL结合了Generative Adversarial Active Learning [10]，Bayesian data augmentation (Tran et al., 2017)[11], auxiliary-classifier generative adversarial networks (ACGAN) (Odena et al., 2017)[12] and variational autoencoder (VAE) (Kingma & Welling, 2013)[13]方法，旨在生成属于不同类别的分歧区域样本。GAAL与BGADL的结构对比被展示在fig.GAAL_BGADL。

GAAL与BGADL的结构对比图。更多细节可以查看BGADL。

随后，VAAL（2019），ARAL（2019）借鉴了先前的方法不仅使用标记数据集与未标记数据集一同训练网络，而且将生成对抗学习引入到了网络架构中进行数据增强，以便进一步的提升网络的学习能力。

VAAL与TA-VAAL的结构对比图。

VAAL，ARAL和TA-VAAL的结构对比。

1）VAAL使用标记数据和未标记数据采用半监督的方式来学习数据的潜在的表示空间，根据潜在空间选择信息量最大的未标记数据进行标注。

2）TA-VAAL拓展了VAAL，将损失预测模块和RankCGAN整合到变分对抗主动学习（VAAL）中，以便同时考虑数据分布和模型不确定性。

3）ARAL也拓展了VAAL，ARAL不仅使用了真实数据集（由标注数据集和未标注数据集组成）和还使用了生成数据集来共同训练网络。整个网络由编码器、生成器、鉴别器、分类器和采样器构成，模型的所有部分被共同训练。更多的细节可以查看ARAL。

具体的，VAAL注意到基于不确定性的batch查询策略除了容易导致样本多样性不足的问题，实际上还非常容易受到异常值的干扰。此外，对于高维数据基于密度的方法容易受到p-范数的限制，导致计算的距离过于集中。

为此，VAAL提出使用对抗学习表示的方法来区分标记数据与未标记数据的潜在空间的编码特征，从而削弱异常值的干扰。并且VAAL使用标记数据和未标记数据以半监督的方式来共同训练 variational autoencoder (VAE) 试图欺骗对抗网络预测所有的数据点均来自标记池，以此来解决距离集中的问题。VAAL在大规模的数据集上可以学习有效的低维潜在表示，并通过共同学习表示形式和不确定性提供了一种有效的主动学习采样方法。

接着，ARAL拓展了VAAL，旨在使用尽可能少的人工标注样本但充分利用已有的或生成的数据信息来提升模型的学习能力。除了使用标记数据集与未标记数据集，ARAL还使用了深度生产网络生产的样本来共同训练整个模型。

ARAL由VAAL与对抗表示学习两部分组成，通过VAAL学习标记和未标记数据潜在的特征表示空间，并据此选择信息量最大的未标记样本，同时使用真实数据与生成数据通过对抗表示学习来增强模型的学习能力。类似的TA-VAAL也拓展了VAAL，TA-VAAL将来自VAAL的全局数据结构和来自学习损失的局部任务相关信息用于样本的查询。我们将ARAL，VAAL和TA-VAAL的框架展示在Fig6.

与ARAL和VAAL利用标记数据集与未标记数据集进行对抗表示学习不同，SSAL尝试了一种新的训练方式。SSAL跨AL周期的使用无监督、监督和半监督学习的方式，在尽可能不增加标注成本的情况下充分利用已有的信息进行训练。

具体来说，在主动学习开始前，首先利用标记数据和未标记数据进行无监督预训练，在每个AL学习周期首先在标记数据集上进行监督训练，然后在所有数据集上进行半监督训练。这在训练方法上是一种新的尝试，并且作者发现与采样策略之间的差异相比，这种模型训练方式在性能提升上有着令人惊讶的提升。

正如上面说分析的那样，这种在训练方式和数据利用技巧上的探索也是非常有必要的，它在性能上的增益甚至可能超过改变查询策略所代来的性能增益。这实际上是在不增加标注代价的情况下对已有数据信息的充分利用，有助于缓解AL查询样本数量不足以支撑DL模型更新的问题。

通用框架DAL

如2.3中所述的，由于AL和DL在处理管道上的不一致，仅在AL框架中对DL模型进行微调或者简单的组合AL与DL将它们视为两个分割独立的问题可能会引起分歧。例如，A 首先将DL模型在两个不同类型的会话数据集上进行离线的监督训练以使骨干网络拥有基本的对话能力，然后启用在线AL阶段与人类用户进行互动，根据用户的反馈来以一种开放式的方法来改进模型。

AL-DL为有DBNs的DL模型提出了一个主动标记方法。ADN为情感分类提出了一种主动深度网络架构。[65]为CAPTCHA的识别提出了一种使用CNN进行的主动学习算法。

然而，上述方法往往首先在标记数据集上对深度模型进行常规的监督训练，然后基于深度模型的输出进行主动采样。类似的相关工作还有很多，这种将AL和深度模型的训练视为两个独立问题的割裂化处理方式增加了两个问题产生分歧的可能。尽管这种方法在当时也取得了一定的成功，但一个将DL和AL两个任务紧密结合的通用框架对DAL的性能提升与推广都有着至关重要的作用。

CEAL将来自未标注数据集中的样本逐步送入到初始化后的CNN，由CNN分类器输出两种类别的样本：少量不确定性的样本和大量高预测置信度样本。通过orcal为少量不确定性样本进行标注，同时使用CNN分类器为大量的高预测置信度样本自动分配伪标签。然后，使用这两种类型的样本对CNN进行微调，并重复这个更新过程。

[14]是第一个结合AL与DL解决深度图像分类问题的工作之一。CEAL将深度卷积神经网络合并到AL中，提出了一个新颖的DAL框架。它通过将来自未标注数据集中的样本逐步送入CNN，由CNN分类器输出两种类别的样本：少量不确定性的样本和大量高预测置信度样本。通过orcal为少量不确定性样本进行标注，同时使用CNN分类器为大量的高预测置信度样本自动分配伪标签。

然后，使用这两种类型的样本对CNN进行微调，并重复这个更新过程。在Fig2中，我们展示了CEAL的总体框架图。类似的，HDAL也采用了类似的框架用于人脸识别任务中，它将AL与深度CNN模型进行结合从而一体化的同时考虑特征学习和AL查询模型的训练。

此外，Fig1(c)中展示了一个非常常见的DAL任务的通用框架，相关的工作包括[15], [1]，[16],[17], [18]等。具体的来讲，[19]提出使用全卷积网络和AL进行结合的框架来解决使用少量标注进行医学图像分割的问题。

它首先将FCN在少量的标注数据集上进行训练，然后将未标注数据集中的样本通过FCN进行特征提取，并使用这些特征来对未标注样本进行不确定性和相似度估计。这种类似于2.1.2中的策略有助于选择具有高度不确定性和多样化的样本被添加到标注数据集中，从而开始下一阶段的训练。

[1]为掌纹识别任务提出了一个类似的DAL框架。不同的是，受到域适应的启发，[1]将AL视为一个二分类任务，期待标注样本集与未标注样本集拥有相同的数据分布并使得二者难以区分，这样就可以直接在少量的标注数据集上进行监督训练了，从而减轻标注负担。

[18]为缺陷检测提出了一个DAL框架。它根据检测模型输出的特征进行不确定性抽样以产生用于注释的候选样本列表。为了进一步兼顾采样样本中缺陷类别的多样性，[18]设计了平均边距的方法来控制每个缺陷类别的采样比例。以采样训练和选择样本的迭代模式来有效的训练检测模型。

不同于以上方法往往只利用DL模型的最后输出的作为样本不确定性或多样性的判别依据( [1]使用了第一个全连接层的输出 ),[16],[20],[17]他们还使用了DL模型的中间隐藏层的输出。正如Section 3.1.3和Section 2.3中所分析的那样，由于深度模型与浅层模型之间学习范式的差异导致了传统的基于不确定性的查询策略无法直接应用于DL模型。

此外，与浅层模型不同，深层模型可以被视为由特征提取阶段与任务学习阶段两部分组成。而仅仅使用DL模型最后一层的输出作为样本预测不确定性的评估依据是不准确的。因为DL模型的不确定性实际上是由特征提取和任务学习两个阶段的不确定性共同组成。这种思想的示意图被展示在Fig.4。

以常见的CNN为例，展示了传统不确定性测量方法与综合两个阶段（即，特征提取阶段与任务学习阶段）信息的不确定性测量方法的对比。

为此，AL-MV [16]将来自CNN中间不同隐藏层的特征视为多视图数据，同时考虑两个阶段的不确定性，并设计了AL-MV算法来实现对各层的不确定性进行自适应加权，从而更加准确的测量样本的不确定性。

LLAL也是用了类似的想法，LLAF设计了一个损耗预测模块的小型参数模块附加到目标网络，使用目标网络的多个隐藏层的输出作为损耗预测模块的输入。通过学习损耗预测模块来预测未标记数据集的目标损耗，并以top-k的策略选择查询样本。LLAL以较小的参数代价实现了与任务无关的AL框架设计，并在多种主流的视觉任务（即，图像分类、目标检测和人体姿态估计）上都取得了有竞争力的性能表现。

类似的[17]采用了相似的策略实现了一个手指骨骼分割任务的DAL框架。[17]将Deeply Supervised U-Net作为分割网络，然后将多级分割隐藏层的输出以及最后一层的输出作为AL的输入，综合这些输入信息作为样本信息量大小的评估依据。我们以LLAL为例在Fig6中展示这种想法的总体网络结构。

LLAL的总体框架图。黑色的线表示训练模型参数的阶段，优化由目标损失和损失预测损失构成的总体损失。红色的线表示AL的样本查询阶段。将DL模型的多个隐藏层的输出作为loss预测模块的输入，根据预测损失挑选top-K个未标记数据点通过oracle赋予标签。

通用框架的研究对DAL的发展和推广是非常有益处的，这种任务无关的框架可以更加方便的被移植到其他领域。当前的DL与AL之间融合还主要集中在DL主要负责特征提取，AL主要负责样本查询，因此更加深度紧密的融合有助于DAL取得更加优异的性能，当然这还需要研究人员更多的探索和努力。

DAL 的各种应用

如今，DAL已经被应用包括但不限于视觉数据处理（例如目标检测，语义分割等），NLP（例如情感分析，问答等），语音和音频处理，社交网络分析，医学图像处理，野生动物保护，工业机器人和灾害分析等领域。本节我们从应用的角度对DAL的相关工作进行一个系统详尽的概述。

Visual Data Processing

如同DL在计算机视觉领域被广泛应用一样，DAL的提出第一个被期待发挥潜力的领域就是计算机视觉。本节我们主要讨论DAL在视觉数据处理领域的研究。

图像分类与识别

与DL的研究类似，在DAL中图像的分类与识别是其他视觉任务研究的一个基础。如何在传统AL并不擅长的高维数据上高效的查询样本，并在尽可能小的标注代价下获得满足要求的性能是DAL在图像视觉任务领域所面临的一个重要的问题。

为了解决这个问题，CEAL为具有高置信度的样本分配伪标签，并将其添加到使用基于不确定性的AL方法查询到的高度不确定性的样本集中，使用扩充后的训练集一起训练DAL模型图像分类器。

[21]首次将AL的准则集成到深度信念网络中，并对各种单模态和多模态的真实数据集上的分类任务进行了广泛的研究。

WI-DL使用DAL的方法在高光谱图像（HSI）数据集上同时考虑最大化代表性和不确定性两个选择标准来进行遥感分类。

类似的[22],[23]也研究了高光谱图像的分类问题。[22]引入AL来初始化HSI，稍后进行转移学习，同时建议对源和目标HSI数据构造和连接更高级别的特征来进一步克服跨域差异问题。[23]提出了一个统一的深度网络并结合主动转移学习，仅使用了较少的标签训练数据对HSI分类进行了良好的训练。

此外，医学图像分析也是一类重要的应用。例如，[24]探索使用AL代替随机学习来训练卷积神经网络进行组织分类任务。[25]在医学图像分析领域对相关的DAL方法进行了全面的回顾。

出于相似的原因，由于医学图像的标注需要很强的专业性知识，而训练有素的专家的时间通常很昂贵且非常的稀缺。此外，DL已经在各种图像特征任务上取得了令人印象深刻的表现，因此，集中于结合DL与AL将DAL应用于医学图像分析领域的工作仍然还有很多。

DAL方法也被用来进行浮游生物的分类任务[26]，细胞的自动计数[27]。

除此之外，DAL在我们的日常的生活场景中也有着广泛的应用。例如，[28]提出了一种使用CNN进行验证码识别的AL算法。它可以利用免费获取标记数据的能力，来避免人为干预，在使用较少标记数据的情况化极大的提升识别精度。[29]结合深度卷积神经网络优秀的特征提取能力与AL标记代价的节约为人脸识别任务设计了一个启发式的深度主动学习框架。

Object Detection and Semantic Segmentation

目标检测和语义分割在自动驾驶、医学图像处理、野生动物保护等各个领域都有着重要的应用价值。然而，这些领域都同样受限于较高的样本标注代价，DAL较小的标注代价有望加速相应DL模型的在一些标注较为困难现实领域的应用。

例如，[30]为目标检测设计了一个DAL框架，它将目标检测中使用的分层架构作为“委员会查询”的范例来选择要查询的图像集，同时引入了与A类似的勘探/开采权衡策略。

DAL也被广泛应用于自然生物领域和工业应用中，例如，

[31]利用深度神经网络来快速，可转移，自动地提取信息，同时结合转移学习和AL为相机陷阱图像中的物种识别和计数设计了一个DAL框架。

[32]为自动驾驶的深层对象检测提出了一个DAL框架来训练LiDAR 3D目标检测器。

[33]使用无人机（UAV）获取图像进行野生动物的检测。为了能到够重复使用这种动物检测器，[33]使用AL并引入转移抽样（TS）来找到源和目标数据集之间的对应区域，以便实现向目标域数据的转移。

[18]为真实工业的缺陷检测提出了一个非常常见的DAL框架，并提出了一种不确定性抽样的方法来生成候选标注类别。它使用平均裕度法来设置每个缺陷类别的抽样尺度，在使用较少标注数据的情况下就能获得了所需的性能。

此外，DAL在医学图像分割上也有着重要的应用。例如，

[34]为医学图像分割提出了一种基于AL的转移学习机制，使得该方法可以在有限的标记数据集上有效的提高图像的分割性能。

[19]将完全卷积网络（FCN）与AL相结合为生物图像分割提出了一种DAL框架。它利用FCN提供的不确定性和相似性信息给出了最大集合覆盖问题的一个拓展，通过指出最有效的标注区域来显著减少标注工作量。

DASL [39]为肺结节分割任务提出了基于深层区域的网络结节R-CNN来为实例生成分割掩码，同时结合AL和自定步长学习（SPL）提出了一种新的深度主动自定步长(DASL)策略来减少标注工作量。

[36]为三维胸部CT图像中的肺结节检测与分割提出了一个基于区域的网络Nodule-plus Region-based CNN。Nodule-plus Region-based CNN将AL和自定进度学习（SPL）策略相结合，提出了一种新的深度自定步长主动学习（DSAL）策略从而减小了注释工作量且有效的利用了未标注数据。

[17]为手指骨骼分割任务提出了一种新的深度监督主动学习方法，该方法可以以一种迭代和增量学习的方式进行微调，并且使用了中间隐藏层的输出作为AL样本挑选的依据。与完整的额标注相比，[17]仅使用了较少的样本就获得了与之相当的分割结果。

Video processing

相对于图像，视频任务除了要处理空间特征，还需要处理时间特征，因此视频任务的标注工作代价更昂贵，引入AL的期待也更为迫切。DAL在该领域也有着更加广阔的应用场景。

例如，[37]提出使用模仿学习的方法执行导航任务。教师在第一人称视角下的可视化环境和所采取的动作被作为训练集。通过训练，希望学生能够根据所处的环境预测执行相应的动作。当执行任务时，学生使用深度卷积神经网络进行特征提取，学习模仿策略，并使用AL的方法选择信心不足的样本添加到训练集中，来更新行动策略。[37]使用了较少的样本显著改善了初始策略。

[38]提出了一种DAL的活动识别模型，DeActive与用于活动识别的传统DL模型相比需要更少的标注样本，消耗更少的资源，且具有高的识别精度。

[35]通过将AL集成到DL框架中来最大限度的降低基于视频的person-Re-ID数据集的标注代价。类似的，[40]为person Re-ID任务提出一种深度强化主动学习方法，以过oracle的反馈来指导代理（强化学习过程中的模型）进行下一步的不确定性样本的选择，通过交替细化的强化学习策略来不断优化代理的选择机制。

[41]为视频和静态图像的行人目标检测提出了一种基于卷积神经网络的主动检测目标检测器的方法。

Natural Language Processing

NLP一直以来都是一个非常具有挑战性的任务。NLP旨在使计算机理解复杂的人类语言，帮助人类处理各种与自然语言相关的任务。数据标签不足也是NLP任务所面临的一个关键性的挑战。下面我们介绍一些NLP领域最著名的DAL方法。

Sentiment Analysis


Active Deep Networks for Semi-Supervised Sentiment Classification	2015

它是NLP中的一个典型任务，旨在使得计算机理解一段自然语言描述，并对其中的涵义信息进行提取分析。

相关的应用场景非常的丰富，包括但不限于情感分类、新闻鉴别、命名实体识别（NER）等。

更为具体的，例如，[42]使用Restricted Boltzmann Machines (RBM) 构造了一个主动深度网络（ADN），并在标记数据集与无标记数据集上进行无监督训练。ADN使用大量的未标记数据集提升模型的泛化能力，并在半监督学习框架中使用AL，将标记数据的选择与分类器统一在了一个半监督分类框架中，在情感分类任务上获得了有竞争力的结果。

[43]在只有有限数量的注释样本的情况下为新闻准确性检测任务（即识别新闻中的误导和虚假信息）提出了一个人机协同学习系统。该系统是基于AL的深度模型，使用了比完全监督学习少1-2个数量级的注释样本，大大加快了模型的收敛速度，且在检测性能上实现了惊人的25%的平均性能增益。

[44] [45]使用DL与AL进行结合研究了在较小训练集的情况下如何提高命名实体识别(NER)的技术水平。

[46]使用来自受灾地区的相关推文来提取信息以便进行地震期间基础设施损坏的识别，为此，[46]将基于RNN和GRU的模型与AL相结合，使用基于AL的方法预训练模型来检索来自不同地区基础设施损坏的推文，从而显著减少手动标注的工作量。

实体解析（ER）是跨数据库识别具有不同表示形式相同真实实体的任务，是知识库创建和文本挖掘的关键步骤。[47]为ER开发了一个基于DL的方法，它结合了转移学习和AL设计了一个体系结构，它允许学习一个从高资源环境到低资源环境的可移植模型。

数据集

问答、摘要

问答系统、自动摘要也是NLP中常见的处理任务。DL已经在这些领域取得了令人印象深刻的结果。然而，这些应用的性能仍然依赖于海量的标记数据集，AL有望为这个挑战带来新的希望。

自动问答系统在工业界有着非常广泛的应用，DAL在该领域也有着重要的研究价值。例如，[48]使用在线的AL策略结合DL模型，通过与真实用户进行交互，在每一轮对话中以一种增量的方式从用户的反馈中进行学习来实现开放式的对话。

[49]发现为特定任务（例如，分类）设计的AL策略往往只有一个正确答案，这些基于不确定性的测量往往根据模型的输出计算。而许多现实世界的视觉任务往往有多个正确答案，导致不确定性测量被高估，有时的表现甚至比随机抽样基线更差。为此，[49]在可视化问题答案生成（VQA）中提出估计模型内部隐含空间中的不确定性，而不是模型输出空间中的不确定性，从而克服了语言的释义性质。

自动摘要旨在从大文本中提取有用的最为重要的信息。[50]为识别大型脑电波图（EEG）报告中的概念和关系提出了一种新颖的主动学习策略神经网络（ALPNN），可以帮助人类从大量的EEG报告中提取可用的临床知识。

在语音和音频领域的标签注释成本也相对较高。[51]发现在由少量演讲者收集的数千个录音所构成的语料库上训练的模型无法推广到新的域。因此[51]研究了利用AL在标记资源有限的情况下训练深度神经网络进行语音情感识别任务实用方案。

其他应用

深度主动学习的出现是令人兴奋的，有望在保持性能的情况下，成数量级的减少标注代价。为此，DAL也被广泛的应用于其他领域。

这些应用包括但不限于基因表达、机器人、可穿戴设备数据分析、社交网络和心电信号分析等。

更为具体的，例如，MLFS [52]将DL和AL进行结合为基于表达谱的选择基因/miRNA提出了一个新颖的多层次特征选择方法。MLFS还考虑了miRNA与基因之间的生物学关系，将该方法应用于miRNA的拓展任务上。

真实世界的机器人的故障风险是昂贵的。为此，[53]提出了一种风险感知重采样技术。将AL与现有的求解器和DL一起使用来对机器人的运行轨迹进行优化以便有效应对移动障碍物场景下的碰撞问题，并在真正的纳米四轴飞行器上验证了该DAL方法的有效性。

[54]为机器人控制算法逆动力学模型提出了一个主动轨迹生成框架，这允许[54]系统地设计用于训练DNN逆动力学模块的信息轨迹。

[55] [56]利用可穿戴设备或移动终端上的传感器来收集用户的运动信息，来进行人类活动识别。[55]提出了一种有上下文感知注释器选择的活动识别DAL框架。ActiveHARNet [57]提出了一种资源高效的深度集成模型ActiveHARNet，它支持设备上的增量学习和推理，使用BNN中的近似来表示模型的不确定性能力，并在两个公开数据集上证明了ActiveHARNet部署和增量学习的可行性。

[58]为社交网络中的锚点用户预测设计一个DAL框架来减少锚点用户的标注成本，同时提高预测准确性。

DAL也被应用于心电信号的分类。例如，[59]提出了一种基于深度学习的心电信号主动分类方法。[60]提出了一种使用特征值和DL基于AL的ECG分类方法。通过使用AL方法来有效的减少医学专家标记ECG信号的代价。

总的来说，DAL目前的应用主要集中在视觉图像处理任务中，对NLP和其他领域也有着相对零散的应用。和DL与AL相比，DAL目前仍然处于研究的初级阶段，相应经典作品还相对较少，但仍然有着和DL一样广阔的应用场景和实用价值。

讨论与未来方向

DAL结合了DL和AL的共同优势，不仅继承了DL善于处理高维图像数据和自动特征提取的能力，而且继承了AL有效降低标注代价的潜力。因此，DAL尤其是在标签需要很高专业知识难以获得领域有着令人着迷的潜力。

最近的大多数工作显示DAL已经在许多常见的任务上获得了成功。DAL凭借降低标注代价以及继承DL强大的特征提取能力引了大量研究人员的兴趣，正如[61]所发现的那样，在不同的研究中关于随机采样基线（RSB）的报告结果有着很大不同。

例如，在相同设置下，使用CIFAR 10的20%的标签数据，[20]所报告的RSB性能比[62]高13%。其次，同一DAL方法在不同的研究中报告的结果可能有所不同。例如，使用CIFAR 100的40%的标签数据和VGG16作为提取网络，[63]和[64]的报告结果相差8%。

此外，最新的DAL研究也存在彼此不一致的情况。例如，[63]和 [7]指出基于多样性的方法一直优于基于不确定性的方法，而基于不确定性的方法比RSB更差。但是，[20]的最新研究表明并非如此。

与AL有策略的选择高价值的样本相比，RSB已经被是一个强有力的基线。以上问题说明，我们首先急需为DAL的工作设计一个通用的性能评估平台，并确定一个统一的高性能的RSB。

其次，不同的DAL的方法的可复现性也是一个重要的问题，高度可复现的DAL方法有助于对不同DAL进行性能评估，应在一致的设置下使用通用的评估平台进行实验，并共享实验设置快照。

别外，相同实验条件下的不同初始化的多次重复性实验是被要求的，这可以有效避免因实验设置问题所引起的误导性结论。那些互相不一致的研究需要引起研究人员足够的重视，以便弄清其中原理。另一方面，充足的消融实验和转移实验也是必须的，前者可以让我们更容易看清是哪些改进带来了性能增益，后者可以确保我们的AL选择策略的确可以对数据集无差别的选择高质量样本。

目前的DAL方法的研究方向主要集中在AL选择策略的改进，训练方法的优化以及任务无关的模型改进。

正如Section2所分析的那样，AL选择策略的改进目前主要集中在以显式或者隐式的方式将基于不确定性和多样性的查询策略考虑在内。并且混合型的选择策略越来越受到研究人员的青睐。

训练方法的优化主要集中在对未标记数据集，标记数据集或者使用GAN等方法扩充数据，然后跨AL周期的进行无监督学习、半监督学习、监督学习的混合型训练方法。这种训练方法甚至表现出比选择策略改进更有前途的性能提升，实际上这弥补了DL模型需要大量标注训练样本而AL选择标注样本的数量有限的问题.此外，对无标记数据集或者生成数据集的使用也有利于充分利用已有的信息，而并不增加额外的标注代价。

此外，增量训练的方式也是一个重要的研究方向，在每次循环中从头开始训练深度模型在计算资源上是不可接受的。而简单的增量训练又会导致模型参数的偏差问题，但是在资源节省上的巨大诱惑是相当吸引人的。然而，相关的研究仍然是相当匮乏的，但这仍然是一个非常有前景的研究方向。

任务无关也是一个重要的研究方向，这有助于使得DAL的模型可以更加直接广泛的被推广到其他任务。然而相关的研究还是不足的，并且相应的DAL方法往往只关注了基于不确定性的选择方法。由于DL自身更加容易与基于不确定性的AL选择策略相融合，因此我们相信在与任务无关的研究方向上未来基于不确定性的方法还将继续占据主导地位。另一方面，明确显式的将基于多样性的选择策略考虑在内或许也是一个不错的选择，当然，这也面临着很大的挑战。

此外，需要指出的是一味的追求在更小的子集上训练模型的想法是不可取的，因为在一些内容丰富类别多样拥有海量样本的数据集中样本重要性的相对差异几乎可以被忽略。

显然上述的这些改进方向之间并不冲突，因此一种混合的改进策略是未来一个重要的发展方向。

总的来说，DAL的研究在标注代价和应用场景上都有着巨大的实际应用价值，但当前的DAL的研究仍然处于初级阶段，未来还有很长一段路要走。

Performance Comparison

在本节，我们将对DAL相关算法的性能做一个全面系统的评估与讨论。

[Deep Active Learning: Unified and Principled Method for Query and Training](Deep Active Learning Unified and Principled Method for Query and Training.pdf)

image-20200724165053807

[Rethinking deep active learning: Using unlabeled data at model training](Rethinking deep active learning.pdf)

[Training Data Distribution Search with Ensemble Active Learning](Training Data Distribution Search with.pdf)

[TOWARDS BETTER UNCERTAINTY SAMPLING: ACTIVE LEARNING WITH MULTIPLE](TOWARDS BETTER UNCERTAINTY SAMPLING.pdf)

[Bayesian Generative Active Deep Learning](Bayesian Generative Active Deep Learning.pdf)

参考文献：

[1]Xuefeng Du, Dexing Zhong, and Huikai Shao. 2019. Building an Active Palmprint Recognition System. In 2019 IEEE International Conference on Image Processing, ICIP 2019, Taipei, Taiwan, September 22-25, 2019. 1685–1689.

[2] Andreas Kirsch, Joost Van Amersfoort, and Yarin Gal. 2019. BatchBALD: Efficient and Diverse Batch Acquisition for Deep Bayesian Active Learning. arXiv: Learning (2019).

[3] Fedor Zhdanov. 2019. Diverse mini-batch Active Learning. arXiv: Learning (2019)

[4] Jordan T Ash, Chicheng Zhang, Akshay Krishnamurthy, John Langford, and Alekh Agarwal. 2019. Deep Batch Active Learning by Diverse, Uncertain Gradient Lower Bounds. arXiv: Learning (2019).

[5] Robert Pinsler, Jonathan Gordon, Eric Nalisnick, and Jose Miguel Hernandezlobato. 2019. Bayesian Batch Active Learning as Sparse Subset Approximation. (2019), 6356–6367.

[6] Kashyap Chitta, Jose M Alvarez, Elmar Haussmann, and Clement Farabet. 2019. Training Data Distribution Search with Ensemble Active Learning. arXiv: Learning (2019).

[7] Melanie Ducoffe and Frederic Precioso. 2018. Adversarial Active Learning for Deep Networks: a Margin Based Approach. arXiv: Learning (2018)

[8] William H Beluch, Tim Genewein, Andreas Nurnberger, and Jan M Kohler. 2018. The Power of Ensembles for Active Learning in Image Classification. (2018), 9368–9377.

[9] Prateek Munjal, Nasir Hayat, Munawar Hayat, Jamshid Sourati, and Shadab Khan. 2020. Towards Robust and Reproducible Active Learning Using Neural Networks. arXiv: Learning (2020).

[10] Jiajie Zhu and Jose Bento. 2017. Generative Adversarial Active Learning. arXiv: Learning (2017).

[11] Toan Tran, Trung Pham, Gustavo Carneiro, Lyle J Palmer, and Ian Reid. 2017. A Bayesian data augmentation approach for learning deep models. (2017), 2797–2806.

[12] Augustus Odena, Christopher Olah, and Jonathon Shlens. 2017. Conditional Image Synthesis With Auxiliary Classifier GANs. (2017), 2642–2651.

[13] Diederik P Kingma and Max Welling. 2013. Auto-Encoding Variational Bayes. arXiv: Machine Learning (2013)

[14] K. Wang, D. Zhang, Y. Li, R. Zhang, and L. Lin. 2017. Cost-Effective Active Learning for Deep Image Classification.IEEE Transactions on Circuits and Systems for Video Technology 27, 12 (2017), 2591–2600.

[15] Lin Yang, Yizhe Zhang, Jianxu Chen, Siyuan Zhang, and Danny Z Chen. 2017. Suggestive Annotation: A Deep Active Learning Framework for Biomedical Image Segmentation. (2017), 399–407

[16] Tao He, Xiaoming Jin, Guiguang Ding, Lan Yi, and Chenggang Yan. 2019. Towards Better Uncertainty Sampling: Active Learning with Multiple Views for Deep Convolutional Neural Network. (2019), 1360–1365.

[17] Ziyuan Zhao, Xiaoyan Yang, Bharadwaj Veeravalli, and Zeng Zeng. 2020. Deeply Supervised Active Learning for Finger Bones Segmentation. arxiv (2020).

[18] Xiaoming Lv, Fajie Duan, Jiajia Jiang, Xiao Fu, and Lin Gan. 2020. Deep Active Learning for Surface Defect Detection. Sensors 20, 6 (2020), 1650.

[19] Lin Yang, Yizhe Zhang, Jianxu Chen, Siyuan Zhang, and Danny Z Chen. 2017. Suggestive Annotation: A Deep Active Learning Framework for Biomedical Image Segmentation. (2017), 399–407.

[20] Donggeun Yoo and In So Kweon. 2019. Learning Loss for Active Learning. (2019), 93–102.

[21] Hiranmayi Ranganathan, Hemanth Venkateswara, Shayok Chakraborty, and Sethuraman Panchanathan. 2017. Deep active learning for image classification. (2017), 3934–3938.

[22] Menglin Wang, Baisheng Lai, Zhongming Jin, Xiaojin Gong, Jianqiang Huang, and Xiansheng Hua. 2018. Deep Active Learning for Video-based Person Re-identification. arXiv: Computer Vision and Pattern Recognition (2018)

[23] Cheng Deng, Yumeng Xue, Xianglong Liu, Chao Li, and Dacheng Tao. 2019. Active Transfer Learning Network: A Unified Deep Joint SpectralâĂŞSpatial Feature Learning Model for Hyperspectral Image Classification. IEEE

Transactions on Geoscience and Remote Sensing 57, 3 (2019), 1741–1754.

[24] Jonathan Folmsbee, Xulei Liu, Margaret Brandwein-Weber, and Scott Doyle. 2018. Active deep learning: Improved training efficiency of convolutional neural networks for tissue classification in oral cavity cancer. In 2018 IEEE 15th

International Symposium on Biomedical Imaging (ISBI 2018). IEEE, 770–773.

[25] Samuel Budd, Emma C Robinson, and Bernhard Kainz. 2019. A Survey on Active Learning and Human-in-the-Loop Deep Learning for Medical Image Analysis. arXiv: Learning (2019).

[26] Erik Bochinski, Ghassen Bacha, Volker Eiselein, Tim J W Walles, Jens C Nejstgaard, and Thomas Sikora. 2018. Deep Active Learning for In Situ Plankton Classification. (2018), 5–15.

[27] Saeed S Alahmari, Dmitry B Goldgof, Lawrence O Hall, and Peter R Mouton. 2019. Automatic Cell Counting using Active Deep Learning and Unbiased Stereology. (2019), 1708–1713

[28] Fabian Stark, Caner Hazırbas, Rudolph Triebel, and Daniel Cremers. 2015. Captcha recognition with active deep learning. In Workshop new challenges in neural computation, Vol. 2015. Citeseer, 94.

[29] Ya Li, Keze Wang, Lin Nie, and Qing Wang. 2017. Face Recognition via Heuristic Deep Active Learning. (2017),97–107.

[30] Soumya Roy, Asim Unmesh, and Vinay P Namboodiri. 2018. Deep active learning for object detection. (2018), 91

[31] Mohammad Sadegh Norouzzadeh, Daniel D Morris, Sara Beery, Neel Joshi, Nebojsa Jojic, and Jeff Clune. 2019. A deep active learning system for species identification and counting in camera trap images. arXiv: Learning (2019).

[32] Di Feng, Xiao Wei, Lars Rosenbaum, Atsuto Maki, and Klaus Dietmayer. 2019. Deep Active Learning for Efficient Training of a LiDAR 3D Object Detector. (2019).

[33] Benjamin Kellenberger, Diego Marcos, Sylvain Lobry, and Devis Tuia. 2019. Half a Percent of Labels is Enough: Efficient Animal Detection in UAV Imagery Using Deep CNNs and Active Learning. IEEE Transactions on Geoscience

and Remote Sensing 57, 12 (2019), 9524–9533.

[34] Utkarsh Gaur, Matthew J Kourakis, Erin Newmansmith, William C Smith, and B S Manjunath. 2016. Membrane segmentation via active learning with deep networks. (2016), 1943–1947.

[35] Menglin Wang, Baisheng Lai, Zhongming Jin, Xiaojin Gong, Jianqiang Huang, and Xiansheng Hua. 2018. Deep Active Learning for Video-based Person Re-identification. arXiv: Computer Vision and Pattern Recognition (2018).

[36] Wenzhe Wang, Ruiwei Feng, Jintai Chen, Yifei Lu, Tingting Chen, Hongyun Yu, Danny Z Chen, and Jian Wu. 2019. Nodule-Plus R-CNN and Deep Self-Paced Active Learning for 3D Instance Segmentation of Pulmonary Nodules. IEEE Access 7 (2019), 128796–128805.

[37] Ahmed Hussein, Mohamed Medhat Gaber, and Eyad Elyan. 2016. Deep Active Learning for Autonomous Navigation. (2016), 3–17.

[38] HM Sajjad Hossain, MD Abdullah Al Haiz Khan, and Nirmalya Roy. 2018. DeActive: scaling activity recognition with active deep learning. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies 2, 2 (2018),

1–23.

[39] Wenzhe Wang, Yifei Lu, Bian Wu, Tingting Chen, Danny Z Chen, and Jian Wu. 2018. Deep Active Self-paced Learning for Accurate Pulmonary Nodule Segmentation. (2018), 723–731.

[40] Zimo Liu, Jingya Wang, Shaogang Gong, Huchuan Lu, and Dacheng Tao. 2019. Deep Reinforcement Active Learning for Human-in-the-Loop Person Re-Identification. (2019), 6122–6131

[41] Hamed H Aghdam, Abel Gonzalez-Garcia, Joost van de Weijer, and Antonio M López. 2019. Active learning for deep detection neural networks. In Proceedings of the IEEE International Conference on Computer Vision. 3672–3680.

[42] Shusen Zhou, Qingcai Chen, and Xiaolong Wang. 2010. Active Deep Networks for Semi-Supervised Sentiment Classification. (2010), 1515–1523.

[43] Sreyasee Das Bhattacharjee, Ashit Talukder, and Bala Venkatram Balantrapu. 2017. Active learning based news veracity detection with feature weighting and deep-shallow fusion. (2017), 556–565.

[44] Yanyao Shen, Hyokun Yun, Zachary C Lipton, Yakov Kronrod, and Animashree Anandkumar. 2017. Deep Active Learning for Named Entity Recognition. arXiv: Computation and Language (2017).

[45] Matthew Shardlow, Meizhi Ju, Maolin Li, Christian OâĂŹReilly, Elisabetta Iavarone, John McNaught, and SophiaAnaniadou. 2019. A text mining pipeline using active and deep learning aimed at curating information in computational

neuroscience. Neuroinformatics 17, 3 (2019), 391–406.

[46] Shalini Priya, Saharsh Singh, Sourav Kumar Dandapat, Kripabandhu Ghosh, and Joydeep Chandra. 2019. Identifying infrastructure damage during earthquake using deep active learning. (2019), 551–552.

[47] Jungo Kasai, Kun Qian, Sairam Gurajada, Yunyao Li, and Lucian Popa. 2019. Low-resource Deep Entity Resolution with Transfer and Active Learning. (2019), 5851–5861.

[48] Nabiha Asghar, Pascal Poupart, Xin Jiang, and Hang Li. 2016. Deep Active Learning for Dialogue Generation. arXiv: Computation and Language (2016).

[49] Khaled Jedoui, Ranjay Krishna, Michael S Bernstein, and Feifei Li. 2019. Deep Bayesian Active Learning for Multiple Correct Outputs. arXiv: Computer Vision and Pattern Recognition (2019).

[50] Ramon Maldonado and Sanda M Harabagiu. 2019. Active deep learning for the identification of concepts and relations in electroencephalography reports. Journal of Biomedical Informatics 98 (2019), 103265.

[51] Mohammed Abdelwahab and Carlos Busso. 2019. Active Learning for Speech Emotion Recognition Using Deep Neural Network. (2019), 1–7

[52] Rania Ibrahim, Noha A Yousri, Mohamed A Ismail, and Nagwa M El-Makky. 2014. Multi-level gene/MiRNA feature selection using deep belief nets and active learning. In 2014 36th Annual International Conference of the IEEE Engineering in Medicine and Biology Society. IEEE, 3957–3960.

[53] Olov Andersson, Mariusz Wzorek, and Patrick Doherty. 2017. Deep Learning Quadcopter Control via Risk-Aware Active Learning. 5 (2017), 3812–3818.

[54] Siqi Zhou and Angela P Schoellig. 2019. Active Training Trajectory Generation for Inverse Dynamics Model Learning with Deep Neural Networks. (2019).

[55] H M Sajjad Hossain and Nirmalya Roy. 2019. Active Deep Learning for Activity Recognition with Context Aware Annotator Selection. (2019), 1862–1870.

[56] Gautham Krishna Gudur, Prahalathan Sundaramoorthy, and Venkatesh Umaashankar. 2019. Activeharnet: Towards on-device deep bayesian active learning for human activity recognition. In The 3rd International Workshop on Deep Learning for Mobile Systems and Applications. 7–12.

[57] Gautham Krishna Gudur, Prahalathan Sundaramoorthy, and Venkatesh Umaashankar. 2019. Activeharnet: Towards on-device deep bayesian active learning for human activity recognition. In The 3rd International Workshop on Deep Learning for Mobile Systems and Applications. 7–12.

[58] Anfeng Cheng, Chuan Zhou, Hong Yang, Jia Wu, Lei Li, Jianlong Tan, and Li Guo. 2019. Deep Active Learning for Anchor User Prediction. (2019), 2151–2157.

[59] M M Al Rahhal, Yakoub Bazi, Haikel Alhichri, Naif Alajlan, Farid Melgani, and Ronald R Yager. 2016. Deep learning approach for active classification of electrocardiogram signals. Information Sciences 345, 345 (2016), 340–354.

[60] Kazim Hanbay. 2019. Deep Neural Network Based Approach for ECG Classification Using Hybrid Differential Features and Active Learning. Iet Signal Processing 13, 2 (2019), 165–175.

[61] Prateek Munjal, Nasir Hayat, Munawar Hayat, Jamshid Sourati, and Shadab Khan. 2020. Towards Robust and Reproducible Active Learning Using Neural Networks. arXiv: Learning (2020).

[62] Toan Tran, Thanhtoan Do, Ian Reid, and Gustavo Carneiro. 2019. Bayesian Generative Active Deep Learning. arXiv: Learning (2019)

[63] Ozan Sener and Silvio Savarese. 2018. Active Learning for Convolutional Neural Networks: A Core-Set Approach. international conference on learning representations (2018).

[64] Samarth Sinha, Sayna Ebrahimi, and Trevor Darrell. 2019. Variational Adversarial Active Learning. arXiv: Learning(2019).

[65] Trevor Campbell and Tamara Broderick. 2019. Automated Scalable Bayesian Inference via Hilbert Coresets. Journal of Machine Learning Research 20, 15 (2019), 1–38.

[66] Ido Dagan and Sean P Engelson. 1995. Committee-based sampling for training probabilistic classifiers. (1995),150–157

END

公众号近期荐读：

GAN整整6年了！是时候要来捋捋了！
语义金字塔式-图像生成：一种使用分类模型特征的方法
【无中生有的AI】关于deepfake的种类、危害、基础实现技术和挑战
新手指南综述 | GAN模型太多，不知道选哪儿个？
数百篇GAN论文已下载好！配一份生成对抗网络最新综述！
图卷积网络GCN的理解与介绍
【CapsulesNet的解析】了解一下胶囊网络？
【综述笔记】一些弱监督语义分割论文
人脸生成新SOTA？它还是GAN。
结合GAN的零次学习（zero-shot learning）
GAN的图像修复：多样化补全
CVPR2020之MSG-GAN：简单有效的SOTA
CVPR2020之姿势变换GAN：图像里谁都会劈叉？
CVPR2020之多码先验GAN：预训练模型如何使用？
两幅图像！这样能训练好GAN做图像转换吗？
单图训GAN！如何改进SinGAN？
有点夸张、有点扭曲！速览这些GAN如何夸张漫画化人脸！
见微知细之超分辨率GAN！附70多篇论文下载！
天降斯雨，于我却无！GAN用于去雨如何？
脸部转正！GAN能否让侧颜杀手、小猪佩奇真容无处遁形？
容颜渐失！GAN来预测？
强数据所难！SSL（半监督学习）结合GAN如何？
弱水三千，只取你标！AL（主动学习）结合GAN如何？
异常检测，GAN如何gan ?
虚拟换衣！速览这几篇最新论文咋做的！
脸部妆容迁移！速览几篇用GAN来做的论文
【1】GAN在医学图像上的生成，今如何？
01-GAN公式简明原理之铁甲小宝篇

GAN&CV交流群，无论小白还是大佬，诚挚邀您加入！

一起讨论交流！长按备注【进群】加入：

更多分享、长按关注本公众号：

你可能感兴趣的:(神经网络,relativelayout,weex,边缘检测,hashtable)

数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
【编程底层原理】HashMap Hashtable ConcurrentHashMap Dylanioucn 开发语言后端 java
在Java的不同版本中，集合的实现原理有所变化，尤其是在HashMap、Hashtable和ConcurrentHashMap这三种实现中。以下是它们的一些关键区别和实现原理：一、HashMapJDK1.7：HashMap使用数组和链表的组合来解决冲突。当一个桶（数组的每个位置）中的元素超过一定数量时，会使用链表来存储这些元素。HashMap在JDK1.7中不是线程安全的。JDK1.8：进行了优化
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
哈希表 and 算法 (笑)z 算法散列表哈希算法
哈希表：哈希表（Hashtable），也被称为散列表，是一种根据关键码值（Keyvalue）而直接进行访问的数据结构。它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数被称为散列函数或哈希函数，而存放记录的数组则被称为散列表或哈希表。哈希表的优点查找速度快：哈希表通过哈希函数直接定位到数组中的位置，因此查找速度非常快，时间复杂度接近O(1)。插入和删除操作方便：由于哈希表
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
【3.6 python中的numpy编写一个“手写数字识”的神经网络】 wang151038606 深度学习入门 python numpy 神经网络
3.6python中的numpy编写一个“手写数字识”的神经网络要使用Python中的NumPy库从头开始编写一个“手写数字识别”的神经网络，我们通常会处理MNIST数据集，这是一个广泛使用的包含手写数字的图像数据集。但是，完全用NumPy来实现神经网络（包括数据的加载、预处理、模型定义、前向传播、损失计算、反向传播和权重更新）是一个相当复杂的任务，因为NumPy本身不提供自动微分或高级优化算法（
yolov5单目测距+速度测量+目标跟踪 cv_2025 YOLO 目标跟踪人工智能计算机视觉机器学习图像处理 opencv
要在YOLOv5中添加测距和测速功能，您需要了解以下两个部分的原理：单目测距算法单目测距是使用单个摄像头来估计场景中物体的距离。常见的单目测距算法包括基于视差的方法（如立体匹配）和基于深度学习的方法（如神经网络）。基于深度学习的方法通常使用卷积神经网络（CNN）来学习从图像到深度图的映射关系。单目测距代码单目测距涉及到坐标转换，代码如下：defconvert_2D_to_3D(point2D,R,
探索深度学习的奥秘：从理论到实践的奇幻之旅小周不想卷深度学习
目录引言：穿越智能的迷雾一、深度学习的奇幻起源：从感知机到神经网络1.1感知机的启蒙1.2神经网络的诞生与演进1.3深度学习的崛起二、深度学习的核心魔法：神经网络架构2.1前馈神经网络（FeedforwardNeuralNetwork,FNN）2.2卷积神经网络（CNN）2.3循环神经网络（RNN）及其变体（LSTM,GRU）2.4生成对抗网络（GAN）三、深度学习的魔法秘籍：算法与训练3.1损失
卷积神经网络（CNN）详细介绍及其原理详解（二） FFmpeg123 Pytorch cnn 深度学习人工智能
接上一文继续;五、全连接层假设还是上面人的脑袋的示例，现在我们已经通过卷积和池化提取到了这个人的眼睛、鼻子和嘴的特征，如果我想利用这些特征来识别这个图片是否是人的脑袋该怎么办呢？此时我们只需要将提取到的所有特征图进行“展平”，将其维度变为1×x1×x1×x，这个过程就是全连接的过程。也就是说，此步我们将所有的特征都展开并进行运算，最后会得到一个概率值，这个概率值就是输入图片是否是人的概率，这个过程
【图像压缩】奇异值分解SVD灰色图像压缩（可设置压缩比）【含Matlab源码 4358期】 Matlab武动乾坤 Matlab图像处理（进阶版）matlab
✅博主简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，Matlab项目合作可私信。个人主页：海神之光代码获取方式：海神之光Matlab王者学习之路—代码获取方式⛳️座右铭：行百里者，半于九十。更多Matlab仿真内容点击Matlab图像处理（进阶版）路径规划（Matlab）神经网络预测与分类（Matlab）优化求解（Matlab）语音处理（Matlab）信号处理（Matlab）车间调度
TextCNN：文本卷积神经网络模型一只天蝎编程语言---Python cnn 深度学习机器学习
目录什么是TextCNN定义TextCNN类初始化一个model实例输出model什么是TextCNNTextCNN（TextConvolutionalNeuralNetwork）是一种用于处理文本数据的卷积神经网（CNN）。通过在文本数据上应用卷积操作来提取局部特征，这些特征可以捕捉到文本中的局部模式，如n-gram（连续的n个单词或字符）。定义TextCNN类importtorch.nnasn
基于VGG的猫狗识别卑微小鹿 tensorflow tensorflow
由于猫和狗的数据在这里，所以就做了一下分类的神经网络1、首先进行图像处理：importcsvimportglobimportosimportrandomos.environ['TF_CPP_MIN_LOG_LEVEL']='2'importtensorflowastffromtensorflowimportkerasfromtensorflow.kerasimportlayersimportnum
机器学习到底是个啥旷_9b08
机器学习是装逼神器？曾几何时，当我还在本科打dota玩屁股的时候，身边总有一帮大神。听他们谈话我的心情是。。。大佬中有各路高手前端、后段、java三大架构。。。但最令本渣一听到就仰慕甚至肃然起敬的是当听到卷积神经网络的时候。顿时就有种掉线三十分钟别人都是六神装的感觉。另外，班会上别班小哥用说用机器学习把图片转换成梵高风格时自己班妹纸那一声声尖叫怕是很难忘掉了。。。好在家里爸妈给了次重新做人的机会，
入门篇，带你了解CPU, GPU, TPU, NPU, DPU 今夕是何年，视觉算法部署深度学习算法人工智能
目录CPU(中央处理器)GPU(图形处理器)TPU(张量处理单元)NPU(神经网络处理器)DPU(数据处理器)CPU(中央处理器)专业介绍：CPU是计算机系统的核心，负责执行操作系统和应用程序的指令。它由多个核心组成，每个核心可以独立执行任务。CPU的设计重点是处理复杂的逻辑运算和顺序任务，如分支预测、指令调度等。现代CPU通常包含多个层级的缓存（如L1、L2和L3缓存），以减少访问主存储器的延迟
深度学习之基于Tensorflow卷积神经网络水果蔬菜分类识别系统 qq1744828575 python python plotly
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景与目标背景：在现代农业、智能零售等领域，自动化分类与识别技术对于提高效率、优化供应链管理具有重要意义。为了响应这一需求，本项目旨在构建一个基于深度学习技术的水果蔬菜分类识别系统。目标：构建一个准确率高、性能稳定的水果蔬菜分类识别模型，利用Tensorflow框架
高阶数据结构之哈希表基础讲解与模拟实现渡我白衣 c++知识点数据结构 c++
程序猿的读书历程：x语言入门—>x语言应用实践—>x语言高阶编程—>x语言的科学与艺术—>编程之美—>编程之道—>编程之禅—>颈椎病康复指南。前言：哈希表（HashTable）是一种高效的键值对存储数据结构，广泛应用于各种需要快速查找的场景，如数据库索引、缓存系统、集合等。它的基本思想是通过哈希函数将键映射到哈希表中的一个位置，从而实现快速的数据插入、删除和查找操作。下面我们将详细介绍哈希表的工作
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo