PaperWeekly

主动学习（Active Learning）概述及最新研究

©作者 | 白帆

学校 | 香港中文大学

研究方向 | 机器人、医疗图像、主动学习

前言

我将我对主动学习的理解和最新研究的感悟都整理为这篇文章，主要目的是供大家参考、讨论，一起学习和交流主动学习的技术。同时，我以后还会继续阅读主动学习领域的文章，有不错和值得推荐的文章，我会实时更新到我的 github 里，大家可以通过这个 list 最快地阅读最新最重要的文章，也欢迎大家向我推荐一些文章和一起交流。

Awesome Active Learning:

https://github.com/baifanxxx/awesome-active-learning

Note：前 1、2、3 节都是一些主动学习基础内容，也有很多文章做过类似的整理和介绍，如果你已经很了解了，可以直接跳到 4 节以后阅读。

介绍

主动学习是一种通过主动选择最有价值的样本进行标注的机器学习或人工智能方法。其目的是使用尽可能少的、高质量的样本标注使模型达到尽可能好的性能。也就是说，主动学习方法能够提高样本及标注的增益，在有限标注预算的前提下，最大化模型的性能，是一种从样本的角度，提高数据效率的方案，因而被应用在标注成本高、标注难度大等任务中，例如医疗图像、无人驾驶、异常检测、基于互联网大数据的相关问题。

▲ The pool-based active learning cycle. (Burr Settles, 2010)

Settles, Burr 的 Active Learning Literature Survey 文章为经典的主动学习工作进行了总结。上图是经典的基于池的主动学习框架。在每次的主动学习循环中，根据任务模型和无标签数据的信息，查询策略选择最有价值的样本交给专家进行标注并将其加入到有标签数据集中继续对任务模型进行训练。因为主动学习的过程中存在人的标注，所以主动学习又属于 Human-in-the-Loop Machine Learning 的一种。

主动学习为什么是有用的？下面通过一个直观的小例子让大家感受一下。

▲ (a) 一个由 400 个实例组成的数据集，从两类高斯分布均匀采用。实例表示为二维特征空间中的点。(b) 从问题域中随机抽取 30 个标记实例，训练一个逻辑回归模型。这条蓝线代表了分类器的决策边界（70% 的准确率）。(c) 使用不确定性抽样对 30 个主动查询实例进行训练的逻辑回归模型（90%）。（Burr Settles, 2010）

由此说明，样本对模型的贡献并不是一样的，选择更有价值的样本具有实际意义。当然，如何确定和评估样本的价值也是主动学习研究的一个重点。

模型分类

根据应用场景，主动学习的方法可以被分为 membership query synthesis, stream-based and pool-based 三种类型。其中，pool-based 是最常见的场景，并且由于深度学习基于 batch 训练的机制，使得 pool-based 的方法更容易与其契合。

在membership query synthesis 的场景中，算法可能挑选整个无标签数据中的任何一个交给 oracle 标注，典型的假设是包括算法自己生成的数据。但是有时候，算法生成的数据无法被 oracle 识别，例如生成的手写字图像太奇怪，oracle 也不能识别它属于 0~9？或者生成的音频数据不存在语义信息，让 oracle 也无法识别。

在 stream-based 的场景中，每次只给算法输入一个无标签样本，由算法决定到底是交给 oracle 标注还是直接拒绝。有点类似流水线上的次品检测员，过来一个产品就需要立刻判断是否为次品，而不能在开始就根据这一批产品的综合情况来考量。

在 pool-based 的场景中，每次给算法输入一个批量的无标签样本，然后算法根据策略挑选出一个或几个样本交给 oracle 进行标注。这样的场景在生活中更容易出现，算法也可以根据这一批量样本进行互相比较和综合考虑。

基本查询策略

在主动学习框架中，最重要的就是如何设计一个查询策略来判断样本的价值，即是否值得被 oracle 标注。而样本的价值并不是一成不变的，它不仅与样本自身有关，还和任务和模型等因素有关。一个简单的例子，在猫狗二分类问题中，一张长得像猫的狗的照片，对分类模型的训练往往是有价值，因为它难以分辨。

但是，同样是这张照片，出现在动植物二分类问题中，就变得不那么重要了，因为模型想分辨它并不难。因此，查询策略的设计并不是简单和一成不变的，需要根据具体环境、问题和需要进行设定。这样就产生了各种各样的查询策略，下面，我介绍一些基本的查询策略供大家参考。

不确定性采样（Uncertainty Sampling）：也许是最简单直接也最常用的策略。算法只需要查询最不确定的样本给 oracle 标注，通常情况下，模型通过学习不确定性强的样本的标签能够迅速提升自己的性能。例如，学生在刷题的时候，只做自己爱出错的题肯定比随机选一些题来做提升得快。对于一些能预测概率的模型，例如神经网络，可以直接利用概率来表示不确定性。比如，直接用概率值，概率值排名第一和第二的差值，熵值等等。

多样性采样（Diversity Sampling）：是从数据的分布考虑的常用策略。算法根据数据分布确保查询的样本能够覆盖整个数据分布以保证标注数据的多样性。例如，老师在出考试题的时候，会尽可能得出一些有代表性的题，同时尽可能保证每个章节都覆盖到，这样才能保证题目的多样性全面地考察学生的综合水平。同样地，在多样性采用的方法中，也主要分为以下几种方式：

基于模型的离群值——采用使模型低激活的离群样本，因为现有数据缺少这些信息；

代表性采样——选择一些最有代表性的样本，例如采用聚类等簇的方法获得代表性样本和根据不同域的差异找到代表性样本；

真实场景多样性——根据真实场景的多样性和样本分布，公平地采样。

预期模型改变（Expected Model Change）：EMC 通常选择对当前模型改变最大、影响最大的样本给 oracle 标注，一般来说，需要根据样本的标签才能反向传播计算模型的改变量或梯度等。在实际应用中，为了弱化需要标签这个前提，一般根据模型的预测结果作为伪标签然后再计算预期模型改变。当然，这种做法存在一定的问题，伪标签和真实标签并不总是一致的，他与模型的预测性能有关。

委员会查询（Query-By-Committee）：QBC 是利用多个模型组成的委员会对候选的数据进行投票，即分别作出决策，最终他们选择最有分歧的样本作为最有信息的数据给 oracle 标注。

此外，有些研究者将多种查询策略结合起来使用混合策略进行查询，例如即考虑不确定性又考虑多样性的。还有一些其他的查询策略，例如预期误差减少、方差减少、密度加权法等。

经典方法

下面我给大家分享几个经典的主动学习方法，这些方法经常被拿来作对比。在自己以后的文章里也可以考虑和以下经典的方法进行比较。

Entropy

可直接根据预测的概率分布计算熵值，选择熵值最大的样本来标注。

BALD

Deep Bayesian Active Learning with Image Data

https://arxiv.org/abs/1703.02910

BGADL

Bayesian Generative Active Deep Learning

https://arxiv.org/abs/1904.11643

Core-set

Active Learning for Convolutional Neural Networks: A Core-Set Approach

https://openreview.net/forum?id=H1aIuk-RW

LLAL

Learning Loss for Active Learning

https://arxiv.org/abs/1905.03677?context=cs.CV

VAAL

Variational Adversarial Active Learning

https://arxiv.org/abs/1904.00370

应用场景

由于主动学习解决的是如何从无标签数据中选择价值高的样本进行标注，所以在数据标签难以获得、标注成本大的场景和实际问题中被广泛应用。

互联网大数据相关的应用：在互联网的大数据场景中，无标签的数据不计其数，但是又不可能把所有的数据都打上标签。在有限的资金和时间下，最有效的方法就是利用主动学习挑选最有价值的样本交给人去打标签。例如，

阿里巴巴淘系技术

https://www.zhihu.com/question/265479171/answer/1495497483

中科智云全球首发全新主动学习算法框架，颠覆传统大量样本和人力标注模式

https://www.ofweek.com/ai/2021-07/ART-201713-8210-30509389.html

在安全风控异常检测等领域，异常数据远远少于正常的数据，而对网络上的大量数据都进行标注也是极其不合理的，但是主动学习能够选择性地标注这些数据。

无人驾驶等机器人领域的应用：在很多机器人领域，都需要收集大量的有标签数据来训练。尤其是非常火的无人驾驶领域。在无人驾驶领域，无人驾驶汽车对环境的感知尤为重要，感知的好坏直接影响决策的质量，对无人驾驶汽车的安全性有至关重要的作用。

感知模型多用深度学习构建，数据的重要性不言而喻，尤其是标注数据。而真实场景的无人驾驶环境种类多、复杂，为了保证模型性能，大多数公司需要利用汽车在实际场景中运行收集到的图像、点云等数据进行训练。面对这样庞大的数据量，给每一个样本都打上标签几乎是不可能实现的任务，而利用主动学习选择最有价值的样本（可能是当前模型预测的不确定性大）再人工标注，继续训练模型，从而尽可能地提高模型的性能，提高了稳定性和安全性。例如，特斯拉等

特斯拉挑战视觉极限

https://www.bilibili.com/read/cv7621643

主动学习如何改善自动驾驶夜间行人检测【NVIDIA】

https://www.bilibili.com/video/BV1xV411o72V/

Waymo和特斯拉背后的训练系统究竟有什么特别之处？

https://zhuanlan.zhihu.com/p/400834629

智能医疗诊断等领域：在医疗领域，深度学习的发展为包括诊断在内的多个方面带来了革命性的发展。数据驱动的方法必然需求大量的有标注数据，而标注医疗图像不仅耗时耗力，而且需要特定的专业知识，所以利用主动学习选择模型难以预测的样本进行选择地标注是非常有实际意义的。

有很多论文在研究主动学习在医疗领域的应用，但在实际应用和落地中，医疗诊断面临的最首要的问题还是精度和泛化性能。由于医疗数据是小样本，这些最重要和最基本的问题没有被彻底解决，所以主动学习的热度并不大。但是还是有一些公司在应用，例如腾讯 AI Lab 使用主动学习和难例挖掘方案

中国首款智能显微镜获批进入临床：病理诊断 AI 化，腾讯 AI Lab 打造

https://new.qq.com/omn/20200409/20200409A0BGWI00.html

在我看来，医疗数据获得的量本身就少的话，就没必要应用主动学习了，因为在有限的样本下，即使都标注都很难达到一个满意的性能，更别说去做选择了。但是真正有需求的场景是，

1. 有大量的无标签医疗数据，需要从中选择有价值的进行标注，例如从视频数据（胃肠镜视频）标注图像进行检测等；

2. 真正实现基本性能，能够落地部署后，仍需要长期在使用过程中收集数据，进行标注，但是由于这个过程是一直持续下去，长久的工作，所以对于这样大量的无标签数据也需要进行主动学习选择标注。

总之，主动学习应用的场景是针对有大量无标签数据（至少不缺），如何节省标注工作量使得模型达到满意的性能。在深度学习爆炸的时代，各种任务和应用都考虑采用数据驱动的 learning 的方法来解决，这就对数据的需求更高了。实际应用中，既不可能完全放弃标签，也不可能放弃无标注数据，而主动学习恰恰能够提供一个较合理的权宜之计，既要标注有价值的数据，又不需要全部标注，选择性地标注。

实际应用可能存在的问题

虽然考虑到主动学习的出发点和要解决的问题都比较实际，但是目前的主动学习方法在实际应用的话还是存在一些问题。

性能不稳定：制约主动学习最大的问题就是性能不稳定。主动学习是根据自己指定的选择策略从样本中挑选，那么这个过程中策略和数据样本就是影响性能的两个很重要的因素。对于非常冗余的数据集，主动学习往往会比随机采样效果要好，但是对于样本数据非常多样，冗余性较低的数据集，主动学习有的时候会存在比随机采样还差的效果。数据样本的分布还影响不同主动学习的方法，比如基于不确定性的方法和基于多样性的方法，在不同数据集上的效果并不一致，这种性能的不稳定是制约人们应用主动学习的一个重要因素。

在实际应用中，需要先根据主动学习进行数据选择和标注，如果此时的策略还不如随机采样，人们并不能及时改变或者止损，因为数据已经被标注了，沉没成本已经产生了。而优化网络结构和性能的这些方法就不存在这个问题，人们可以一直尝试不同的方法和技巧使得性能达到最好，修改和尝试的损失很小。

而主动学习被要求得更加苛刻，几乎需要将设计好的策略拿来直接应用就必须要 work 才行，如果不 work，那些被选择的样本还是被标注了，还是损失时间和金钱。苛刻的要求和不稳定的性能导致人们还不如省下这个精力，直接采用随机的标注方式。

脏数据的挑战：现在几乎所有的论文都在公开的数据集、现成的数据集上进行测试和研究。而这些数据集其实已经被选择和筛选过了，去除了极端的离群值，甚至会考虑到样本平衡，人为的给少样本的类别多标注一些，多样本的类别少标注一些。而实际应用中，数据的状况和这种理想数据集相差甚远。主动学习常用不确定性的选择策略，不难想象，噪声较大的样本甚至离群值总会被选择并标注，这种样本可能不仅不会提升模型的性能，甚至还会使性能变差。

实际中还存在 OOD（out of distribution）的问题，例如想训练一个猫狗分类器，直接从网络中按关键字搜索猫狗收集大量图片，里边可能存在一些老虎、狮子、狼等不在猫狗类别的无关样本，但是他们的不确定性是非常高的，被选中的话，并不会提升模型的性能。

难以迁移：主动学习是一种数据选择策略，那么实际应用中必然需求更通用、泛化性更好的主动学习策略。而目前的主动学习策略难以在不同域、不同任务之间进行迁移，比如设计了一个猫狗分类任务的主动学习策略，基于不确定性或多样性，达到了较好的性能，现在需要做一个新的鸡鸭分类的任务，那么是否还需要重新设计一个策略？如果任务是病变组织的分类呢？

由于不同任务的数据分布特点可能不一样，不同任务的难易不一样，无法保证主动学习的策略能够在不同数据不同任务中通用，往往需要针对固定的任务设计一个主动学习策略。这样就耗费了精力，如果能有一个通用性好的主动学习策略，那么就可以被不同任务迁移，被更广泛地应用，甚至直接将其部署为通用标注软件，为各种任务、数据集，提供主动选择和标注功能。

交互不便：数据选择策略与标注过程联系紧密，理想的流程是，有一个整合的软件能够提供主动数据选择，然后提供交互界面进行标注，这就是将主动学习流程与标注软件结合。仅有高效的主动学习策略，而不方便标注交互，也会造成额外的精力浪费。在流程上，现在主动学习普遍是选择出一批待标注的样本后，交给人们去标注，而期望人们能尽快标注交给模型，模型继续训练后再次选择。

人们标注的时候，模型既不能训练，主动学习也不进行其他操作，是个串行的过程，需求等待人工标注结束后，才能进行接下来的训练。这样的流程就不那么方便和高效，想象把主动学习+标注的系统给医生应用，策略先选出了一些样本，医生仅标注这些样本就标注了几天，然后再给模型训练，模型训练一段时间后，又选择出一些样本给医生，医生和模型互相等待对方的操作，降低了效率和便利性。

最新研究方向及论文推荐

下面我介绍一些主动学习目前最新的阅读价值较高的论文，供大家把握研究方向和热点。如果大家有兴趣，可以持续关注我 github 上的 awesome-active-learning paper list，我会实时更新有价值的主动学习方面的工作，供大家学习和交流。

8.1 主动学习问题和方法的探究

目前主动学习的基本方法和问题还存在一些不足，有一些最新的方法试图解决这些问题。

Mind Your Outliers! Investigating the Negative Impact of Outliers on Active Learning for Visual Question Answering （作者之一，李飞飞）

https://arxiv.org/abs/2107.02331

主动学习有望缓解监督式机器学习的海量数据需求：它已成功地将样本效率提高了一个数量级，例如主题分类和对象识别等传统任务。然而，作者发现与这一现象形成鲜明对比的是：在视觉问答任务的 5 个模型和 4 个数据集中，各种各样的主动学习方法未能胜过随机选择。为了理解这种差异，作者在每个示例的基础上分析了 8 种主动学习方法，并将问题确定为集体异常值——主动学习方法更喜欢获取但模型无法学习的一组示例（例如，询问文本的问题在图像中或需要外部知识）。

通过系统的消融实验和定性可视化，作者验证了集体异常值是导致基于池的主动学习退化的普遍现象。值得注意的是，作者表明，随着主动学习池中集体异常值的数量减少，主动学习样本效率显着提高。

Contrastive Coding for Active Learning Under Class Distribution Mismatch：

https://openaccess.thecvf.com/content/ICCV2021/html/Du_Contrastive_Coding_for_Active_Lea

基于以下假设：标记数据和未标记数据是从同一类分布中获得的，主动学习 (AL) 是成功的。然而，它的性能在类别分布不匹配的情况下会恶化，其中未标记的数据包含许多标记数据的类分布之外的样本。为了有效地处理类分布不匹配下的AL问题，作者提出了一种基于对比编码的 AL 框架，名为 CCAL。

与现有的 AL 方法专注于选择信息量最大的样本进行标注不同，CCAL 通过对比学习提取语义和独特的特征，并将它们组合在查询策略中，以选择具有匹配类别的信息量最大的未标记样本。理论上，作者证明了 CCAL 的 AL 误差具有严格的上限。

LADA: Look-Ahead Data Acquisition via Augmentation for Active Learning：

https://arxiv.org/abs/2011.04194

在主动学习的获取过程中尚未考虑从数据增强产生的虚拟实例的潜在收益。在数据获取的过程中，数据增强将选择并生成对训练模型提供信息的数据实例。因此，作者提出了通过增强或 LADA 的前瞻数据采集来集成数据采集和数据增强。在获取过程之前，LADA 考虑 1）选择未标记的数据实例和 2）通过数据增强生成的虚拟数据实例。此外，为了增强虚拟数据实例的信息量，LADA 优化了数据增强策略以最大化预测获取分数，从而产生了 InfoMixup 和 InfoSTN 的提议。由于 LADA 是一个可推广的框架，作者试验了各种采集和增强方法的组合。

8.2 主动学习与半监督学习结合

由于半监督学习展示出了优异的性能，在标签不足的情况下，如果能将主动学习与半监督学习结合，将会取得更优异的性能。

Semi-Supervised Active Learning for Semi-Supervised Models: Exploit Adversarial Examples With Graph-Based Virtual Labels：

https://openaccess.thecvf.com/content/ICCV2021/html/Guo_Semi-Supervised_Active_Learnin

尽管当前主流方法开始结合 SSL 和 AL（SSL-AL）来挖掘未标记样本的多样化表示，但这些方法的全监督任务模型仍然仅使用标记数据进行训练。此外，这些方法的 SSL-AL 框架存在不匹配问题。在这里，作者提出了一个基于图的 SSL-AL 框架来释放 SSL 模型的能力并进行有效的 SSL-AL 交互。

在该框架中，SSL 利用基于图的标签传播为未标记的样本提供伪标签，渲染 AL 样本的结构分布并提升 AL。AL 在决策边界附近找到样本，利用对抗性示例帮助 SSL 执行更好的标签传播。闭环中的信息交换实现了SSL和AL的相互增强。

8.3 主动学习与无监督域自适应结合

无监督域自适应要对齐目标域与源域，使模型利用源域的数据和标签，在无标签的目标域上取得较好的性能。目前出现一些工作考虑源域和目标域的关系，设计了主动学习策略提升模型在目标域的性能。

Multi-Anchor Active Domain Adaptation for Semantic Segmentation：

https://arxiv.org/abs/2108.08012

将目标域的分布无条件地与源域对齐可能会扭曲目标域数据的特有的信息。为此，作者提出了一种新颖的基于多锚点的主动学习策略，以协助域自适应语义分割任务。通过创新地采用多个点而不是单个质心，可以更好地将源域表征为多模态分布，实习从目标域中选择更具代表性和互补性的样本。手动注释这些样本的工作量很小，可以有效缓解目标域分布的失真，从而获得较大的性能增益。另外还采用多锚策略来对目标分布进行建模。通过软对齐损失，对多个锚点周围紧凑的目标样本的潜在表示进行正则化，可以实现更精确的分割。

8.4 主动学习与知识蒸馏结合

知识蒸馏过程中，teacher 给 student 传递知识，但是什么样的样本能够帮助这一过程，也是主动学习可以研究的一个方向。

Active Learning for Lane Detection: A Knowledge Distillation Approach：

https://openaccess.thecvf.com/content/ICCV2021/html/Peng_Active_Learning_for_Lane_Detection_A_

作者发现现有的主动学习方法在车道检测方面表现不佳，原因是两方面的。一方面，大多数方法基于熵来评估数据不确定性，这在车道检测中是不可取的，因为它鼓励选择车道很少甚至根本没有车道的图像。另一方面，现有的方法没有意识到车道标注的噪声，这是由严重遮挡和车道标记不清晰引起的。

在本文中，作者构建了一个新颖的知识蒸馏框架，并基于 student 模型所学的知识评估图像的不确定性。作者表明，所提出的不确定性度量克服了上述两个问题。为了减少数据冗余，作者研究了图像样本的影响集（influence set），并提出了一种新的多样性度量。最后，作者结合了不确定性和多样性指标，提出了一种用于数据选择的贪婪算法。

8.5 主动学习与对比学习结合

对比学习最近势头比较猛，最近也有主动学习与对比学习结合解决对比学习的问题，大家可以欣赏一下。

Active Contrastive Learning of Audio-Visual Video Representations：

https://arxiv.org/abs/2009.09805

对比学习已被证明可以通过最大化实例的不同视图之间的互信息（MI）的下限来生成音频和视觉数据的可概括表示。然而，获得严格的下限需要 MI 中的样本大小指数，因此需要大量的负样本。我们可以通过构建一个大型的基于队列的字典来合并更多的样本，但是即使有大量的负样本，性能提升也存在理论上的限制。

作者假设随机负采样导致高度冗余的字典，导致下游任务的次优表示。在本文中，作者提出了一种主动对比学习方法，该方法构建了一个 actively sampled 字典，其中包含多样化和信息丰富的样本，从而提高了负样本的质量，并提高了数据中互信息量高的任务的性能，例如，视频分类。

8.6 利用强化学习进行主动学习

Reinforced active learning for image segmentation：

https://arxiv.org/abs/2002.06583

基于学习的语义分割方法有两个固有的挑战。首先，获取像素级标签既昂贵又耗时。其次，现实的分割数据集是高度不平衡的：某些类别比其他类别丰富得多，使性能偏向于最具代表性的类别。在本文中，作者感兴趣的是基于池的方式进行人工标记工作，最大限度地减少这种工作，同时最大限度地提高分割模型在测试集上的性能。作者提出了一种新的基于深度强化学习（RL）的语义分割主动学习策略。

智能体学习一种策略，从未标记的数据池中选择一小部分信息丰富的图像区域进行标记。区域选择决策是基于被训练的分割模型的预测和不确定性做出的。作者的方法提出了一种用于主动学习的 DQN，使其能适应大规模的语义分割问题。作者在 CamVid 和大规模数据集 Cityscapes 中测试。

在 Cityscapes 上，在相同性能下，作者的基于深度强化学习的区域的 DQN 方法比最具竞争力的基线减少大约 30% 的额外标记数据。此外，作者发现与基线相比，作者的方法选择了更多代表性不足的类别标签，从而提高它们的性能并有助于减轻类别不平衡。

8.7 主动学习在点云方面

点云比图像的标注时间更长更费精力，尤其是像素级的点云标注。近期主动学习在点云方面的工作渐渐崭露头角，而且效果非常惊人，值得期待。下面我介绍一篇有代表性的点云语义分割的工作。

ViewAL: Active Learning with Viewpoint Entropy for Semantic Segmentation：

https://arxiv.org/abs/1911.11789

作者提出了 ViewAL，这是一种新颖的语义分割主动学习策略，它利用了多视图数据集中的视点一致性。作者的核心思想是，跨视点的模型预测的不一致提供了非常可靠的不确定性度量，并鼓励模型在不考虑观察对象的视点的情况下表现良好。

为了结合这种不确定性度量，作者引入了一种新的视点熵公式，这是作者主动学习策略的基础。此外，作者提出了超像素级别的不确定性计算，它利用了分割任务中固有的局部信息，直接降低了注释成本。视点熵和超像素的联合使用有效地选择了具有高度信息量的样本。

8.8 主动学习在目标检测方面

最新也有一些主动学习的文章开始结合到目标检测中，针对目标检测定义策略。目标检测不仅存在分类还存在定位，所以对于图像的不确定性定义和建模更加多样，使得更容易创新自己的主动学习方法，大家可以尝试做做这方面的工作。

Multiple instance active learning for object detection：

https://arxiv.org/abs/2104.02324

尽管用于图像识别的主动学习取得了实质性进展，但仍然缺乏指定用于目标检测的实例级主动学习方法。在本文中，作者提出了多实例主动目标检测（MI-AOD），通过观察实例级的不确定性来选择信息量最大的图像进行检测器训练。MI-AOD 定义了一个实例不确定性学习模块，它利用在标记集上训练的两个对抗性实例分类器的差异来预测未标记集的实例不确定性。

MI-AOD 将未标记的图像视为实例包，将图像中的特征锚点视为实例，并通过以多实例学习（MIL）方式重新加权实例来估计图像的不确定性。反复迭代实例不确定性学习和重加权有助于抑制噪声实例，弥合实例不确定性和图像级不确定性之间的差距。

总结

总而言之，主动学习现在还有很多点可以继续研究，包括但不限于：

1. 从主动学习基本理论和问题出发，完善和改进；

2. 与其他 learning 方法或概念结合，改进主动学习或该方法，例如半监督、域自适应、知识蒸馏和强化学习等等；

3. 应用到新的背景和任务（和主动学习结合的 paper 少的）中，例如点云分类分割、医疗图像、目标检测等等。

4. ......

既可以在现有的方法的基础上改进，又可以针对新的特定任务和具体问题设计自己的主动学习策略。无论是哪方面，主动学习都是存在很多继续研究的点。

主动学习既有重要的应用价值又还存在着一些问题，是学术界和工业界都可以进行研究的点。希望对主动学习感兴趣的朋友，可以一起多多讨论和交流。我以后也会在知乎和 awesome-active-learning 上持续为大家更新一些主动学习领域优异的工作。

特别鸣谢

感谢 TCCI 天桥脑科学研究院对于 PaperWeekly 的支持。TCCI 关注大脑探知、大脑功能和大脑健康。

更多阅读

#投稿通道#

让你的文字被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个，让知识真正流动起来。

稿件基本要求：

• 文章确系个人原创作品，未曾在公开渠道发表，如为其他平台已发表或待发表的文章，请明确标注

• 稿件建议以 markdown 格式撰写，文中配图以附件形式发送，要求图片清晰，无版权问题

• PaperWeekly 尊重原作者署名权，并将为每篇被采纳的原创首发稿件，提供业内具有竞争力稿酬，具体依据文章阅读量和文章质量阶梯制结算

投稿通道：

• 投稿邮箱：[email protected]

• 来稿请备注即时联系方式（微信），以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信（pwbot02）快速投稿，备注：姓名-投稿

△长按添加PaperWeekly小编

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

你可能感兴趣的:(算法,大数据,编程语言,python,计算机视觉)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam