lryjy

自监督入门（对比学习:INS+Disc，InvaSpread，SimCLR，MoCo系列）

自监督入门

本人从图像分割入门自监督过程记录

文章目录

自监督入门
前言
一、自监督学习背景及应用
二、对比学习
- 1.Contrastive Learning Framework
- 初阶
- - 一. Ins+Disc
  - 二.InvaSpread
  - - Motivation and Contribution：
    - Method：
- 中阶
- - 一.MoCov1
  - 二.SimCLRv1
  - - 1.Abstract
    - 2.Introduction
    - 3.Method
    - - 3.1 The Contrastive Learning Framework
      - 3.2 Training with Large Batch Size
    - 4. Data Augmentation for Contrastive Representation Learning
    - 5. Architectures for Encoder and Head
    - 6. Loss Functions and Batch Size
    - 7. Comparison with State-of-the-art
- 高阶
- - 一. MoCoV2
  - 二.SimCLRv2
  - - 1.Abstract
    - 2.Introduction
    - 2.Method
    - 3.实验
总结

前言

咨询师兄了解了一下自监督的方向：经典的方法大都是基于对比学习的（对比学习是特征学习），后来又提出了基于生成学习的（生成就是GAN的生成器在做的事情），于是准备先从对比学习方法入门。
机器学习大致分为分类和生成两大类，目标分类，检测，分割这些都是分类，图像复原，去雾霾这些都是生成。在概率论里，生成是后验概率，可以理解成你知道某个数据的分部，然后生成一个新的，服从这个分部，GAN就是在做这个事情，它先学习数据的分布，然后生成器再去生成这个分布。
一般的机器学习分为监督学习、非监督学习和强化学习。自监督学习希望通过学习到一种通用的特征表达于下层任务。自监督学习的思想非常简单，对于输入的一堆无监督的数据，通过数据本身的结构或者特性，人为构造标签出来。之后类似监督学习一样进行训练。现有的自监督学习通常分为两大类，生成方法（Generative Methods）和对比方法（Contrastive Methods）。

对比学习
经典论文：moco，simclr、byol、simsiam，今年的mae，基于Transformer的等

一、自监督学习背景及应用

（TPAMI：Self-supervised Visual Feature Learning with Deep Neural Networks: A Survey）
参考：https://mp.weixin.qq.com/s/VvUj0S2OTf8BowGRjDuVag
动机：
要在深度神经网络中应用监督学习，我们需要足够的标记数据。但是人工手动标记数据既耗时又昂贵。对于一些特殊的领域，比如医学领域获取足够的数据本身就是一个挑战。因此，监督学习当前的主要瓶颈是标签生成和标注。

方案：
自监督学习是通过以下方式将无监督学习问题转化为有监督问题的方法：我们是否可以通过特定的方式设计任务，即可以从现有图像中生成几乎无限的标签，并以此来学习特征表示？

在自监督学习中，我们通过利用数据的某些属性来设置伪监督任务来替换人类注释。例如，这里我们可以将图片旋转 0/90/180/270 度，然后训练模型来预测旋转的角度，而不是将图像标记为 cat / dog。如果将图片标记为 cat / dog 是需要人的参与，而将图片进行旋转并记录其旋转的角度作为标签写个脚本就能完成，并且我们可以从互联网上找到数百万张图像生成几乎无限的训练数据。

应用：

图像着色
我们将数百万张图像转化成灰色的，以此来构建成对的（灰度，彩色）图像作为数据。

我们可以使用基于全卷积神经网络的编码器-解码器（encoder-decoder）体系结构，并计算预测彩色图像与实际彩色图像之间的L2损失。

为了解决此任务，模型必须了解图像中存在的不同对象以及相关组件，以便进行上色。因此，学习到的特征表示对于下游任务很有用。

论文：Colorful Image Colorization | Real-Time User-Guided Image Colorization with Learned Deep Priors | Let there be Color!: Joint End-to-end Learning of Global and Local Image Priors for Automatic Image Colorization with Simultaneous Classification
图像超分辨率
通过对数百万张图像进行降采样来准备训练对（小尺寸，放大图像），作为训练数据。

基于 GAN 的模型，例如 SRGAN 很适合该任务。 Generator 基于全卷积网络获取低分辨率图像并输出高分辨率图像。使用均方误差和内容损失来比较实际图像和生成的图像。二分类器会输入一张图像，然后将其分类为实际的高分辨率图像还是伪造的超分辨率图像。这两个模型之间的相互对抗作用导致 Generator 学习生成具有精细细节的图像。

生成器和判别器都学到了可以用于下游任务的语义特征。
论文：Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network
图像修复
通过随机删除部分图像来准备训练对（损坏的，固定的）作为训练数据。

与超分辨率任务相似，我们可以利用基于GAN的体系架构，在该架构中 Generator 可以学习重建图像，而 Discriminator 则可以将真实图像和生成的图像分开。

对于下游任务，Pathak等人表明，在PASCAL VOC 2012语义分割的比赛上，生成器学到的语义特征相比随机初始化有10.2%的提升，对于分类和物体检测有<4%的提升。
论文:Context encoders: Feature learning by inpainting
图像拼图
通过随机交换图像块生成训练对

即使只有9个 patch，也可能存在 362880 个排列方式。为了克服这个问题，仅仅选取具有最大汉明距离的 64 个排列。

假设我们使用如下所示的重排来更改图像。我们用64个排列中的第64个排列。
现在，为了恢复原始的小块，Noroozi等人提出了一个称为上下文无关网络(CFN)的神经网络，如下图所示。在这里，各个小块通过相同的共享权值的siamese卷积层传递。然后，将这些特征组合在一个全连接的层中。在输出中，模型必须预测在64个可能的排列类别中使用了哪个排列。如果我们知道排列的方式，我们就能解决这个难题。

为了解决拼图问题，模型需要学习识别零件是如何在一个物体中组装的，物体不同部分的相对位置和物体的形状。因此，这些表示对于下游的分类和检测任务是有用的。
论文:Unsupervised learning of visual representations by solving jigsaw puzzles
上下文预测
我们随机选取一个图像块以及其附近的一个图像块来组成训练图像对。

为了解决这个文本前的任务，Doersch等人使用了类似于拼图游戏的架构。我们通过两个siamese卷积神经网络传递图像块来提取特征，连接特征并对8个类进行分类，表示8个可能的邻居位置。

论文:Unsupervised Visual Representation Learning by Context Prediction
几何变换识别
我们通过随机的旋转图像来生成有标注的图像（旋转图像，旋转角度）。

为了解决这个文本前的任务，Gidaris et al.提出了一种架构，其中旋转后的图像通过一个卷积神经网络，网络需要把它分成4类(0/90/270/360度)。

虽然这是一个非常简单的想法，但模型必须理解图像中物体的位置、类型和姿态才能完成这项任务，因此，学习到的表示方法对后续任务非常有用。
论文:Unsupervised Representation Learning by Predicting Image Rotations
图像聚类
把聚类的结果作为图像的标签生成训练图像样本和标注。

为了解决这个预备任务，Caron et al.提出了一种称为深度聚类的架构。在这里，首先对图像进行聚类，把聚类出的类别用作分类的类别。卷积神经网络的任务是预测输入图像的聚类标签。

论文:Deep clustering for unsupervised learning of visual features
图像合成
通过使用游戏引擎生成合成图像并将其调整为真实图像来准备训练对(图像，属性)。

为了解决此前置任务，Ren等人提出一个架构，使用共享权值的卷积网络在合成和真实图像上进行训练，然后鉴别器学会分类合成图像是否是一个真正的图像。由于对抗性，真实图像和合成图像之间的共享表示变得更好。
视频帧顺序识别
通过打乱视频中的视频帧来生成训练对（视频帧，正确的顺序）。

为了解决这个预备任务，Misra等人提出了一个架构，其中视频帧通过共享权重的ConvNets传递，模型必须确定帧的顺序是否正确。在此过程中，该模型不仅学习了空间特征，还考虑了时间特征。

论文:Shuffle and Learn: Unsupervised Learning using Temporal Order Verification

二、对比学习

参考：https://zhuanlan.zhihu.com/p/141141365
对比式学习着重于学习同类实例之间的共同特征，区分非同类实例之间的不同之处。
与生成式学习比较，对比式学习不需要关注实例上繁琐的细节，只需要在抽象语义级别的特征空间上学会对数据的区分即可，因此模型以及其优化变得更加简单，且泛化能力更强（对比学习算法并不一定要关注到样本的每一个细节，只要学到的特征能够使其和其他样本区别开来就行）。
对比学习的目标是学习一个编码器，此编码器对同类数据进行相似的编码，并使不同类的数据的编码结果尽可能的不同。

1.Contrastive Learning Framework

我们的核心就是要学习一个映射函数 $f$ ，把样本 $x$ 编码成其表示 $f (x)$ ，对比学习的核心就是使得这个 $f$ 满足下面这个式子：

这里的 $x^+$ 就是和 $x$ 类似的样本， $x^-$ 就是和 $x$ 不相似的样本， $s(\cdot ,\cdot)$ 这是一个度量样本之间相似程度的函数，一个比较典型的 score 函数就是就是向量内积，即优化下面这一期望：

如果对于一个x，我们有1 个正例和 $N - 1$ 个负例，那么这个 loss 就可以看做是一个 N 分类问题，实际上就是一个交叉熵，而这个函数在对比学习的文章中被称之为 InfoNCE。事实上，最小化这一 loss 能够最大化 $f (x)$ 和 $f(x^+)$ 相互信息的下界，让二者的表示更为接近。理解了这个式子其实就理解了整个对比学习的框架，后续研究的核心往往就聚焦于这个式子的两个方面：
$\bullet$ 如何定义目标函数？最简单的一种就是上面提到的内积函数，另外一种 triplet 的形式就是 $l=max(0,\eta+s(x,x^+)-s(x,x^-))$ ，直观上理解，就是希望正例 pair 和负例 pair 隔开至少 $\eta$ 的距离，这一函数同样可以写成另外一种形式，让正例 pair 和负例 pair 采用不同的 $s$ 函数，例如， $s(x,x^+)=||max(0,f(x)-f(x^+))||$ ， $s(x,x^+)=||max(\eta,f(x)-f(x^-))||$ 。
$\bullet$ 如何构建正例和负例？针对不同类型数据，例如图像、文本和音频，如何合理的定义哪些样本应该被视作是 $x^+$ ，哪些该被视作是 $x^-$ ，；如何增加负例样本的数量，也就是上面式子里的 $N$ ？这个问题是目前很多 paper 关注的一个方向，因为虽然自监督的数据有很多，但是设计出合理的正例和负例 pair，并且尽可能提升 pair 能够 cover 的 semantic relation，才能让得到的表示在 downstream task 表现的更好。

初阶

一. Ins+Disc

论文标题：Unsupervised Feature Learning via Non-Parametric Instance-level Discrimination
论文链接：https://arxiv.org/abs/1805.01978
个体判别任务
动机：

数据本身的明显相似性使某些类比其他类更接近。无监督方法即将对类的监督发挥到了极致，并学习了在各个实例之间进行区分的特征表示。
方法：（通过一个卷积神经网络，把所有的图片编码成一个特征。使得这些特征能够在最后的特征空间中可以被区分。通过对比学习去学习这个神经网络。）

（1）正样本为图像本身（可能经过了数据增强），负样本为数据集里的其它图片。大量的负样本特征存在‘Memory Bank’字典里。
（2）具体来说，256维度的正样本作为CNN backbone的输入，输出为2048维度特征，再下降到128维，再归一化。这里抽出了4096个负样本，然后通过NCE Loss计算对比学习的目标函数。最后把更新完网络后本次minibatch中的特征替换掉‘Memory Bank’字典里的对应特征。
亮点：提出了个体判别这个代理任务，并且用这个代理任务和NCE loss做对比学习，取得了不错的表征学习结果。提出了用别的数据结构去存储大量的负样本，以及如何对这些特征进行动量更新。

二.InvaSpread

论文标题：Unsupervised Embedding Learning via Invariant and Spreading Instance Feature
论文链接：https://arxiv.org/abs/1904.03436
个体判别任务

Motivation and Contribution：

相似的图片，它们之间的特征应该保持不变。不同的图片之间的特征应该尽量散开。
$\bullet$ 我们提出了一种新的基于实例特征的softmax嵌入方法来学习数据扩充不变量和实例展开特征。它实现了比所有竞争方法更快的学习速度和更高的准确性。
$\bullet$ 我们证明了数据扩充不变量和实例扩展属性对于实例智能无监督嵌入学习都是重要的。它们有助于捕获样本之间明显的视觉相似性，并很好地概括了看不见的测试类别。
$\bullet$ 与其他无监督学习方法相比，该方法在综合图像分类和嵌入学习实验中取得了最新的性能。

Method：

（1）前向过程：256张图片作为输入，经过数据增强下面得到256张图片。对于 $x_1$ 来说， $\hat{x}_1$ 是它的正样本，负样本为剩下的所有图片，图中即 $x_2,x_3]$ 和 $[\hat{x}_2,\hat{x}_3]$ 。现在，正样本数为256，负样本数为 $（256-1）\times 2$ 。
（2）端到端的训练：从同一个mini batch中选取正负样本，可以用一个编码器做端到端的训练。目标函数为NCE loss的一个变体。
（3）目标函数：

batch size=64

中阶

一.MoCov1

论文标题：Momentum Contrast for Unsupervised Visual Representation Learning
论文链接：https://arxiv.org/abs/1911.05722
代码链接：https://github.com/facebookresearch/moco

问题一：动量过程，如果在SGD中选择动量参数，是不是就不用强调此处的动量机制了
问题二：这里的输入都为x，做了两个不同的数据增强后生成 $x_q$ 与 $x_k$ ，正样本为 $N_1$ ，负样本为 $N_{2-N}$ 。如何在构造目标函数时体现学习正样本表征的。

二.SimCLRv1

论文标题：A Simple Framework for Contrastive Learning of Visual Representations
论文链接：https://arxiv.org/abs/2002.05709
代码链接：https://github.com/google-research/simclr

1.Abstract

本文简化了最近提出的对比自监督学习算法，无需specialized architectures or a memory bank。为了理解对比预测任务学习有用表征的原因，本文系统的研究了框架的主要组成部分：（1）数据扩充的组合在定义有效的预测任务中起着关键作用，（2）在表示和对比损失之间引入可学习的非线性转换，大大提高了学习表示的质量，与监督学习相比，对比学习受益于更大的批量和更多的训练步骤。

2.Introduction

在无监督的情况下学习有效的视觉表征是一个长期存在的问题。大多数主流方法分为两类：生成性（generativ）和区别性（discriminative）。生成方法学习在输入空间中生成或以其他方式建模像素。然而，像素级的生成在计算上是昂贵的，并且对于表示学习可能不是必需的。区别性方法使用与监督学习类似的目标函数学习表示，但训练网络执行代理任务，其中输入和标签都来自未标记的数据集。许多这样的方法依赖于启发式（ heuristics）来设计代理任务，这可能会限制所学表示的通用性。最近，基于潜在空间对比学习的鉴别方法（contrastive learning in the latent space）显示出巨大的潜力，取得了一流的结果。
为了理解是什么促成了良好的对比表征学习，我们系统地研究了我们框架的主要组成部分，并表明：
（1） 多个数据扩充操作的组合对于定义产生有效表示的对比预测任务至关重要。此外，与监督学习相比，无监督对比学习从更强的数据扩充中获益。
（2）在表征和对比损失之间引入可学习的非线性变换，可以显著提高学习表征的质量。
（3）具有对比交叉熵损失的表征学习得益于归一化嵌入和适当调整的参数。
（4）与有监督的对比学习相比，对比学习受益于更大的批量和更长的培训时间。与监督学习一样，对比学习也得益于更深更广的网络。

3.Method

3.1 The Contrastive Learning Framework

受最新对比学习算法的启发，SimCLR通过潜在空间中的对比损失最大化相同数据示例的不同增强视图之间的一致性来学习表示。如下图所示，该框架包括以下四个主要组件。

视觉表征对比学习的简单框架。从同一个增广族（t∼ T和t0∼ T）并应用于每个数据示例，以获得两个相关视图。训练一个基本编码器网络f（·）和一个投影头g（·），以使用对比损耗最大化一致性。训练完成后，我们扔掉投影头g（·），使用编码器f（·）和表示h执行下游任务。

（1） 一种随机数据扩充模块，它随机变换任何给定的数据示例，从而生成同一示例的两个相关视图，表示为 $\tilde{x}_i$ 和 $\tilde{x}_j$ ，我们将其视为正对。在这项工作中，我们依次应用了三种简单的增强：随机裁剪，然后调整回原始大小，随机颜色扭曲和随机高斯模糊。我们随机抽取了一个由N个样本组成的小批量，并定义了从该小批量派生的成对增广样本的对比预测任务，得到 $2 N$ 个数据点。我们并没有明确列举负样本，与InvaSpread相似，当给定一对正样本时，那么我们对这个小批量中的其它 $2 (N - 1)$ 个增强样本作为负样本。
实验表明，随机裁剪和颜色失真的组合对于获得良好的性能至关重要。

（2）一种基于神经网络的编码器 $f(\cdot)$ ，用于从增强数据示例中提取表示向量。我们的框架允许在不受任何限制的情况下选择各种网络架构。我们选择简单，并采用常用的ResNet 去获得 $h_i=f（x_i）=ResNet（x_i）$ ，其中 $h_i∈ R_d$ 是平均池化层之后的输出。本文使用了 ResNet-50 作为 Encoder，输出是 2048 维的向量 $h$ 。

（3）一种小型神经网络预测头 $g(\cdot)$ ，将表示映射到应用对比损失的空间。我们使用具有一个隐藏层的MLP来获得 $z_i=g（h_i）=W（2）σ（W（1）h_i）$ ，其中σ是ReLU非线性。这是一个 2 层的MLP，将上一步中2048维的向量 $h_i, h_j$ 进一步映射到128维的隐空间中，得到新的特征表达 $z_i, z_j$ 。最后利用 $z_i, z_j$ 去求loss 完成训练，训练完毕后扔掉预测头，保留编码器用于获取视觉表达（visual representation）。
实验所示，我们发现在 $z_i$ 上而不是 $h_i$ 上定义对比损失是有益的。

（4）为对比预测任务定义的对比损失函数。给定一个集合 ${\tilde{x}_k}$ ，包括一对正的示例 $\tilde{x}_i$ 和 $\tilde{x}_j$ ，对比预测任务旨在定义给定 $\tilde{x}_i$ 的 ${\tilde{x}_{k \neq i}}$ 中的 $\tilde{x}_j$ 。

重点理解损失的建模过程：
$\bullet$ 获取样本对之间的表征
图片最后的表征以样本对的方式呈现：

$\bullet$ 如何衡量样本对之间的相似性
每对样本以及不同对样本之间需要用到余弦相似度来衡量相似关系：
设置 $sim(u,v)=u^tv/||u||||v||$ 表示 $l_2$ 归一化 $u$ 和 $v$ 之间的点积（即余弦相似性）。

余弦值越接近1，就表明夹角越接近0度，也就是两个向量越相似。越接近-1，就表明夹角越接近180度，也就是两个向量越不相似。 $s i m (u, v)$ 取值范围是 $[- 1, 1]$ ， $e x p (s i m (u, v))$ 取值范围是 $[- 1 / e, e]$ （这里没考虑 $\tau$ ）。
某一对图像的相似性loss描述为:

这种 softmax 计算等价于获得第2张增强的狗的图像与该对中的第1张狗的图像最相似的概率。在这里，分母中的其余的项都是其他图片的增强之后的图片，也是negative samples。

所以我们希望上面的softmax的结果尽量大，所以损失函数取了softmax的负对数：

$\tau$ 是可调节的Temperature 参数。它能够scale 输入并扩展余弦相似度 $[- 1, 1]$ 这个范围。这里可以看出，我们用余弦相似度来衡量相似性，交叉熵loss是用信息熵来衡量相似性，已知余弦相似度的label为0，可以进行数学转化。

$\bullet$ 任意对图像之间的相似性

我们知道了衡量一对图像之间的相似性还不够，我们需要对着2N张图像进行建模，并转化成一个能学习每一对的Loss Function。

最后，计算每个Batch里面的所有Pair的损失之和取平均：

$\bullet$ 整个对比学习的伪代码为

3.2 Training with Large Batch Size

我们将训练批大小N从256更改为8192。从两个扩充视图来看，8192的批大小为每个正对提供16382个负示例。当使用标准SGD /动量和线性学习率缩放时，大批量的培训可能不稳定。为了稳定培训，我们对所有批量使用LARS优化器。
全局的BN。在具有数据并行性的分布式训练中，BN均值和方差通常在每个设备上进行局部聚合。在我们的对比学习中，由于**正对是在同一个设备中计算的，因此该模型可以利用局部信息泄漏来提高预测精度，而无需改进表示。**我们通过在训练期间汇总所有设备的BN均值和方差来解决这个问题。其他方法包括跨设备洗牌数据示例，或用LN范替换BN。

4. Data Augmentation for Contrastive Representation Learning

数据增强还没有被认为是一种系统的方法来定义对比预测任务。许多现有方法通过改变体系结构来定义对比预测任务。例如，Hjelm等人（2018年）；Bachman et al.（2019）通过限制网络架构中的感受野实现全局到局部的视图预测，而Oord et al.（2018）；Hénaff等人（2019年）通过固定的图像分割程序和上下文聚合网络实现相邻视图预测。我们表明，通过对目标图像执行简单的随机裁剪（调整大小），可以避免这种复杂性，这将创建一系列包含上述两个任务的预测任务，如上图所示。这种简单的设计选择方便地将预测任务与其他组件（如神经网络体系结构）解耦。更广泛的对比预测任务可以通过扩展扩充家族并随机组合来定义。
（1）数据扩充操作的组合对于学习良好的表示至关重要
$\bullet$ 一种类型的增强涉及数据的空间/几何变换，例如裁剪和调整大小（水平翻转）、旋转和剪切。
$\bullet$ 另一种类型的增强涉及外观变换，例如颜色失真（包括颜色下降、亮度、对比度、饱和度、色调）（Howard，2013；Szegedy等人，2015）、高斯模糊和Sobel滤波。
为了了解单个数据扩充的效果和扩充组合的重要性，我们研究了单独或成对应用扩充时框架的性能。

上图显示了单个和组合变换下的线性评估结果。我们观察到，没有任何单一的转换足以学习良好的表征，即使该模型几乎可以完美地识别对比任务中的正对。在组合增强方案时，对比预测任务变得更加困难，但表示质量显著提高。
（2）对比学习比监督学习需要更强的数据扩充

更强的颜色增强显著改善了学习的无监督模型的线性评估。这种情况下，AutoAugment（Cubuk et al.，2019）是一种使用监督学习发现的复杂增强策略，其效果并不比简单裁剪+颜色失真（更强）效果更好。当使用相同的增广集训练监督模型时，我们观察到更强的颜色增广不会改善甚至损害其性能。因此，我们的实验表明，与监督学习相比，无监督对比学习从更强的（颜色）数据扩充中获益。

5. Architectures for Encoder and Head

（1）无监督对比学习从更大的模型中获益（更多）

（蓝色为我们迭代100epoch，红色为迭代1000epoch，绿色为有监督训练。）
我们发现，随着模型大小的增加，监督模型与在无监督模型上训练的线性分类器之间的差距缩小，这表明无监督学习从更大的模型中比从监督模型中获益更多。
（2）非线性预测头可以改善前一层的表示质量（这应该是加激活函数的作用大）

这里的非线性为ReLU。我们观察到，非线性投影比线性投影好（+3%），比无投影好得多（>10%）。使用投影头时，无论输出尺寸如何，都可以观察到类似的结果。此外，即使使用非线性投影，投影头之前的层h仍然比之后的层z=g（h）好得多（>10%），这表明投影头之前的隐藏层比之后的层更好。
我们推测，在非线性投影之前使用表示的重要性是由于对比损失导致的信息损失。（作用和神经网络中使用非线性激活函数作用相似，非线性可分更多维度的信息，线性可分的信息有限。）

6. Loss Functions and Batch Size

（1）温度（ $\tau$ ）可调的归一化交叉熵损失比其他方法效果更好

第一二个损失有效地加权了不同的样本，适当的温度（ $\tau$ ）可以帮助模型从硬负片中学习；与交叉熵不同，其他目标函数不通过其相对硬度来衡量负项。因此，必须对这些损失函数应用半硬负挖掘（Schroff et al.，2015）：不是计算所有损失项上的梯度，而是可以使用半硬负项计算梯度（即，那些在损失幅度内且距离最近，但比正例更远的项）。

上图所示，如果没有标准化和适当的温度缩放，性能会显著下降。如果没有l2 normalization，对比任务的准确性较高，但在线性评估下，结果表现较差。

为了使比较公平，我们对所有损失函数使用相同的l2归一化，并调整超参数，并报告其最佳结果。虽然（半硬）负挖掘有帮助，但最好的结果仍然比我们默认的NT Xent损失糟糕得多。
（2）对比学习从更大的批量和更长的培训中获益（更多）

我们发现，当训练次数较少（例如100个）时，较大的批量比较小的批量具有显著的优势。随着训练步骤的增多，如果批次被随机重新采样，不同批次大小之间的差距就会减小或消失。相比于监督学习，在对比学习中，较大的批量提供了更多的负面示例，促进了收敛（即，为获得给定的准确度，采用较少的时间和步骤）。更长时间的培训也会提供更多的负面例子，从而改善结果。

7. Comparison with State-of-the-art

高阶

一. MoCoV2

二.SimCLRv2

论文标题：Big Self-Supervised Models are Strong Semi-Supervised Learners
论文链接：https://arxiv.org/abs/2006.10029
代码链接：https://github.com/google-research/simclr

1.Abstract

在充分利用大量未标记数据的同时，从少数标记示例中学习的一个范例是无监督的预训练，然后是有监督的微调。虽然这种范式以任务无关的方式使用未标记的数据，但与计算机视觉中常用的半监督学习方法相比，我们发现它对于ImageNet上的半监督学习非常有效。我们方法的一个关键要素是在预训练和微调期间使用大型（深度和广度）网络。我们发现，标签越少，这种方法（未标记数据的任务无关使用）从更大的网络中获益越多。在微调之后，通过第二次使用未标记的样本，但以特定于任务的方式，可以进一步改进大网络并将其提取为更小的网络，而分类精度几乎没有损失。所提出的半监督学习算法可归纳为三个步骤：**使用SimCLRv2对大型ResNet模型进行无监督预训练，对几个标记的示例进行监督微调，以及使用未标记的示例进行蒸馏，以提炼和传递特定于任务的知识。**此过程仅使用1%的标签即可实现73.9%的ImageNet top-1精度(≤每类13个标记图像）使用ResNet-50，标签效率比以前的技术状态提高了10倍。对于10%的标签，用我们的方法训练的ResNet-50达到77.5%的top-1准确率，优于所有标签的标准监督训练。

2.Introduction

在机器学习中，一个长期存在的问题是在充分利用大量未标记数据的同时，仅从几个标记的示例中学习。半监督学习的一种方法包括无监督或自我监督的预训练，然后是监督微调。该方法在预训练期间以任务无关的方式利用未标记的数据，因为受监督的标签仅在微调期间使用。虽然这种方法在计算机视觉中很少受到关注，但它在自然语言处理中已占主导地位，首先在未标记文本（如维基百科）上训练一个大型语言模型，然后在几个标记示例上微调模型。计算机视觉中常见的另一种方法是在监督学习期间直接利用未标记的数据，作为一种正则化形式。这种方法以特定于任务的方式使用未标记数据，以鼓励在不同模型之间或在不同数据扩充下对未标记数据的类标签预测一致性。

受视觉表征自我监督学习最新进展的推动，本文首先对ImageNet上半监督学习的“无监督预训练，监督微调”范式进行了深入研究。在自监督的预训练过程中，使用的图像没有类别标签（以任务无关的方式），因此表征不是直接针对特定的分类任务定制的。通过对未标记数据的不可知任务使用，我们发现网络大小很重要：使用大型（深度和广度）神经网络进行自我监督的预训练和微调，可以大大提高精度。除了网络大小之外，我们还描述了一些有利于监督微调和半监督学习的对比表征学习的重要设计选择。

一旦对卷积网络进行了预训练和微调，我们发现其特定于任务的预测可以进一步改进并提炼成更小的网络。为此，我们第二次使用未标记的数据来鼓励学生网络模仿教师网络的标签预测。因此，我们使用未标记数据的方法的蒸馏阶段让人想起在自训练中使用伪标记，但没有太多额外的复杂性。

总之，被提出的半监督学习框架包括三个步骤，如下图所示：（1）无监督或自监督的预训练（2）有监督的微调（3）使用未标记数据的蒸馏。我们开发了最近提出的对比学习框架SimCLR的一个改进变体，用于对ResNet体系结构进行无监督的预训练。我们将此框架称为SimCLRv2。我们在ImageNet ILSVRC-2012上评估了我们的方法的有效性，只有1%和10%的标记图像可用。我们的主要发现和贡献总结如下：

$\bullet$ 我们的实验结果表明，对于半监督学习（通过对未标记数据的任务不可知使用），标签越少，越有可能从更大的模型中获益（下图）。更大的自我监督模型更有标签效率，在仅对少数标记的示例进行微调时，性能会显著提高，即使它们有更大的潜在过度拟合能力。

$\bullet$ 我们表明，虽然大型模型对于学习一般（视觉）表示很重要，但对于特定的目标任务，可能不需要额外的能力。因此，通过特定任务使用未标记数据，可以进一步提高模型的预测性能，并将其传输到较小的网络中。
$\bullet$ 我们进一步证明了在SimCLR中使用卷积层进行半监督学习后，非线性变换（也称为投影头）的重要性。更深的投影头不仅提高了通过线性评估测量的表示质量，而且在从投影头的中间层进行微调时，还提高了半监督性能。

2.Method

（1）self-supervised pretraining with SimCLRv2
这是SimCLRv1的建模过程：

在这项工作中，我们提出了SIMCLR2，它在三个主要方面对SimCLR进行了改进。1.为了充分利用预训练的力量，我们探索了更大的ResNet模型（SimCLR的最大模型是ResNet-50（4×），我们训练的模型更深，但宽度更小。我们训练的最大模型是一个152层的ResNet）。2.我们还通过加深非线性网络 $g(\cdot)$ （也称为投影头）的容量来增加其容量。此外，与SimCLR中的预训练后完全丢弃 $g(\cdot)$ 不同，我们从中间层进行微调（稍后详述）。这一微小的变化使得线性评估和微调都有了显著的改进，只需使用几个标记的示例（与具有2层投影头的SimCLR相比，通过使用3层投影头并从投影头的第一层进行微调，当对1%的标记示例进行微调时，它在top-1精度方面的相对提高高达14%）。3.我们还结合了MoCo中的记忆机制，该机制指定了一个记忆网络（具有用于稳定的权值移动平均值），其输出将作为负面样本进行缓冲。（由于我们的训练是基于已经提供了许多对比负面样本的大型minibatch，因此此更改将改进∼1%用于线性评估，以及微调1%的标记示例时）

（2）Fine-tuning
微调是使任务不可知预训练网络适应特定任务的常用方法。在SimCLR中，MLP投影头 $g(\cdot)$ 在预训练后被完全丢弃，而在微调期间仅使用ResNet编码器 $f(\cdot)$ 。我们建议在微调期间将MLP投影头的一部分合并到基本编码器中，而不是将其全部丢弃。换句话说，我们从投影头的中间层微调模型，而不是像SimCLR中那样从投影头的输入层微调模型。请注意，从MLP头的第一层进行微调与向基本网络添加一个全连接层并从头中移除一个完连接层是相同的，并且这个额外层的影响取决于微调期间标记的示例的数量。

（3）Self-training / knowledge distillation via unlabeled examples
为了进一步改进目标任务的网络，这里我们直接为目标任务使用未标记的数据。我们使用微调网络作为教师来估算标签，以训练学生网络。具体而言，在没有使用真正标签的情况下，我们将以下蒸馏损失降至最低：

上面是一个交叉熵loss， $P^T(\cdot)$ 为教师网络， $P^S(\cdot)$ 为学生网络。
虽然我们在这项工作中只关注使用未标记样本的蒸馏，但当标记样本的数量很大时，也可以使用加权组合将蒸馏损失与标签标记示例相结合：

3.实验

总结

对比方法部分持续更新中…

你可能感兴趣的:(自监督,对比方法,学习,深度学习,人工智能)

2023-01-03 小小树洞记录路程
-昨天真的和朋友玩得很开心，但同时昨晚上也是有点失眠，并且我觉得昨晚上做的梦好像触碰到了我内心最害怕、恐惧的地方所以我今天起床后始终就是觉得有点不得劲。还好一会儿有个心理咨询，我们可以好好整理和探讨下。与此同时，我其实很想就大概整理下我们2023的一个大致方向。首先的话，最重要的事情还是自我疗愈，与此同时，就是学习聆听我们的内心，多花时间在冥想打坐上。并且我觉得我想把自己的快乐和内心真实的感受放在
Blazor使用TXTextControl控件编辑报告落叶飞花_ javascript 开发语言
文章目录1环境2课程链接3学习使用（加载TextControl控件）3.1DocumentEditor3.2DocumentViewer4javascriptApi列表5加载文档（TextControl加载文档，JS互操作）6开启修改跟踪（word中的修订）7文档修改保存8文档编辑，拖拽展示图片9文档编辑，使用ApplicationField10模板设计11插入图片11.1拖拽插入图片11.2Me
在Bash中如何提取子字符串
问题：对于形如someletters_12345_moreleters.ext的文件名，我想提取其中的5位数字并将它们放入一个变量中。明确一下细节，一个文件名的形式是若干个字符（不包含下划线），跟着一个五位的数字，数字两边都有一个下划线，最后跟着另一组若干个字符（不包含下划线）。我想要提取这个5位数字并将它存入一个变量中。我非常感兴趣于完成这一目标的不同方法。回答：使用cut命令number=$(
基于selenium的pyse自动化测试框架鱼鱼说测试 selenium 测试工具
Python接口自动化测试零基础入门到精通（2025最新版）介绍：pyse基于selenium（webdriver）进行了简单的二次封装，比selenium所提供的方法操作更简洁。特点：默认使用CSS定位，同时支持多种定位方法（id\name\class\link_text\xpath\css）。本框架只是对selenium（webdriver）原生方法进行了简单的封装，精简为大约30个方法，这些
接口测试流程鱼鱼说测试 postman
大体流程：3天精通Postman接口测试，全套项目实战教程！！1、（阅读）测试接口文档检验接口文档的完整性、正确性、一致性、易理解性和易浏览性。这个一般在实际测试过程中，都会弱化测试，不注重。2、编写测试用例这个大家都熟，根据接口文档编写测试用例。用例编写方法可以按照黑盒测试的用例编写规则来编写，如：边界值、正交表等等设计方法。3、根据测试用例进行API的手工执行测试根据用例执行测试，注意验证预期
做自己命运的主人梦想飞翔的骆驼
希望电影《哪吒》里有一句话:我命由我不由天，哪吒也正是秉持这种理念，不断与命运抗争，才冲破命运的窒楛，最终得以修成正果。驴子的故事从前一头驴不小心掉到了枯井里，不断地哀嚎，主人非常心疼，想把它救上来，于是叫了好多邻居，尝试了许多方法都没有奏效。正在一筹莫展之际有人出了个主意:反正驴也老了，干脆就埋了吧。于是大家开始往枯井里填土，驴一开始很惊恐，逐渐明白了这些人的意图，于是他反而安静了下来，每当有泥
2020-03-17 eflorsuy
40《安家》好不好看，对于我来说至少可以学到点什么东西吧！我才看了3集，但是不急，慢慢来呗！房似锦，对于工作认真负责，这个学习，量身订做，在合适不过了！首先，她也会室内设计，装修，不是个含糊的领导者，明天继续加油！
《优势谈判》十十一、谈判高手优势秘笈可乐爸的修行日记
第十章培养胜过对手的力量合法力：使用头衔，展示经验，增加信誉；使用“传统做法”；使用“固定流程”；在自己的势力范围内进行谈判。奖赏力应对：树立自信，避免对方使用奖赏力控制你。强迫力敬畏力：用言行一致和其他道德标准来树立敬畏力。敬畏力是所有影响力要素最为强大有力的一种。只要能够让别人相信你有自己的一套做事原则，而且你从来不会背离自己的原则，你就会对你周围的人产生强大的影响力。应对敬畏力的两种方法：a
《改什么？如何教？怎样考？》Day3 芳草June
阅读页数：P42—61【导读问题】一、在日常教学活动中，您使用过哪些教学方法？您能举例说明其中一种教学方法的利与弊吗？对于教学方法类型的认识，我一直处于懵懂状态，不清楚英语教学方法都有哪些。有人说是指教学法流派，比如，语法翻译法、情景教学法、听说法、交际法、任务型教学法、TPR全身反应法等；有人说是指具体的做法，比如听说法、说唱法、演示法等，没有一个统一的说法，我也不知道到底该坚持哪种说法。在日常
RAG 助力教育个性化：重塑学习体验的科技引擎 hy098543 学习科技
一、引言1.1研究背景与动机随着自然语言处理（NLP）技术的飞速发展，大语言模型（LLM）在众多任务中展现出了强大的能力，如文本生成、问答系统和机器翻译等。然而，传统的大语言模型在知识存储和更新方面存在一定的局限性。一方面，模型的知识主要依赖于预训练阶段所接触的数据，这导致其知识更新滞后，难以应对快速变化的现实世界信息。例如，对于一些新出现的事件、技术或研究成果，模型可能无法及时给出准确的信息。另
Java线程池
Executor接口Executor接口是线程池的基类，基本上所有的线程池类都直接或间接继承此类。接口定义publicinterfaceExecutor{voidexecute(Runnablecommand);}ExecutorService接口接口定义ExecutorService接口继承自Executor接口。publicinterfaceExecutorServiceextendsExec
如何使用高省官方邀请码555553？高省如何赚钱？测评君高省
高省APP因其丰富的优惠活动和独特的返利机制而受到广泛关注。在使用高省APP时，了解如何正确使用高省官方邀请码【555553】、邀请码的套路、赚钱方式以及返利的真实性至关重要。本文将详细解答这些问题，帮助您更好地利用高省平台。最新在家月入过万的方法【详细资料免费领取】大家好！我是高省APP最大团队.联合创始人溪风导师！【高省】APP网购优惠券免费领，分享还能赚钱。【高省】是一个自用省钱佣金高，分享
如何用 Mockito 玩转单元测试 en-route 单元测试
介绍Mockito是一个广泛使用的Java测试框架，它提供了简洁而强大的功能，用于模拟（mock）和验证对象的行为，尤其是在单元测试中。当我们需要测试某个类的功能时，但又不希望依赖其外部组件或复杂的对象时，可以使用Mockito来创建模拟对象，这些模拟对象可以控制方法返回值、抛出异常或执行特定的逻辑。Mockito使得测试变得更加独立、可靠和可维护，特别是在测试依赖较多或外部系统交互的代码时。从一
河池可以做亲子鉴定正规医院(附河池11家亲子鉴定中心最新名单) 中正DNA鉴定中心
DNA亲子鉴定是科学、准确的确定是否有血缘关系、家庭纠纷的重要方法。对于很多家长咨询河池可以做亲子鉴定正规医院办理流程，地址等话题。请务必核实机构的资质和业务范围，以确保自己的权益得到保障。下文也附河池11家亲子鉴定中心最新名单，中正小编提供一些参考和帮助，希望顺利完成鉴定。一、河池哪家医院可以做亲子鉴定?河池市人民医院，河池市第一人民医院，河池市妇幼保健院，河池市中医医院，河池市第三人民医院等三
多任务时做好统筹安排，以最优顺序来思考，最大限度发挥大脑能力——《效率脑科学》精读分享12 峰哥读写思
安排处理信息的顺序。这是《效率脑科学》一书，精读分享的第12篇。在职场中，有时我们同一时间，要处理的任务特别多，但又无法做到一心多用，有没有更高效的工作方法，帮助我们职场升值呢？上一集我们分享了，脑科学家的第一个用脑建议，将某些脑力活动自动化，这样就可以解放前额皮质的处理能力。今天我们要聊的话题是，脑科学家的第二个用脑建议，有意识地安排任务处理的顺序，争取让前额皮质有限的处理能力，得到最佳的应用。
美团优惠券领取的方法有哪些?美团优惠券在哪里可以领取好项目氧券
详解美团优惠券领取方法，让你省钱攻略轻松掌握！美团作为中国领先的本地生活服务平台，为消费者提供了丰富多样的优惠券活动。那么，你知道美团优惠券在哪里可以领取吗？本文将为你详细介绍美团优惠券的领取方法，让你省钱攻略轻松掌握！一、美团优惠券领取方法1.手机端领取：（1）打开美团APP，点击首页右下角的“我的”按钮，进入个人中心。（2）在个人中心页面，找到“我的优惠”选项，点击进入。（3）在优惠券页面，你
QCC系列显示交互层的自研技术突破与实践 TengTaiTech QCC308X/QCC518X QCC3091 /QCC3095 qcc304x 蓝牙 QCC ldac
在音频设备智能化进程中，显示交互的流畅度与兼容性已成为用户体验的核心指标。传统方案中，TFT彩屏与多语言适配常面临硬件驱动冲突、功耗失控、字符显示错乱等问题。作为高通平台十年级方案商，腾泰技术在QCC系列中聚焦显示交互层的自研技术突破，形成了一套完整的软硬件协同方案。自研屏显驱动框架：从硬件适配到算法创新腾泰QCC系列的核心竞争力集中在显示交互层的全栈自研技术，其架构可通过「屏显驱动技术栈架构图」
ChatGPT 之后的下一步是什么？四个迫在眉睫的进步 iCloudEnd
OpenAI的文本生成器ChatGPT进入公共领域已经两个半月了，该机器人令人印象深刻且深思熟虑的答案已经引起了1300万日常用户的注意，他们已经将其用于一般问题、开发想法和写作全长文章。尽管ChatGPT存在重大缺陷（例如一些事实不准确），但许多人担心这可能对劳动力、学校、新闻业等产生影响。然而，我们可能正处于一场巨大的人工智能革命的开端。OpenAI总裁兼联合创始人GregBrockman于1
《永夜长明》电视剧全30集【1080p超清】百度/云资源[网盘免费高清链接下载迅雷夸克阿里]多少集剧情在哪里看1080p超清地址平台优惠攻略官
电视剧《永夜长明》是一部古装爱情剧，改编自番茄小说《被疯批国师强取豪夺后》，由吴承峰导演，何宣林、李菲、王星玮等主演。剧情主要讲述了谢家贵女谢挽音（何宣林饰）与国师东方醉（李菲饰）之间错综复杂的情感纠葛和权谋斗争。谢挽音原本与太子有婚约，却因东方醉的介入而被迫成为国师夫人。东方醉外表清雅，实则内心疯狂，谢挽音在与他斗智斗勇的过程中，逐渐发现了他与自己幼年故人的相似之处，以及背后更大的阴谋永夜长明资
磁盘I/O性能测试详解：监控与优化的全景指南测试不打烊性能测试服务器 linux 压力测试
磁盘I/O（Input/Output）性能是衡量系统存储设备读取和写入数据效率的关键指标之一。磁盘I/O性能问题会影响整体系统响应时间、吞吐量等关键性能指标。在性能测试中，监控磁盘I/O至关重要，以下将从监控方式、命令使用方法、输出示例、参数分析以及如何通过监控结果发现性能异常来做详细说明。磁盘I/O监控：为什么它如此重要？磁盘I/O监控是确保系统性能的关键。通过监控，我们可以实时了解磁盘的读写速
模型优化-------模型压缩 AI扶我青云志人工智能模型优化
模型压缩是一种优化技术，目标是在尽量保留模型性能的前提下，减少模型的体积、计算成本和内存占用。特别适合模型部署在边缘设备、移动端、嵌入式系统等资源受限环境中。其中，“剪枝（Pruning）、量化（Quantization）和知识蒸馏（KnowledgeDistillation）”是最常用且研究最深入的三种方法。一、剪枝（Pruning）原理：剪枝的核心思想是去掉对模型输出影响较小的参数或结构，使得
【转载】数据库id的方案 f7629e2bca1c
分布式系统唯一ID生成方案汇总系统唯一ID是我们在设计一个系统的时候常常会遇见的问题，也常常为这个问题而纠结。生成ID的方法有很多，适应不同的场景、需求以及性能要求。所以有些比较复杂的系统会有多个ID生成的策略。下面就介绍一些常见的ID生成策略。1.数据库自增长序列或字段最常见的方式。利用数据库，全数据库唯一。优点：1）简单，代码方便，性能可以接受。2）数字ID天然排序，对分页或者需要排序的结果很
当情感主播需要学什么，说说我的经验糖葫芦不甜
想要成为一名优秀的情感主播，究竟需要学习哪些技能与素养呢？今天，我将结合自身的经验，与大家分享几点关键要素。5行公会，免费加入，一对一指导扶持↓微信在文章底部。情感主播的核心竞争力在于能够深刻理解并感受听众的情感世界。这要求主播具备深厚的同理心，能够迅速捕捉到听众情绪中的微妙变化，并与之产生共鸣。在我的主播生涯中，我始终努力站在听众的角度思考问题，用真诚的态度去倾听每一个故事，让每一次交流都充满温
解决幽默【VmmenWSA】占用系统资源过高且无法直接结束进程办法鱼圆食不食 windows
起因今天打开任务管理器时，偶然发现一个名为VmmemWSA的进程占用了大量内存。经过询问，得知它与Windows虚拟化有关，但目前电脑上并没有运行任何虚拟化工具（如WSL）。尝试使用管理员权限和命令行工具（CLI）等方法都无法关闭该进程。经过多次尝试，终于找到了解决办法，接下来分享给大家。出现原因VmmemWSA是与WindowsSubsystemforAndroid(WSA)相关的进程。当尝试关
【面试】面试官：请介绍一下你如何高效处理海量数据与JVM内存故障排查方法？
文章目录高效处理海量数据与JVM内存分析实战指南问题一：无内存限制下如何快速安全插入1000亿条数据到HashMap？1.数据结构优化2.内存与IO协同优化3.业务级安全策略问题二：JVM内存分析与OOM故障排查1.实时内存占用分析2.OOM事后分析流程步骤1：获取诊断三件套步骤2：定位泄漏根源步骤3：业务防御机制架构启示录高效处理海量数据与JVM内存分析实战指南问题一：无内存限制下如何快速安全插
OpenCV直线段检测算法类cv::line_descriptor::LSDDetector 村北头的码农 OpenCV opencv 算法人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述该类用于实现LSD(LineSegmentDetector)直线段检测算法。LSD是一种快速、准确的直线检测方法，能够在不依赖边缘检测的前提下直接从图像中提取出直线段。它是OpenCV的line_descriptor模块的一部分，常用于计算机视觉任务如图像拼接、S
云服务器环境下Linux系统epoll机制与高并发服务器优化实践 cpsvps_net 服务器 linux 运维
在当今云计算时代，云已成为企业部署高并发服务的首选平台。本文将深入探讨Linux系统核心的epoll机制如何赋能云环境下的高并发服务器，解析其底层工作原理与性能优势，并对比传统IO复用模型的差异，帮助开发者构建更高效的云端服务架构。云服务器环境下Linux系统epoll机制与高并发服务器优化实践一、云服务器环境对高并发服务的特殊需求在云服务器环境中，资源弹性扩展的特性使得高并发服务成为可能，但同时
云服务器性能优化全攻略：CPU、内存、磁盘IO调优实战 Gloria歌洛莉亚 c语言数据库服务器 python 性能优化
在云计算时代，服务器性能直接影响应用响应速度、用户体验和运营成本。无论是高并发网站、实时数据分析还是机器学习训练，优化云服务器性能都是开发者必须掌握的核心技能。本攻略将从CPU调度、内存管理、磁盘IO三个维度，结合Linux系统特性和实际场景，提供可落地的优化方案。一、CPU性能调优：从调度策略到并行计算1.1CPU资源监控与瓶颈定位实时监控工具：top-c#动态查看进程CPU占用（按P键按CPU
Java Spring 框架的低代码开发平台选型与实践
JavaSpring框架的低代码开发平台选型与实践关键词：JavaSpring、低代码开发、平台选型、快速开发、企业应用、微服务架构、可视化编程摘要：本文深入探讨了基于JavaSpring框架的低代码开发平台选型与实践。文章首先介绍了低代码开发的概念和Spring框架的优势，然后详细分析了主流低代码平台的架构特点和适用场景。通过对比评估指标、核心功能和技术实现，提供了科学的选型方法论。文章还包含了
屯垦塔里木札记（50）师市轮训连队（村）两委600余人悲惨的骆驼
2022年6月7日，兵团一师阿拉尔市连队（村）两委集中轮训班第六期正式开课。为进一步加强基层连队（村）两委对党的方针，路线、政策的学习理解，传承三五九旅精神，贯彻兵团高质量发展理念，强力推动连队（村）两委在乡村振兴过程中治理效能，依法依规行政，服务职工群众的能力，师市已举办6期轮训班。为期10天的培训，相继邀请兵团和一师党校讲师，一师组织部、统战部、政法委、人社局，民政局、司法局、公安局、农业农村
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt