DJ_SIGS

用于三维医学图像检测的半监督学习——FocalMix: Semi-Supervised Learning for 3D Medical Image Detection

本文记录下阅读 CVPR2020论文其中的《FocalMix: Semi-Supervised Learning for 3D Medical Image Detection》，更新于2020.7.1 —— 阿波

我把重点都标黄了，看过其他SSL的文章可以直接食用标注部分即可。

论文原文：Semi-Supervised Learning for 3D Medical Image Detection

论文逻辑目录

Contributions
Abstract
1. Introduction
2. Background and Preliminaries

2.1 Object Detection in 3D Medical Images

2.1.1 Anchor boxes
2.1.1 Anchor boxes

2.2. Semi-supervised Learning

3. Methodology

3.1. Soft-target Focal Loss
3.2. Anchor-level Target Prediction
3.3. MixUp Augmentation for Detection

4. Experiments

4.1. Experimental setup
4.3. Ablation Study
4.4. SSL with More Labeled and Unlabeled Data

5. Related Work
6. Conclusion
7. Acknowledgement

Contributions

个人觉得本文的主要贡献是:

提出了FocalMix，一种新的半监督学习框架用于三维医学图像检测。其思路还是很明确合理的。
在其变换中使用的扩充方法和图像变化过程，虽然其操作比较繁杂，但是确实合理的利用了病理图像的特征，结合了三维数据的特性提供了一种很好的思路。因为我们使用的图片本身就是病理图像中的病灶部位数据（我个人是这么觉得的，不然在自然图像中很容易翻车），所以在混合时候有其合理性和操作空间。
在像素和锚框两个层次对图像进行混合：参数设置巧妙、过程衔接合理，文中为了提高泛化能力，在公式和参数上的诸多设置都进行了解释。比如扩充、锐化、插值部分，hh，虽然我觉得这里讲的过于顺利，实际可能没这么理想。

Abstract

人工智能技术在医学成像中的应用是医学领域最有前景的领域之一。然而，最近在这一领域的成功很大程度上依赖于大量仔细注释的数据，而注释医学图像是一个昂贵的过程。

在本文中，我们提出了一种名为 FocalMix 的新方法，据我们所知，它是第一个利用半监督学习(SSL)在3D医学图像检测中的最新进展。我们在LUNA16和NLST两个广泛用于肺结节检测的数据集上进行了广泛的实验。

结果表明，我们提出的SSL方法扫描实现了17.3%的实质性改善，比最先进的监督学习方法有400个未标记的CT扫描。

1. Introduction

医学影像在现代医学实践中扮演着重要的角色。该领域的一个重要趋势是利用深度学习(DL)和人工智能(AI)等先进技术来实现自动医学图像分析。之前的工作已经在各种特定任务中显示出了良好的结果，如皮肤癌分类[8]，视网膜眼底图像分析[12]，以及一些初步的实际应用，如[5]。然而，我们认为，这种成功不仅应该归功于最近在深度学习技术方面的进展，还应该归功于大量精心标注的数据。

[8] Andre Esteva, Brett Kuprel, Roberto A Novoa, Justin Ko, Susan M Swetter, Helen M Blau, and Sebastian Thrun. Dermatologist-level classiﬁcation of skin cancer with deep neural networks. Nature, 542(7639):115, 2017.

[12] Varun Gulshan, Lily Peng, Marc Coram, Martin C Stumpe, Derek Wu, Arunachalam Narayanaswamy, Subhashini Venugopalan, Kasumi Widner, Tom Madams, Jorge Cuadros, et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs. Jama, 316(22):2402–2410, 2016.
[5] Po-HsuanChen, Krishna Gadepalli, Robert MacDonald,Yun Liu, Kunal Nagpal, Timo Kohlberger, Greg S Corrado, Jason D Hipp, and Martin C Stumpe. An augmented reality microscope for real-time automated detection of cancer. In Proc. Annu. Meeting American Association Cancer Research, 2018.

一方面，注释医学图像是一个昂贵和费时的过程。这个过程需要有经验的临床专家阅读检查报告，并结合其他检查结果，有时还需要咨询其他专家。此外，手动注释CT和MRI等3D图像更加困难。更多的信息。另一方面，医院信息系统中存储着大量的原始医学图像。与人工注释的高昂费用相比，检索它们的成本可以忽略不计。因此，能否利用这些注释较少的原始医学图像来提高深度学习模型的诊断准确性，成为一个必要的研究问题。

与此同时，半监督学习(SSL)近年来吸引了大量的研究。大多数最新的SSL方法通常添加一个定义在未标记数据上的辅助丢失术语(例如，一致性正则化术语[30])，或者甚至对标记数据和未标记数据进行线性插值(例如。其中一些方法在图像分类数据集上取得了很大的成功，如CIFA[16]，充分体现了利用未标记数据的潜在价值。

[30] Mehdi Sajjadi, Mehran Javanmardi, and Tolga Tasdizen. Regularization with stochastic transformations and perturbations for deep semi-supervised learning. In Advances in Neural Information Processing Systems, pages 1163–1171, 2016.
[39] Hongyi Zhang, Moustapha Ciss´e, Yann N. Dauphin, and David Lopez-Paz. Mixup: Beyond empirical risk minimization. In6thInternationalConferenceonLearningRepresentations, ICLR 2018, Vancouver, BC, Canada, April 30 - May 3, 2018, Conference Track Proceedings. OpenReview.net, 2018.
[16] Alex Krizhevsky, Geoffrey Hinton, et al. Learning multiple layers of features from tiny images. Technical report, University of Toronto, 2009.

将SSL的最新进展应用于医疗成像问题似乎是一个诱人的方法。然而，相对于已有的SSL文献中被广泛研究的分类任务，人们更关注医学影像中的损伤检测任务，因此许多技术细节尚未被探索。例如，现代的SSL框架通常要求loss函数能够处理软标签(例如，类的平滑概率)，而大多数一阶段的损伤检测模型使用 focal loss [22]，它没有这样的自然扩展。此外，最先进的SSL方法使用平均集成为未标记的数据获取伪标签。然而，很难取检测模型预测的边界盒的平均值。最后但并非最不重要的是，很少有研究涉及到医学图像的数据增强，然而，这几乎是SSL方法取得最近成功不可或缺的组成部分。

[22] Tsung-YiLin,PriyaGoyal,RossGirshick,KaimingHe,and Piotr Doll´ar. Focal loss for dense object detection. In Proceedings of the IEEE international conference on computer vision, pages 2980–2988, 2017.

在本文中，我们将讨论一种名为 FocalMix 的原则性方法，用于定制现代SSL框架以克服上述问题。首先，在第3.1节中，我们提出了一个关于焦点损失的一般性概括，允许使用具有倾斜分布的软目标训练标签（类似于大多数检测模型遇到的离散情况下的类不平衡）。然后，通过实际设计来说明如何扩展用于三维医学图像检测的SSL框架中的基本组件。具体地说，我们提出了一种目标预测策略，通过旋转和翻转来利用增强图像Patch的锚级集合(第3.2节)。此外，结合医学图像检测任务的独特特点，在图像级和目标级对医学图像检测任务进行混合增强(第3.3节)。在本文中，我们主要采用最先进的SSL方法 MixMatch [3] 作为一个运行示例，以提供更清晰、更容易理解的表示。该方法可以毫不费力地转移到其他现代SSL框架(如UDA[37])中。

[3] David Berthelot, Nicholas Carlini, Ian Goodfellow, Nicolas Papernot, Avital Oliver, and Colin A Raffel. MixMatch: A holisticapproachtosemi-supervisedlearning.InH.Wallach, H. Larochelle, A. Beygelzimer, F. d’Alch´e-Buc, E. Fox, and R.Garnett,editors,AdvancesinNeuralInformationProcessing Systems 32, pages 5049–5059. Curran Associates, Inc., 2019.
[37] Qizhe Xie, Zihang Dai, Eduard H. Hovy, Minh-Thang Luong, and Quoc V. Le. Unsupervised data augmentation. CoRR, abs/1904.12848, 2019.

通过对CT扫描中肺部结节检测的两个广泛使用的数据集进行广泛的实验，我们表明，提出的SSL方法FocalMix，可以大大优于优化的最先进的监督学习方法(第4.2节)。Ablation 研究进一步证明了我们提出的软目标损失函数、用于目标预测的集成方法和两种级别的混合策略的有效性(第4.3节)。此外，结果表明，当已有相当大的注释数据集可用时，FocalMix 仍然可以提高监督学习的性能(第4.4节)。

Ablation study就是你在同时提出多个思路提升某个模型的时候，为了验证这几个思路分别都是有效的，做的控制变量实验的工作。

2. Background and Preliminaries

2.1 Object Detection in 3D Medical Images

本文主要研究三维医学图像检测问题，这是医学图像分析中的一个重要课题。为了检测不同尺度的病变，大多数作品采用基于锚点的检测器，如特征金字塔网络 (FPN) [21]的三维变体。同时， focal loss 被广泛用于克服前景-背景类的极端不平衡[22]。本节将简要介绍这些方法。

[21] Tsung-Yi Lin, Piotr Doll´ar, Ross Girshick, Kaiming He, Bharath Hariharan, and Serge Belongie. Feature pyramid networks for object detection. In Proceedings of the IEEE conference on computer vision and pattern recognition, pages 2117–2125, 2017.
[22] Tsung-YiLin,PriyaGoyal,RossGirshick,KaimingHe,and Piotr Doll´ar. Focal loss for dense object detection. In Proceedings of the IEEE international conference on computer vision, pages 2980–2988, 2017.

图1:
(a)是一个为锚分配目标的例子。虚线网格表示定义锚框的输出特征映射，网格中的每个 bin 对应于特征映射中的一个点。粉红色的盒子是一个ground-truth边界盒子。橙色的框是正锚，蓝色的框是负锚。
(b)是我们用于目标预测的增强法的一个例子。我们对图像 Patch 使用翻转增强，并用模型预测每个锚点的概率。然后，对 patch 和 anchors 进行逆变换。为了便于演示，我们只展示了两个示例锚，并为每个锚使用一致的颜色。注意，3D图像中的锚也是三维的，为了更好地显示，我们只显示2D切片。

2.1.1 Anchor boxes

锚框是预定义的边界框，密集地平铺在图像上，以匹配目标对象。在[29]之后，锚定框被设置为具有不同的比例和高宽比，以便捕获不同形状的对象。每个锚点对应于检测器输出特征图中的一个像素，并与其接受域共享同一个中心。由卷积层实现的微型网络以滑动窗口的方式对每个锚进行预测。在训练过程中，当且仅当锚盒与某一 ground-truth 边界盒在 union 的交点 (IoU) 上高度重叠时，将锚盒视为匹配目标的正锚。
图1 (a) 显示了一个示例。在推理过程中，网络预测一个 objectness score (又称置信度得分)，并为每个 anchor box 协调偏移量作为输出。[21]特征金字塔网络在多尺度特征图上放置锚点，提高小目标的检测性能。

[29] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster R-CNN: Towards real-time object detection with region proposal networks. In Advances in neural information processing systems, pages 91–99, 2015.
[21] Tsung-Yi Lin, Piotr Doll´ar, Ross Girshick, Kaiming He, Bharath Hariharan, and Serge Belongie. Feature pyramid networks for object detection. In Proceedings of the IEEE conference on computer vision and pattern recognition, pages 2117–2125, 2017.

2.1.1 Anchor boxes

锚点分配方法导致正锚点相对于负锚点较少，Lin等[22]称之为前背景不平衡。为了减轻这个问题，他们引入了焦点损失focal loss :

y∈{0,1}是真实锚标签,
p是模型估计锚点为正例的概率
而αt是不同类别的权重因子(即α0和α1,分别对应0类别和1类别)，以平衡正面和负面样本的重要性。
γ是注意力参数。focusing parameter
Pt 的意义可以被认为是预测的置信度，因此Eq.(1) 中的第二项用来降低置信度样本的权重，使模型侧重于不难 (less confident ) 样本。

2.2. Semi-supervised Learning

半监督学习(SSL)旨在利用未标记数据来提高模型性能。在本节中，我们将简要回顾一个名为MixMatch[3]的SSL框架，我们的工作主要是在这个框架上构建的。==MixMatch 不仅是最先进的SSL方法之一，而且还是一个统一框架，它集成了这一领域研究中最成功尝试的精髓 spirits == (例如，熵最小化[11]、一致性正则化[30]和混合增强[39])。本文将MixMatch作为一个典型示例，说明如果可行，如何为医疗成像领域定制通用SSL方法。换句话说，我们的贡献大多与在SSL中取得的进展是正交的。

[3] David Berthelot, Nicholas Carlini, Ian Goodfellow, Nicolas Papernot, Avital Oliver, and Colin A Raffel. MixMatch: A holisticapproachtosemi-supervisedlearning.InH.Wallach, H. Larochelle, A. Beygelzimer, F. d’Alch´e-Buc, E. Fox, and R.Garnett,editors,AdvancesinNeuralInformationProcessing Systems 32, pages 5049–5059. Curran Associates, Inc., 2019.
[11] Yves Grandvalet and Yoshua Bengio. Semi-supervised learning by entropy minimization. In Advances in neural information processing systems, pages 529–536, 2005.
[30] Mehdi Sajjadi, Mehran Javanmardi, and Tolga Tasdizen. Regularization with stochastic transformations and perturbations for deep semi-supervised learning. In Advances in Neural Information Processing Systems, pages 1163–1171, 2016.
[39] Hongyi Zhang, Moustapha Ciss´e, Yann N. Dauphin, and David Lopez-Paz. Mixup: Beyond empirical risk minimization. In6thInternationalConferenceonLearningRepresentations, ICLR 2018, Vancouver, BC, Canada, April 30 - May 3, 2018, Conference Track Proceedings. OpenReview.net, 2018.

混合匹配包括两个主要部分，未标记数据的目标预测和混合增强。第一个组件需要定义给定数据点(如图像)的一组随机转换，其语义(如类标签)几乎没有变化。在图像分类的例子中，旋转和剪切是两种常用的增强方法。
MixMatch使用当前模型的平均预测集合，在形式上，该模型由θ参数化地将每个未标记训练样本 u 的 K 个扩充实例 uk 作为其标签的“猜测”。

然后用锐化算子对这些猜测的标签进行进一步变换，作为训练目标。锐化操作符 (用于L个类的第i个) 定义为

其中，T称为温度，控制输出分布的平整度(当T→0时，输出变成一个热向量)。锐化操作隐式强制模型对未标记数据输出低熵预测。一旦有了未标记数据的训练目标，MixMatch 将对已标记数据和未标记数据进一步利用混合增强[39]。更具体地说，给定一个标记 (或未标记) 数据点及其标记 (或预测目标) 即 (x, y)，混合增强产生一个随机线性插值与另一个训练例子(x0, y0)，或标记或未标记，如下所示

通过以上步骤，我们可以从标记数据和未标记数据中得到一个带有监督信号的增强训练示例集合，然后使用监督目标来训练模型参数。

3. Methodology

在本文中，我们试图利用现代半监督学习方法进行医学图像检测。为了实现这一目标，在第2.2节中介绍的MixMatch框架中，针对病灶检测任务量身定制了两个基本组件: 目标预测和混淆增强 target prediction and MixUp augmentation.。在此之前，我们首先提出焦点损失的通用泛化，这允许我们使用在大多数现代SSL框架中出现的软训练目标来训练检测模型。我们所提议的方法的概述如图2所示。

图2:我们提出的FocalMix方法的概述。对于一个输入批次，标记图像中锚点的训练目标是根据标注的框来分配的，未标记的用当前模型进行预测，如图下方所示。在对整个批处理应用两层混合后，我们使用所提出的软目标焦损失训练模型。在本文中，为了便于展示，我们只展示了带有3D锚点的每个3D CT扫描的一个切片。

FPN: 一种高效的CNN特征提取方法

3.1. Soft-target Focal Loss

半监督学习通常涉及软训练（例如，等式（8）中的y ）。这在SSL文献中很少被作为一个不确定性提出，因为目前大多数的工作都集中在分类任务上，而包含分类的交叉熵损失自然可以处理软标签。然而，正如在第2.1节中介绍的，最先进的目标检测方法通常使用 focal loss ，在原始交叉熵损失中增加两个加权项，例如公式（1）中的 α(y) 和 β(y, p) = (1−pt)γ （懒得用latex，能看懂就行）。

这两项都依赖于类标记，通过将它们写成 y 的函数来强调，不幸的是，如果y可以取0到1之间的任何连续值，则它们没有简单的扩展 trivial extension。这是阻碍我们直接使用现成的SSL方法的主要因素之一。因此，我们提出的方法将这两个术语推广到软目标的情况下。

第一项最初是为类不平衡而设计的，通常与 class y 的反频率成比例。更具体地说，较少出现的正例的 α 比负例的 α 大，以防止物质占据总损失。在我们的例子中，这个问题相当于有一个软标签的倾斜分布，因此，α(y）最好与 y 的概率密度函数成反比。然而，在模型训练的过程中进行密度估计在计算上是不可行的。因此，我们假设y的密度函数衰减的速率大致与 1/y 相同，并且将0和I处的密度视为超参数，分别用 α0 和 α1表示的交叉验证来确定。在这个假设下，我们可以导出软标签 a(y）的形式 α(y) = α0+ y(α1− α0 )。

第二项 $\left(1-p_{t}\right)^{\gamma}$ 用于降低检测模型训练过程中普遍存在的简单示例(特别是背景 anchors )的重量。我们可以把这个术语解释为预测“置信度” Pt 与目标值之间的差异（如公式1），通过该方法可以在一定程度上衡量训练样本的硬度。从这个角度看，我们可以自然地将这个术语推广到软目标标签，方法是将其重写为模型预测p与其训练目标y之间的绝对差的第γ次幂（ γ-th power），例如 $\beta(y, p)=|y-p|^{\gamma}$ 。

综上所述，为SSL提出的软目标焦点损失为
$L(p)=\left[\alpha_{0}+y\left(\alpha_{1}-\alpha_{0}\right)\right] \cdot|y-p|^{\gamma} \cdot C E(y, p)$

其中 $\log p-(1-y) \log (1-p)$ 为交叉熵损失。我们可以检查，当 y∈{0,1} 时， focal loss 是我们提出的软目标焦损失的一种特殊情况。

3.2. Anchor-level Target Prediction

对于未标记数据的目标预测是用于SSL的传统和现代方法中广泛使用的组件。然而，如何将现有的目标预测方法从分类转化为检测并不是一个简单的问题，因为检测模型输出目标对象的边框，而不是更结构化的类标签。在FocalMix中，我们建议在锚级(anchor level)处理这个问题。

在训练过程中，我们按照计算机视觉中的常见做法，==从原始图像中采样相同大小的patch ==(在我们的实验中为160 × 160 × 160 )。我们还确保了图像patch的边缘长度 (如160) 可以被 FPN 中使用的最大步长 (如16) 整除。因此，图像补丁中的每个锚都可以在旋转或翻转后落入另一个锚的位置。我们将每个补丁的扩展定义为在其上应用这两种类型的软转换。值得一提的是，与2D图像相比，3D医学图像在不同方向上的旋转和翻转有着更丰富的组合（48种不同的组合与8种不同的组合）。然后，利用该模型预测变换后的图像块中每个锚点与目标匹配的概率。然后，我们可以通过逆变换（旋转或向后翻转）得到原始面片中每个锚的一个猜测目标。读者可以在图1中找到一个直观的示例。

如图2所示，我们重复上述数据扩充过程 K 次，并为补丁中的每个锚生成 K 个猜测目标。然后，我们将每个锚的预测目标集合在一起。最后，我们应用（4）中的锚向锐化操作，得到一个给定面片的低熵预测目标，用于模型训练。

3.3. MixUp Augmentation for Detection

混合增强是MixMatch框架中的一个重要组成部分，它鼓励模型在训练示例之间表现线性，以获得更好的泛化性能。vanilla MixUp程序是为图像分类设置而设计的，其中每个图像与一个类标签相关联，而医学图像在我们的任务中被诊断为病变的包围框注释。因此，vanilla MixUp 增强不能直接使用。在本文中，我们介绍了两种适用于医学图像损伤检测的混合方法:图像级混合和物级混合(示例见图4)。

图4:两种混合方法的说明性示例。左图显示了图像级的混淆，红色箭头指向原始图像中的结节。右图展示了对象级的混淆，我们放大了结节，并将它们定位到每个图像块的中心，以便更好地显示。

图像级混音。难点主要在于如何在混合两幅图像的同时实现训练目标的融合。虽然医学影像检测任务的实际标签是边界盒，但是通过对两组盒的线性插值，我们无法得到像软类那样有意义的分类。相反，我们建议在锚级别上混合训练信号。形式上，给定两个相同大小的医学图像及其训练目标（注释标签或预测目标）对于每个锚，（x，{yi}）和（x0，{y0i}），我们生成一个增强样本（ˆx，{y0}），如下所示。

图像级混合在损伤检测任务中有更直观的解释，其目的是将损伤从背景纹理中区分出来。锚-锚混合要求模型能够检测到与比平常更强的背景噪音混合的损伤，类似于“高原训练” （altitude training）的想法。

对象级混合。在医学成像任务中，目标（即病变）包含的信息比背景纹理要多得多，但是对象的数量往往是有限的（大多数情况下每个医学图像只有一个病灶）。因此，我们建议通过在每个训练批中混合不同的损伤模式来生成额外的对象实例。换言之，对于训练批中每个图像中的每个对象，我们从当前批中随机抽取另一个对象，将其重新缩放到相同大小，然后以公式（10-12）中相同的方式混合这两个对象。注意，对象只是标记图像的注释框，而对于未标记的图像，具有高预测置信度的预测框被视为检测到的对象。由于所有这些对象都有非常一致的目标（高概率就是一个 positive 的例子），我们不再为了简单而混淆训练目标。。（we no longer mixup training targets for simplicity.）

4. Experiments

我们评估我们提出的半监督框架 FocalMix 在肺结节检测任务。实验在LUNA16数据集上进行，LUNA16数据集是肺结节检测文献中使用最广泛的数据集。我们还使用NLST数据集作为未标记数据进一步评估的额外来源。

LUNA16[31]是LIDC-IDRI数据集[2]的高质量子集。共888个胸部CT扫描，1186个标注大于3毫米的结节。所有的注释都得到至少3(4个)放射科医师的同意。其他混淆的结节和非结节则标记为“无关发现”，在评估时既不计入假阳性，也不计入真阳性。

NLST[35]（国家肺筛查试验）最初是为了比较胸部CT和胸部X射线检查肺癌的有效性而建立的。NLST数据集中大约有75000次CT扫描，这些扫描具有参与者的特征、扫描测试结果、诊断程序等。由于结节位置等注释在该数据集中不可用，我们仅在第4.4节所述的选择过程后将其用作额外的未标记数据集。

Evaluation。在[31]之后，我们使用自由响应接收机工作特性(FROC)和竞争性能度量(CPM)来衡量检测性能。CPM的总得分定义为每次扫描假阳性率为1/8、1/4、1/2、1、2、4和8 FPs时的平均回忆率。尽管一些相关文献在LUNA16数据集上使用了10倍交叉验证来计算评估指标，但在半额外设置中，标记和未标记数据的数量可能在不同的实验中不断变化，这并不十分方便。相反，我们将这个数据集重新划分为533个CT扫描用于训练(60%)和355个CT扫描用于测试(40%)。在半监督学习中使用的标记数据和未标记数据都是从训练集中采样的。

[31] Arnaud Arindra Adiyoso Setio, Alberto Traverso, Thomas DeBel,MoiraSNBerens,CasvandenBogaard,Piergiorgio Cerello, Hao Chen, Qi Dou, Maria Evelina Fantacci, Bram Geurts, et al. Validation, comparison, and combination of algorithms for automatic detection of pulmonary nodules in computed tomography images: the luna16 challenge. Medical image analysis, 42:1–13, 2017.
[35] National Lung Screening Trial Research Team. Reduced lung-cancer mortality with low-dose computed tomographic screening. New England Journal of Medicine, 365(5):395– 409, 2011.

4.1. Experimental setup

表1显示了具有不同标记数据量的LUNA16数据集上FocalMix的性能。报告的召回率为7个假阳性率以及CPM总得分。请注意，为了公平比较，我们对固定数量的标记数据使用相同的标记数据子集，对所有情况使用相同的未标记数据集，这两种情况都是从训练集中采样的。我们可以得出这样的结论:通过利用400张未标记的原始图像，FocalMix可以在分别使用25,50和100张带注释的CT图像作为标记数据时，始终优于完全监督的基线。当我们有25幅标记图像时，全监督模型只能得到66.6%的CPM评分，而FocalMix将其提高到78.1%，相对提高17.3%。另一方面，在100个标签数据的情况下，尽管全监督模型的CPM已经达到了82.8%，但 FocalMix 仍能大幅提升其性能，绝对提升4.4%。

表1:LUNA16数据集的主要结果。我们分别使用{25,50,100}标记的CT扫描对FocalMix进行评估。即兴表演。表示CPM在完全监督基线上的改进(括号中显示的相对改进)。

我们还可以从表1中观察到，通过使用400次未标记CT扫描，FocalMix可以获得与使用两倍标记数据量的全监督基线相当的结果。换句话说，仅仅从数据库中收集400个原始CT扫描，其效果与有50个仔细注释的扫描大致相同。此外，有趣的是，我们所提议的SSL方法FocalMix在使用100个标记扫描和400个未标记扫描时的CPM得分接近于使用533个标记扫描时的完全监督学习结果(89.2%)。

图3:LUNA16上不同数量的未标记数据的性能。我们使用了100张标记过的图像。

图3显示了不同数量的未标记CT扫描的性能。我们可以观察到，CPM得分随着未标记数据数量的增加而持续增长，这证明了在FocalMix中使用未标记数据的有效性。

4.3. Ablation Study

在本节中，我们通过对LUNA16数据集的ablation studies ，研究了在我们提出的半监督方法中不同成分(即损失函数、目标预测方法、混合增强策略)的有效性。由于标记过少的训练数据会导致结果不稳定，我们在接下来的所有实验中都使用了100幅标记过的图像。

表3:消融研究。模型用100个标记扫描和400个未标记扫描进行训练。Fail 表示一个发散 divergent 的结果。

损失函数：我们提出的软目标焦损通过调整其每个项来适应软目标来产生焦损耗。由于交叉熵损失可以很好地处理软标签。只修改了前两个项，即α(y) 和 β(y, p)。为了研究我们的扩展分别对这两个项的贡献，我们使用“伪硬目标”将提出的损失与其退化版本进行比较。也就是说，概率大于0.5的软目标为正例，其他概率为负。这样，我们就可以在SSL框架中最初的焦点丢失中使用a和B术语。如表3(a）所示，我们可以看到，在伪硬目标（甚至在排除两者的情况下，使用a或B的反生成版本中使用α 或 β都会损害检测性能，这说明了我们设计的软目标泛化对焦损的贡献。

目标预测：在目标预测阶段，我们首先对 K 个不同的增强进行预测，并通过在锚点级别取平均来集成这些预测。为了证明这个集成过程的贡献，我们在表3(b)中报告了 FocalMix 在不同K上的CPM得分。我们可以看到，单次增强进行目标预测时，CPM得分仅为85.9%，而当K次增加到4次时，CPM得分提高1.3%，验证了集成策略的有效性。然而，我们还可以注意到，当K = 4时，性能开始饱和。因此，在整个实验中我们选择K = 4 。

混合增强。在 FocalMix 中，为医学图像设计了两种混合策略:图像级混合和对象级混合。如表3所示，图像级别的混合可以将CPM评分从0.852提高到0.867，而对象级别混合进一步将CPM评分提高到0.872。我们还在图4中演示了一些MixUp示例。直观地说，图像级混淆的目的是鼓励模型在前景和背景之间进行线性操作，而物级混淆鼓励模型检测具有更丰富模式的损伤。

4.4. SSL with More Labeled and Unlabeled Data

在前几节中，我们分析了使用相对少量标记数据的FocalMix的性能。尽管这可能是现实应用程序中最常见的场景，但当有大量训练集可用时，SSL是否还能提高监督学习的性能也是一个有趣的研究问题。此外，标记数据和未标记数据的数据分布通常不匹配。因此，我们还评估了我们提议的SSL框架，使用来自LUNA16的所有533个CT扫描作为标记数据，并使用外部数据库NLST(可能与LUNA16的数据分布不同)来采样未标记数据。

数据的选择：NLST数据集包含约75000个CT扫描，其中大部分不包含结节。因此，我们试图过滤掉这些不相关的图像没有结节。具体来说，我们首先使用LUNA16训练一个3D FPN，对NLST的一个随机子集进行预测，然后挑选出至少有一个高可信度预测结节的CT扫描(阳性结节的阈值设置为0.8)。在选择之后，我们将约3000次扫描保留为无标记的训练数据。

结果：结果如表4所示。我们训练了400个时代的所有模型。当使用所有的533个注释的CT扫描时，我们提出的混淆策略(即(例如，锚层和对象层混淆)单独可以将全监督学习方法的CPM得分从89.2%提高到90.0%。FocalMix通过利用大约3000张没有注释的图片，进一步将这个结果提高到90.7%。

5. Related Work

三维医学图像的检测：由于篇幅有限，我们首先对肺结节的检测方法进行综述。由于可以公开获取数据集，肺结节检测是三维医学图像中最成熟的领域。早期的肺结节探测器使用带有手工特征的机器学习技术，如球形滤波器[36,38,4,1]。近年来，深度学习技术的蓬勃发展使现代目标检测技术成功应用于医学图像检测领域。Ding等[7]提出使用更快的2D R-CNN和3D CNN来更准确地检测结节。另一项研究[20,41,14,19]使用3D区域建议网络[29]或特征金字塔网络[21]直接检测结节。Pezenshk等人[27]和Liu等人[23]进一步提出使用另一种网络，然后再使用3D FPN来减少假阳性。

半监督学习：最近的大多数研究集中在如何将损失项应用到未标记的数据上，以便更好地泛化。伪标签[18]使用置信度最高的预测类作为未标记数据的训练标签。Π-Model[17]和Γ-Model[28]使用一致性正则化项来惩罚不一致的预测。Tarvainen和V alpola[34]建议使用历史参数的移动平均值，用“均值老师”来规范模型。MixMatch[3]和UDA[37]将一致性正则化和现代数据增强技术集成到一个统一的框架中，取得了很大的改进。还有一些工作是通过使用带有图像级标注的额外图像来改进检测模型[33,10]。

医学图像处理中的半监督学习：由于数据注释的困难，SSL在医学图像处理中得到了广泛的应用。Su等人提出了一种利用局部和全局一致性正则化的半监督核分类方法。Ganaye等人[9]和Chen等人[6]也提出了SSL方法来获得更好的脑图像分割结果。Zhou等人[40]通过半监督学习提高了疾病分级和病灶分割的性能。ASDNet[25]采用了一种基于注意力的半监督学习方法来提高医学图像分割的性能。这些之前的工作也局限于分类和分割，而本文关注的是医学影像中一个更重要、更复杂的任务——病灶检测。

引用文献过多，可自己查看原文

6. Conclusion

本文讨论了一种新的半监督学习框架FocalMix，它利用未经注释的原始医学图像来提高监督损伤检测模型的性能。大量实验表明，FocalMix可以显著提高全监督学习基线的性能。我们的工作证明了在3D医疗检测任务中利用现代SSL方法的可行性。

7. Acknowledgement

这项工作得到了国家重点研发计划(2018YFB1402600)、BJNSF (L172037)和北京市人工智能协会的支持。

你可能感兴趣的:(图像分割,计算机视觉,机器学习,人工智能,深度学习,图像处理,医学)

python automl_自动化的机器学习(AutoML)：将AutoML部署到云中
编辑推荐:在本文中，将介绍一种AutoML设置，使用Python、Flask在云中训练和部署管道；以及两个可自动完成特征工程和模型构建的AutoML框架。本文来自于搜狐网，由火龙果软件Alice编辑、推荐。AutoML到底是什么？AutoML是一个很宽泛的术语，理论上来说，它囊括从数据探索到模型构建这一完整的数据科学循环周期。但是，我发现这个术语更多时候是指自动的特征预处理和选择、模型算法选择和超
人工智能服务器处理器的全新定义两大头部品牌旗舰款的王者之争！云储存cpu_云服务器处理器_企业服务器处理器
一、旗舰处理器架构解析IntelXeon6900系列代表着英特尔在服务器处理器领域的最新成果，采用增强版Intel7制程工艺打造。该系列最高配置56个物理核心，通过超线程技术支持112个逻辑线程，在处理多线程任务时展现出卓越的性能表现。内存子系统方面，支持8通道DDR5-4800内存配置，最高可扩展至4TB容量，为内存密集型应用提供了充足带宽。特别值得一提的是其集成的AMX高级矩阵扩展指令集，这项
院级医疗AI管理流程—基于数据共享、算法开发与工具链治理的系统化框架 Allen_Lyb 医疗高效编程研发人工智能算法时序数据库经验分享健康医疗
医疗AI：从“单打独斗”到“协同共进”在科技飞速发展的今天，医疗人工智能（AI）正以前所未有的速度改变着传统医疗模式。从最初在影像诊断、临床决策支持、药物发现等单一领域的“单点突破”，医疗AI如今已迈向“系统级协同”的新阶段。曾经，医疗AI的应用多集中在某一特定环节，比如利用深度学习算法分析医学影像，辅助医生进行疾病诊断。这种单点突破式的应用虽然在一定程度上提高了医疗效率，但随着医疗行业对AI技术
python--自动化的机器学习（AutoML） Q_ytsup5681 python 自动化机器学习
自动化机器学习（AutoML）是一种将自动化技术应用于机器学习模型开发流程的方法，旨在简化或去除需要专业知识的复杂步骤，让非专家用户也能轻松创建和部署机器学习模型**[^3^]。具体介绍如下：1.自动化的概念：自动化是指使设备在无人或少量人参与的情况下完成一系列任务的过程。这一概念随着电子计算机的发明和发展而不断进化，从最初的物理机械到后来的数字程序控制，再到现在的人工智能和机器学习，自动化已经渗
【Python】人脸识别宅男很神经 python 开发语言
第一章：计算机视觉与图像处理的基石在深入人脸识别之前，我们必须首先牢固掌握计算机视觉和图像处理的基本概念。人脸，本质上就是一张复杂的图像，对图像的理解是所有高级视觉任务的起点。1.1图像的本质：像素与数字化表示图像，在我们看来是连续的画面，但在计算机内部，它却是离散的数值矩阵。1.1.1什么是像素？图像的最小单元像素（Pixel），是构成数字图像的最小单位。可以将其想象成一个微小的彩色点。一张数字
最新1区9+非肿瘤纯生信，逻辑清晰易懂，机器学习筛选关键基因的纯生信也可以发高水平期刊，抓紧上车！生信小课堂
影响因子：9.186关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因2单个疾病结合免疫浸润，热点基因集，机器学习算法等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析4基于分型的非肿瘤生信分析5单细胞结合普通转录组生信分析目前非肿瘤生信发文的门槛较低，欢迎大家！研究概述：本研究首先使用R语言在三个基因表达数据集中找到
轻松掌握EasyX图形库在Visual C++ 6.0中的应用 Randy Rhoads
本文还有配套的精品资源，点击获取简介：EasyX图形库为VisualC++6.0环境提供了简便的图形界面编程功能。它包括丰富的图形绘制、图像处理、文字操作、图形变换和事件处理等核心特性，辅以详细的API文档和示例代码。该库支持在多个操作系统版本上运行，且具有优化的性能，极大地简化了图形界面的开发流程。1.easyX图形库概述1.1引言easyX图形库是一个基于Windows操作系统的简单易用的图形
人人皆有神功：AI如何改变程序员的江湖地位？ nbsaas-boot 人工智能大数据
在人类的历史中，每一次技术革命都重新洗牌了社会的力量结构：工业革命带来机器力量的爆发，信息时代成就了程序员的黄金时代。而如今，随着通用人工智能（AGI）和大模型技术的突飞猛进，我们正在步入一个**“人人皆有神功”的AI江湖时代**。当AI成为每个人的智能助手，编程是否还重要？程序员将何去何从？本文将以“武林江湖”的隐喻，探索AI时代的技术平权与社会重构。一、技术平权真的来了吗？过去，程序员之所以被
大型语言模型的智能本质是什么 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力语言模型人工智能自然语言处理
大型语言模型的智能本质是什么基于海量数据的统计模式识别与生成系统，数据驱动的语言模拟系统，其价值在于高效处理文本任务（如写作、翻译、代码生成），而非真正的理解与创造大型语言模型（如GPT-4、Claude等）的智能本质可概括为基于海量数据的统计模式识别与生成系统，其核心能力源于对语言规律的深度学习，但缺乏真正的理解与意识。以下从本质特征、技术机制、典型案例及争议点展开分析：一、智能本质的核心特征统
计算机视觉算法实战——关键点检测
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.引言关键点检测（KeypointDetection）是计算机视觉领域中的一个重要研究方向，旨在从图像或视频中检测出具有特定语义信息的关键点。这些关键点通常代表了物体的特定部位或特征，例如人体的关节、面部特征点、车辆的轮子等。关键点检测在姿态估计、动作识别、目标跟踪、三维重建等任务中
复杂场景检测老翻车？陌讯算法实测提升 40% 2501_92453489 算法视觉计算机视觉视觉检测
在工业质检、安防监控等计算机视觉落地场景中，工程师常面临棘手问题：传统算法在光照突变、目标遮挡等复杂环境下，漏检率高达20%以上，泛化能力不足成为项目落地的最大阻碍。而陌讯AI视觉算法通过架构创新，正在重新定义复杂场景下的检测精度标准。技术解析：从单模态到多模态的跨越传统目标检测模型多依赖单一RGB图像输入，在特征提取阶段容易受环境干扰。以经典的FasterR-CNN为例，其区域提议网络（RPN）
深度学习超参数优化（HPO）终极指南：从入门到前沿
摘要：在深度学习的实践中，模型性能的好坏不仅取决于算法和数据，更在一半程度上取决于超参数的精妙设置。本文是一篇关于超参数优化（HyperparameterOptimization,HPO）的综合性指南，旨在带领读者从最基础的概念出发，系统性地梳理从经典到前沿的各类优化方法，并最终落地于实用策略和现代工具。无论您是初学者还是资深从业者，都能从中获得宝贵的见解。第一部分：夯实基础——HPO的核心概念1
工业大模型应用报告：新机遇、挑战与未来展望花生糖@ AIGC学习资料库大模型人工智能应用扩展屏应用开发 AI 机器学习
大模型在工业智能化发展中的新机遇、挑战与展望。以下是报告的核心内容概述：大模型为工业智能化发展带来新机遇大模型开启人工智能应用新时代，推动技术创新和应用。大模型有望成为驱动工业智能化的引擎，提高研发效率、拓展生产制造智能化应用边界、提升经营管理水平。大模型应用落地需要深度适配工业场景，解决行业知识和企业特定环境的理解问题。大模型和小模型在工业领域将长期并存小模型应用呈现倒U型分布，主要集中在生产制
AI时代的弯道超车之第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳 Hebron_Deb AI时代-弯道超车-逆袭人生人工智能
在这个AI重塑世界的时代，你还在原地观望吗？是时候弯道超车，抢占先机了！李尚龙倾力打造——《AI时代的弯道超车：用人工智能逆袭人生》专栏，带你系统掌握AI知识，从入门到实战，全方位提升认知与竞争力！内容亮点：AI基础+核心技术讲解职场赋能+创业路径揭秘打破信息差+预测行业未来第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳我们终于来到了第十七章，也是这本人物传记中该领域的最后一章。前面我们讲到了李飞飞
AI+Python赋能！长时序植被遥感动态分析全攻略：从物候提取到生态评估梦想的初衷~ 土壤植被遥感人工智能遥感植被土壤
在遥感技术与人工智能深度融合的2025年，AI大模型正重塑长时序植被遥感数据分析范式。从Landsat/Sentinel卫星数据的智能化去云处理，到MODIS植被产品的AI辅助质量控制，以ChatGPT、DeepSeeK为代表的大模型技术已成为提升遥感数据处理效率与精度的核心工具——尤其在长时序植被动态监测、物候期精准提取、时空变异归因分析及生态环境质量评估等领域，展现出传统方法难以企及的技术优势
认知革命牧羊少年的时间之旅
看完人类简史后产生了一个想法，人类经过几万年的演化从采集时代，农业社会，再到工业革命和最近的科技革命，每一次的演变升级都是对传统认知的一次革新。但是我们现在的科技发展是如此的迅速，但是认知的进步却非常缓慢。克隆人，基因设计，人工智能，生化科技，量子计算等很多领域都是传统文化所无法理解和接受的，但是这些却依然有条不紊在进行中。所以人类目前急需一次认知的革命才能追上科技的脚步，不然一定会造成认知和现实
深入TA-Lib：量化技术指标详解
深入TA-Lib：量化技术指标详解本文系统讲解TA-Lib技术指标分析，涵盖基础、数据处理、趋势与动量指标、均量线、布林线等，并结合Python代码与大数据、机器学习实战案例，助力读者掌握量化交易实战技巧。本文系统梳理了TA-Lib技术指标分析的核心内容，包括TA-Lib基础、数据处理、趋势与动量指标、均量线、布林线等关键技术指标分析方法，并结合Python代码示例与大数据、机器学习的融合实战案例
天文图像处理：星系分类与天体定位 xcLeigh 计算机视觉CV 图像处理分类人工智能 AI 计算机视觉
天文图像处理：星系分类与天体定位一、前言二、天文图像处理基础2.1天文图像的获取2.2天文图像的格式2.3天文图像处理的基本流程三、天文图像预处理3.1去噪处理3.2平场校正3.3偏置校正四、星系分类4.1星系的分类体系4.2基于特征提取的星系分类方法4.3基于深度学习的星系分类方法五、天体定位5.1天体坐标系统5.2基于星图匹配的天体定位方法5.3基于深度学习的天体定位方法六、总结与展望致读者一
深度学习——CNN（3）飘涯
前言：前面介绍了最基本的Lenet，下面介绍几种其他的网络结构CNN-AlexNet网络结构如下图：从图中可以看出，采用双gpu训练增加LRN归一化层：本质上，这个层也是为了防止激活函数的饱和的。采用dropout防止过拟合基于AlexNet进行微调，诞生了ZF-netCNN-GoogleNetGoogLeNet借鉴了NIN的特性，在原先的卷积过程中附加了11的卷积核加上ReLU激活。这不仅仅提升
AI 人工智能与 Copilot 的融合发展策略 AI天才研究院 AI人工智能与大数据人工智能 copilot ai
AI人工智能与Copilot的融合发展策略关键词：人工智能、Copilot、代码生成、人机协作、机器学习、自然语言处理、软件开发摘要：本文探讨了人工智能与Copilot技术的融合发展策略。我们将从技术原理、实现方法、应用场景等多个维度深入分析，提出一套完整的融合框架和发展路径。文章首先介绍背景和核心概念，然后详细讲解关键技术，包括自然语言处理、代码生成算法等，接着通过实际案例展示应用效果，最后讨论
AI 人工智能与 Copilot 碰撞出的火花 AI天才研究院 AI大模型企业级应用开发实战人工智能 copilot ai
AI人工智能与Copilot碰撞出的火花关键词：AI人工智能、Copilot、代码辅助、智能编程、人机协作、软件开发、技术创新摘要：本文深入探讨了AI人工智能与Copilot碰撞所产生的一系列效应。首先介绍了相关背景，包括目的、预期读者、文档结构和术语表。接着阐述了核心概念与联系，展示了其原理和架构的示意图及流程图。详细讲解了核心算法原理和具体操作步骤，并通过Python代码进行说明。同时给出了数
#Datawhale组队学习#7月-强化学习Task1 fzyz123 Datawhale组队学习强化学习人工智能 AI
这里是Datawhale组织的组队学习《强化学习入门202507》，Datawhale是一个开源的社区。第一章绪论1.1为什么要学习强化学习？强化学习（ReinforcementLearning,RL）是机器学习中专注于智能体（Agent）如何通过与环境交互学习最优决策策略的分支。与监督学习依赖静态数据集、无监督学习聚焦数据内在结构不同，强化学习的核心在于序贯决策：智能体通过试错探索环境，根据行动
微算法科技技术突破：用于前馈神经网络的量子算法技术助力神经网络变革 MicroTech2025 量子计算算法神经网络
随着量子计算和机器学习的迅猛发展，企业界正逐步迈向融合这两大领域的新时代。在这一背景下，微算法科技（NASDAQ:MLGO）成功研发出一套用于前馈神经网络的量子算法，突破了传统神经网络在训练和评估中的性能瓶颈。这一创新性的量子算法以经典的前馈和反向传播算法为基础，借助量子计算的强大算力，极大提升了网络训练和评估效率，并带来了对过拟合的天然抗性。前馈神经网络是深度学习的核心架构，广泛应用于图像分类、
微算法科技研究量子视觉计算，利用量子力学原理提升传统计算机视觉任务的性能
计算机视觉，作为人工智能领域的一个重要分支，致力于模拟人类视觉系统对图像或视频等视觉数据的理解与分析能力。它涵盖了图像识别、目标检测、图像分割等一系列复杂任务，广泛应用于自动驾驶、医疗影像分析、安防监控等多个领域。然而，随着数据规模的不断膨胀和任务复杂度的日益提升，传统计算机视觉算法在处理大规模、高维度数据时遇到了性能瓶颈。微算法科技(NASDAQ：MLGO)研究量子视觉计算，探索量子计算与经典卷
图机器学习（13）——图相似性检测
图机器学习（13）——图相似性检测0.前言1.基于图嵌入的方法2.基于图核的方法3.基于GNN的方法4.应用0.前言图机器学习(machinelearning,ML)方法能广泛应用于各类任务，其应用场景涵盖从药物设计到社交网络推荐系统等多个领域。值得注意的是，由于这类方法在设计上具有通用性，同一算法可用于解决不同问题。学习图之间相似性的定量度量是一个关键问题。事实上，这是网络分析的重要步骤，同时也
2022-12-29 聆听美好世界
由于导致耳鸣的原因很多，而且大部分耳鸣发生的机制医学界目前为止尚未研究清楚，导致目前耳鸣医治的效果不理想。耳鸣困扰着越来越多的患者，同样它也困扰着许多医生。导致一部分医生甚至认为耳鸣无法医治，这也必将导致患者对自己所患耳鸣的医治失去了信心。
vLLM快速入门：开启高效推理与部署之旅
在如今这个人工智能飞速发展的时代，语言模型的应用已经深入到我们生活的方方面面，从智能聊天机器人到文本生成工具，都离不开强大的语言模型技术支持。而vLLM作为一个专注于高效推理和部署的开源项目，正在为研究人员和开发人员提供一种全新的解决方案，让语言模型的使用变得更加便捷、高效。初识vLLM：背景与意义vLLM（VeryLargeLanguageModelInference）是一个专注于大型语言模型推
深入解析 vLLM 分布式推理与部署策略
在当今人工智能快速发展的时代，大型语言模型（LLM）的推理和部署面临着诸多挑战，尤其是当模型规模日益庞大时，如何高效地利用硬件资源成为关键问题。vLLM作为一种强大的工具，为分布式推理和部署提供了多种策略，本文将详细探讨其相关技术和应用场景，希望能对您提供有价值的参考。分布式推理策略的选择在开始分布式推理和部署之前，明确何时采用分布式推理以及可选的策略至关重要。1.单GPU推理：如果模型能够在单个
英伟达Triton 推理服务详解 leo0308 基础知识机器人 Triton 人工智能
1.TritonInferenceServer简介TritonInferenceServer（简称Triton，原名NVIDIATensorRTInferenceServer）是英伟达推出的一个开源、高性能的推理服务器，专为AI模型的部署和推理服务而设计。它支持多种深度学习框架和硬件平台，能够帮助开发者和企业高效地将AI模型部署到生产环境中。Triton主要用于模型推理服务化，即将训练好的模型通过
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）青云交大数据新视界 Java 大视界 java 大数据机器学习金融情绪指数投资决策量化策略情绪分析
Java大视界--Java大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）引言：正文：一、Java构建的金融市场情绪数据采集与预处理体系1.1多源异构数据接入引擎1.2数据采集延迟测试报告1.3情绪数据预处理管道二、Java驱动的金融市场情绪指数构建模型2.1多维度情绪指数计算框架2.2情绪指数与投资决策的映射模型三、Java在金融投资决策支持中的实战应用3.1量化私募情绪
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/