Y蓝田大海

Unknown-Aware Object Detection:Learning What You Don’t Know from Videos in the Wild(未知目标检测)CVPR 2022

最前面是论文翻译，中间是背景+问题+方法步骤+实验过程，最后是文中的部分专业名词介绍（水平线分开，能力有限，部分翻译可能不太准确）

摘要：

构建能够检测出分布外(OOD)对象的可靠的目标检测器至关重要，但尚未得到充分的研究。关键的挑战之一是，模型缺乏来自未知数据的监督信号，导致对OOD对象的预测过于自信。我们提出了一种新的未知感知目标检测框架，通过时空未知蒸馏(STUD)，从野生视频中提取未知对象，并有意义地规范化模型的决策边界。STUD首先在空间维度上识别未知的候选物体建议，然后将多个视频帧中的候选物体聚集起来，形成决策边界附近的多样化未知物体集。同时，我们采用了一种基于能量的不确定性正则化损失。它可以对比性地塑造内部分布和提炼的未知对象之间的不确定性空间。与之前的最佳方法相比，FPR95评分降低了10%以上。

1.引言

目标检测模型在已知的环境中已经取得了显著的成功。然而，他们经常与来自未知类的分布外(OOD)数据样本作斗争，网络在训练期间没有接触到这些数据，因此在测试中不应该被模型预测。教物体探测器识别未知物体对于建立可靠的视觉系统是至关重要的，特别是在安全关键的应用，如自动驾驶和医学分析。

虽然针对分类模型的OOD检测已经取得了很大的研究进展，但在目标检测方面的问题仍未得到充分的研究。与图像级OOD检测不同，检测未知对象需要对复杂场景有更细粒度的理解。在实践中，一个图像可以在特定区域是OOD，而在其他地方是分布中In-distribution (ID)。以自动驾驶为例，我们观察到一个训练来识别ID对象(如汽车、行人)的目标检测模型可以对一个看不见的对象(如鹿)产生高置信度的预测;见图1 (a)。当我们的目标检测器将其训练错误最小化而没有明确地考虑训练类别之外可能出现的不确定性时，就会发生这种情况。不幸的是，太多未知的方式在一个开放的世界中，可以出现无数的物体。它是在复杂的场景中注释大量的OOD对象是非常昂贵的—除了已经非常昂贵的ID数据收集过程。

（a）过度自信的预测（b）视频中的未知对象

图1. (a) Vanilla物体检测器可以预测OOD物体（如鹿）为ID类（如行人），并具有很高的可信度。(b) 未知物体（在边界框内）自然存在于视频数据集中自然存在，如广告牌、交通锥、天桥、路灯等。灯，等等。图片取自BDD100K数据集。

在本文中，我们提出了一种新的未知感知目标检测框架，通过时空未知蒸馏(STUD)，从野外视频中提取未知对象，并有意义地正则化模型的决策边界。视频数据自然地捕获了模型运行的开放世界环境，并封装了已知和未知对象的混合物;见图1 (b)。例如，建筑和树木(OOD)可能出现在驾驶视频中，尽管它们没有明确标记用于训练车辆和行人的物体检测器(ID)。我们的方法类似于化学中的蒸馏概念，是指“从混合物中分离物质的过程”。虽然经典的目标检测模型主要使用标记的已知对象进行训练，我们试图通过联合优化目标检测和OOD检测性能，利用未知的模型正则化。

具体地说，我们的框架由两个部分组成，解决的挑战是(1)从视频中提取不同的未知对象，(2)用提取的未知对象正则化目标检测器。为了解决第一个问题，我们引入了一种新的时空未知提取方法，它可以自动构造各种未知对象(3.1节)。在空间维度上，对于一帧中的每个ID对象，我们基于OOD测量来识别参照系中的未知候选对象。然后，我们通过线性组合选定的目标在特征空间，加权提取未知目标通过差异度量。因此，与使用单个对象相比，提取的未知对象在多个对象上捕获了更多样化的分布。在时间维度上，我们提出从多个视频帧中聚集未知对象，从而获得额外的多样性时间维度上的未知。

利用提取出来的未知对象，我们进一步使用一个未知感知的训练目标(第3.2节)。与普通的目标检测不同，我们用不确定性正则化分支训练目标检测器。我们的正则化有助于学习ID和OOD对象之间更保守的决策边界，这有助于在推断期间标记不可见的OOD对象。为了实现这一点，正则化对比地塑造了不确定面，这为ID对象产生了更大的概率分数，反之亦然，使测试中有效的OOD检测成为可能。我们的主要贡献总结如下:

我们提出了一个新的框架STUD，解决了未知感知目标检测的一个具有挑战性的问题。据我们所知，我们是第一个利用视频中丰富的信息来实现OOD识别的目标检测模型。

STUD通过在空间和时间维度上提取不同的未知对象，而无需昂贵的OOD对象人工注释，从而有效地规范化目标检测器。此外，我们表明STUD比在高维像素空间合成未知量(例如，使用GAN)或使用负建议作为未知量更有优势。

我们在大规模BDD100K和Youtube-VIS数据集上广泛评估了拟议的STUD。STUD获得了最先进的结果，在很大程度上超过了最佳基线(FPR95在BDD100K上为10.88%)，同时保持了对ID数据目标检测的准确性。

2. 问题设置

我们首先为目标检测任务制定OOD检测问题。大多数以前的OOD检测公式将整个图像视为异常，这可能会导致如图1(a)所示的模糊性。特别是，自然图像不是单一的实体，而是由许多对象和组件组成的。知道图像的哪些区域是异常的，可以安全处理不熟悉的物体。与图像级OOD检测相比，对象级OOD检测在现实感知系统中更相关，但也更具有挑战性，因为它需要在细粒度对象级上推理OOD的不确定性。我们设计了可靠的目标检测器，可以在测试中识别未知OOD对象。也就是说，在ID类别(如汽车、卡车)上训练的目标检测器可以识别不属于训练类别的测试时对象(如鹿)，并且不能对它们做出自信的预测。

设置。我们分别用X=rd和Y={1,2，…，K}表示输入和标签空间。让x∈ X是输入图像，b∈ R 4是与图像中的对象相关联的边界框坐标，y∈ Y是对象的语义标签。在从未知联合分布P中提取的ID数据D={（x i，b i，y i）}M i=1上训练目标检测模型。我们使用带参数θ的神经网络来建模边界盒回归Pθ（b | x）和分类Pθ（y | x，b）。

面向目标检测用于目标检测。OOD检测可以表述为一个二元分类问题，区分分布内和分布外的对象。设px表示X上的边际概率分布。给定测试输入X∗ ∼ P X以及对象b∗ 由目标检测器预测，目标是预测pθ（g | x∗ ,b∗ )。我们使用g=1表示检测到的对象是ID，g=0表示OOD，语义不支持Y。

3.未知感知目标检测

我们的未知感知目标检测框架与面向对象不确定性正则化分支一起训练目标检测器。两者共享特征提取器和预测头，并从头开始联合训练（见图2）。我们的框架包含两个新的组件，它们涉及：（1）如何在空间和时间维度提取各种未知对象（第3.1节），以及（2）如何利用未知对象进行有效的模型正则化（第3.2节）。

图2. 拟议的未知物体检测框架STUD概述。对于一个来自关键帧的ID对象编码为 ˆ h(x 0 ,b i )，我们进行能量过滤，以识别参考帧中的未知对象候选者。然后，我们通过线性组合特征空间中的未知对象来提炼出未知对象ô i，并以异同得分s i,j加权。蒸馏出来的未知物体和ID物体一起被用来训练不确定性正则化分支（L uncertainty ）。L不确定性对比性地塑造了不确定性表面，对ID对象产生较大的分数，反之亦然。在测试过程中，我们使用逻辑回归的输出进行OOD检测。⊗表示方程（3）中的运算，1≤k≤T是参考框架的索引。

3.1时空未知蒸馏

我们的方法是在视频中丰富的时空信息的引导下提取未知对象，没有未知对象的明确监督信号。视频数据自然地封装了已知和未知对象的混合物。虽然经典的目标检测模型主要使用标记的已知对象进行训练，但我们试图利用未知对象进行模型正则化。因此，我们将我们的方法称为未知蒸馏，即用已知对象来提取未知对象。值得注意的是，我们的目标检测蒸馏过程是在目标级别执行的，而不是构造图像级别的异常值。也就是说，对于给定帧中的每个ID对象，我们构造了相应的OOD对应项。提取的未知数将用于模型正则化（第3.2节）。

虽然直觉很简单，但在以无监督的方式构造未知对象方面存在挑战。未知物体在高维空间中出现的方式数不胜数。以ID对象汽车为例（c.f.图3），广告牌、树木、建筑物等对象都可以被视为汽车的未知数。这不必要地增加了样本的复杂性，并要求观察各种未知对象。我们通过利用视频的时空维度中的丰富信息来提取各种未知对象来应对这一挑战。

空间未知蒸馏。在空间维度上，对于给定帧中的每个ID对象，我们通过参考帧中的对象特征的线性组合，通过相异性度量加权，创建未知的对应对象。与使用单个对象相比，使用多个对象捕获的未知量分布更为多样。STUD对提案生成器的特征输出进行操作，以计算相异性。具体来说，我们考虑时间戳t 0和t 1处的一对帧x 0、x 1，分别指定为关键帧和参考帧。对于对象（x，b），我们将其特征表示为h（x，b）∈ R m，其中m是特征尺寸。我们收集了一组对象特征{h（x 0，b i）}N 0i=1和{h（x 1，b j）}N 1 j=1，客观评分高于阈值。我们使用L 2采用相异性测量两个特征之间的距离：

其中ˆh（x 0，b i）和ˆh（x 1，b j）是由使用对象特征h（x，b）作为输入的小型网络获得的编码特征向量。在我们的实验中，编码器由两个内核大小为3×3的卷积层和一个平均池层组成。s i，j越大，物体特征越不相似。相异性测量结果如图3所示。参考框架中的OOD对象，如路灯和广告牌，具有更显著的差异。

最后，我们对x 1帧中的对象特征进行加权平均。使用多个对象捕获未知量的不同分布。权重α定义为不相似性得分的归一化指数：

其中ôi是提取的未知对象（在特征空间中），对应于第x 0帧处的第i个对象。

时间未知蒸馏。我们的空间未知提取机制在单个参考帧上运行，该参考帧可以扩展到多个视频帧，以捕获时间维度中未知量的额外多样性。例如，假设一个汽车在高速公路上行驶的视频，我们观察到的帧越多，可以观察到的未知对象就越多，例如树木、建筑物和岩石。

给定时间戳为t 0的帧x 0，我们建议从多个帧x 1，…，x t中提取未知对象。我们在[t 0]范围内随机采样t帧−R、 t 0+R]。作为特例，T=1减少到先前的pairframe设置。为了提取时空未知对象，我们将T帧中的对象特征向量串联起来，然后通过等式（1）测量它们与x 0帧中的对象的相异性。对于第x 0帧中的第i个对象，未知对应物定义如下：

其中，αi，j表示等式2中定义的归一化不相似性分数。N=P T k=1 N k是跨越T个参考帧的对象总数。时间聚合机制允许在多个帧中搜索有意义和多样的未知发现。

在第4.3节的后面，我们对帧采样范围R和选定帧的数量T进行了全面的烧蚀研究，并展示了时间聚集对改进的OOD检测的好处。

未知候选对象选择。未知提取的一个关键步骤是过滤参考坐标系x 1中的未知量，这些未知量可能是ID对象或简单背景。如果没有选择，模型可能会被混淆，从而将提取出的未知对象从ID对象中分离出来，或者在训练过程中快速记忆简单的OOD模式。为了防止这种情况，我们基于能量分数对提议进行预过滤，然后将选定的提议用于时空未知蒸馏。结果表明，能量分数是图像分类中面向对象数据的有效指标[36]。为了计算目标检测网络的能量分数，我们将目标特征{h（x 1，b j）}N 1 j=1馈送到预测头，并遵循以下定义：

式中，f k（h（x 1，b j）；w pred）是kway分类分支的logit输出。能量越高，则表示能量越大，反之亦然。然后，我们选择能量分数较低的对象，即在特定百分比p%的对象≤ 秩（E（x 1，b j））/N 1≤ 所有对象中的q%。在多个帧x 1，x 2，…，x T的情况下，在时间聚集之前对每个单独的帧执行对象选择。烧蚀研究能量过滤和第4.3节提供了选择百分比。

3.2未知意识训练目标

利用第3.1节提取的未知对象，我们现在介绍未知感知目标检测的训练目标。我们的关键思想是在正则化模型的同时执行目标检测任务，以产生ID对象的低不确定性分数，以及高的不确定性分数未知项的不确定性分数。总体目标函数定义为：

其中，β是结合检测损失L det和不确定性正则化损失L不确定性时的标度权重。接下来，我们描述L不确定性的细节。

不确定性正则化。继Du等人之后，我们采用了一个损失函数，对比塑造了不确定性表面，放大了已知ID对象和未知OOD对象之间的可分性。为了测量不确定性，我们使用等式（4）中的能量分数，该分数来自分类分支的输出。在这里，我们计算ID对象和提取的未知对象特征E（ô）的能量分数E（x，b）。然后将不确定性分数传递到具有权重系数θu的logistic回归分类器，该分类器预测ID对象（x，b）的高概率和未知对象的低概率。正则化损失计算如下：

其中O包含所有未知物体特征（c.f.第3.1节）。在图4（a）中，我们显示了Youtube VIS数据集上训练过程中的不确定性正则化损失。收敛后，图4（b）显示了ID和提取的未知对象的能量分数分布。这表明STUD正确收敛，能够分离提取的未知对象和ID对象。

图4. (a) 训练期间的不确定性正则化损失。(b) 训练后ID和提炼的未知物体的负能量得分分布。

与普通目标检测器的L det相比，我们的损失旨在帮助学习ID和OOD对象之间更保守的决策边界，这有助于在测试中标记未看到的OOD对象。我们继续描述测试时OOD检测过程。

测试时间OOD检测。在推理过程中，我们使用logistic回归不确定性分支的输出进行OOD检测。特别是，给定测试输入x∗ , 物体检测器产生盒子预测b∗ . 预测对象的不确定性分数（x∗ ,b∗ ) 由以下公式得出：

对于OOD检测，我们使用通用阈值机制来区分ID和OOD对象：

通常选择阈值γ，以便正确分类高比例的ID数据（例如95%）。对于分类为ID的对象，可以像往常一样使用预测头获得边界框和类预测。我们的方法研究总结在算法1中。

未知蒸馏和对比正则化之间的协同作用。STUD未知蒸馏（第3.1节）和对比正则化（第3.2节）的两个关键组件协同工作。首先，一组提取良好的未知对象可以改进基于能量的对比正则化，并帮助学习已知和未知对象之间更准确的决策边界。其次，由于对比不确定性损失扩大了已知对象和未知对象之间的能量差距，未知蒸馏模块可以受益于更准确的未知对象选择（通过基于能量的滤波）。当这两个部分的表现令人满意时，整个训练过程收敛。我们在第4节中的实验进一步证明了我们的框架的有效性。

4、实验

在本节中，我们提供了实证证据，以证明研究在两个大规模视频数据集上的有效性（第4.1节）。我们在第4.2节中表明，在检测OOD数据方面，STUD优于其他常用的OOD检测基线。第4.3节和第4.4节介绍了STUD的消融研究和定性分析。

4.1基准建设

数据集。我们使用两个大规模视频数据集作为ID数据：BDD100K和Youtube视频实例分割（Youtube VIS）2021。对于这两项任务，我们在两个包含不同视觉类别的OOD数据集上进行评估：MS-COCO和nuImages。我们仔细执行重复数据消除，以确保ID和OOD数据之间没有语义重叠。附录中描述了有关数据集的详细信息。

实施细节。我们采用更快的R-CNN作为基本目标检测器。我们使用Detectro2库，并使用ResNet-50[15]主干和默认超参数进行训练。对于BDD100K，我们将L不确定性的权重β设置为0.05，对于Youtube VIS数据集，我们将其设置为0.02。对于这两个数据集，我们使用T=3帧，并将采样范围R=9。我们将能量过滤的百分数设定为所有提案中的40%-60%。第4.3节详细介绍了不同超参数的烧蚀研究。

度量。为了评估OOD检测性能，我们报告：（1）当ID样本的真阳性率为95%时，OOD样本的假阳性率（FPR95）；（2）接收器工作特性曲线下的面积（AUROC）。为了评估ID任务上的目标检测性能，我们报告了mAP的通用度量。

4.2与基线的比较

STUD建立SOTA性能。在表1中，我们将STUD与文献中有竞争力的OOD检测方法进行了比较，其中STUD在两个数据集上都显著优于基线。为了公平比较，所有方法都使用相同的ID训练数据，使用相同的历元数进行训练。我们的综合基线包括最大Softmax概率[17]、ODIN[33]、Mahalanobis距离[31]、广义ODIN[20]、能量分数[36]、Gram矩阵[54]和最新方法CSI[59]。这些基线依赖于分类输出或主干特征，因此可以在目标检测模型上无缝评估。

表1. 主要结果。与竞争性分布外检测方法的比较。所有基线方法都是基于一个模型使用ResNet-50作为主干，仅对ID数据进行训练。↑表示数值越大越好，↓表示数值越小越好。所有值都是百分比。粗体数字是卓越的结果。我们报告了在三次运行中估计的标准偏差。训练时间是在 "成本 "一栏中报告了四个NVIDIA GeForce RTX 2080Ti GPU的训练时间。

结果表明，考虑到大多数基线依赖于仅基于ID数据训练的目标检测模型，而不受未知对象的正则化，因此STUD可以优于这些基线。这种训练方案容易对OOD数据产生过度自信的预测（图1），而STUD结合未知对象以更有效地正则化模型。

我们还与基于GAN的方法进行了比较，用于在像素空间中合成异常值，其中，在BDD100K（COCO作为OOD）上，STUD有效地将OOD检测性能（FPR95）提高了15.77%，在Youtube VIS（nuImages作为OOD）上提高了17.66%。此外，我们在表1中表明，在保持ID数据（通过mAP测量）的高目标检测精度的同时，STUD实现了更强的OOD检测性能。这与CSI相反，CSI显示出显著的退化，Youtube VIS上的地图减少了1.2%。复制基线的详细信息见附录D节。

4.3消融研究

本节提供了全面的消融研究，以了解STUD的效果了一致性，所有消融均在BDD100K数据集上进行，使用ResNet-50作为主干。有关使用不同主干架构的更多信息，请参阅附录E节。

不同未知蒸馏方法的烧蚀。我们将STUD与三种未知蒸馏方法进行了比较，即，（一）使用没有时空聚集的独立对象，（II）合成像素空间中的未知数，（III）使用噪声作为未知量。

对于I型，我们利用参考框架中的对象，而不在空间和时间维度上聚合多个对象，这是与STUD的关键区别。未知对象可以通过以下方式构建：使用参考框架中差异最大的对象，使用随机对象，使用[23]中的负数对象。以及使用参考框架中能量得分较低的对象（百分位数40%-60%）。

对于第二类，我们考虑了基于GAN的[30]和基于mixup的的方法。对于[30]，合成图像中的物体的分类输出被强制为更接近于均匀分布。对于mixup，我们使用Beta(1)的β分布，并在参考帧的像素空间内插值ID对象。

对于第三类，我们在ID对象上添加固定的高斯噪声，以创造未知的对象特征。

结果总结在表2中，其中STUD优于其他方法。由于生成的未知数要么缺乏多样性（例如，使用相异性最大的对象或能量适中的对象），要么过于简单，无法有效地正则化ID和OOD之间的决策边界（例如，使用负或负）随机对象）。在像素空间中合成未知数(♣) 不稳定（GAN）或对目标检测性能有害（混合）。最后，作为未知数的高斯噪声相对简单，并不优于STUD。

表2. 不同的未知蒸馏方法的消融（以ResNet-50为骨干，COCO/nuImages为OOD数据）。

烧蚀对候选对象选择的影响。表3研究了基于能量分数过滤未知对象的重要性。我们通过删除过滤或使用不同的过滤百分比来对比性能（c.f.第3.1节）。在参考帧中使用能量分数较低的对象表现最好。该策略以适当的难度提取未知对象，在对比不确定性正则化过程中有效。

表3. 能量过滤模块的消融研究。这里我们设定T=3，R=9。

我们的空间-时间未知数蒸馏需要将T个参考帧中的物体连接起来。我们消除了在不同时间范围内随机选择T个框架对关键框架的影响，由采样范围R来调节。我们观察到，OOD检测得益于使用与关键帧略微接近的参考帧。这一趋势在COCO和nuImages OOD数据集上是一致的。更大的采样范围意味着更多的不同场景，导致相对更容易的未知数被提炼出来。当R变成无穷大时，STUD从整个视频中随机取样，在这种情况下，提炼未知数的效果要差得多，AUROC明显下降（从COCO的85.67%下降到80.35%）。

我们对比了不同参考帧数T下的性能，并在图5（c）-（d）中报告了OOD检测结果。这种消减表明，STUD确实从跨时间维度的多帧物体的聚集中获益。例如，与T=1相比，在BDD100K上训练的T=3的模型实现了5.24%的AUROC改善（COCO作为OOD）。这突出了多帧的时间提炼的重要性。然而，较大的T损害了OOD的检测性能。我们假设这是因为在未知蒸馏过程中使用了许多冗余的物体特征。

图5. (a)-(b) 对取样范围R的消融研究。我们的范围从3到无穷大。衡量标准是AUROC。(c)-(d) 在未知蒸馏过程中对参考帧数T的消融研究。我们固定采样范围为R=9。

对不确定性正则化权重β的消融。表4报告了当我们改变L不确定性的权重β时的OOD检测结果。该模型在COCO和nuImages数据集上都被评估为OOD。结果表明，一个温和的权重是可取的。在大多数情况下。STUD在AUROC方面优于表1中的基线OOD检测方法。

表4。不确定性正则化损失的权重β烧蚀研究。在这种情况下，我们设置T=3，R=9。

对不确定的损失进行消融。我们对L不确定性的三种选择进行消减：(1)使用平方铰链损失，(2)在分类分支中将未知数分类为额外的K+1类，(3)去除L不确定性中的权重θ u。表5总结了这一比较。与铰链损失相比，我们的逻辑损失将AUROC提高了11.35%（COCO为OOD）。此外，将蒸馏出的未知数作为一个额外的类别，增加了对象分类的难度，这也没有超越其他的表现。此外，可学习的权重θ u调节了logistic函数的斜率，这使得学习一个更尖锐的二元决策边界以实现最佳的ID-OOD分离。这种消融证明了STUD所采用的不确定性损失的优越性。

表5.不确定性正则化损失的烧蚀研究。

4.4定性分析

这里我们进一步介绍对实例级OOD检测结果的定性分析。在图6中，我们可视化了对几张OOD图像的预测，使用没有蒸馏过的未知物体（顶部）和有STUD（底部）训练的物体检测模型。ID数据为BDD100K。与普通的物体检测器相比，STUD在识别OOD物体（绿色）方面表现得更好，并减少了检测到的物体中的假阳性。此外，STUD的假阳性物体的置信度得分低于虚构模型（例如，第三列中的岩石）。

图6. 通过vanilla Faster-RCN（顶部）和STUD（底部）在OOD图像（来自MS-COCO和nuImages）上检测物体的可视化。ID为BDD100K数据集。蓝色。OOD物体被分类为ID类之一。绿色。由STUD检测的OOD对象。探测到的对象中，减少假阳性。更多的可视化内容见附录F部分。

5、相关工作

用于分类的OOD检测大致可分为事后检测、基于生成的方法和基于离群点暴露（OE）的方法。对于事后方法，softmax置信度得分是一个常见的基线，对于OOD输入来说，它可以是任意高的。已经提出了一些改进方法，如ODIN、Mahalanobis、能量得分、Gram矩阵得分和GradNorm得分。离群点暴露方法利用自然图像或由GANs合成的图像进行正则化。然而，真正的离群点数据很难获得，特别是对于物体检测。相比之下，STUD从视频中自动提炼出未知数，这使其具有更大的灵活性。生成模型直接估计ID密度，这使它们成为OD检测的自然替代方案。然而，与基于判别的方法相比，它们通常没有竞争力，而且通常更难优化。最近，Sun等人表明，一个简单的激活整顿策略，即ReAct，可以显著提高测试时间的OOD检测。关于不同的事后检测方法的理论理解OOD检测方法的理论理解见[44]。[56,59] 应用自我监督学习进行OOD检测，我们在第4.2节进行了比较。

用于物体检测的OOD检测目前还没有得到充分的探索。Du等人提出在特征空间中合成虚拟离群点以实现有效的模型正则化，并证明了OOD检测在物体检测方面的前景。本文中，STUD专注于借助视频进行OOD检测，并采用了一种未知的训练损失。此外，[23]使用负面的物体作为未知样本，正如我们在表2中显示的那样，这是次优的。Harakeh等人专注于定位分支的不确定性估计，而不是分类问题的OOD检测。有几项工作使用了近似的贝叶斯方法，如MC-Dropout用于OOD检测。他们需要多个推理过程来生成不确定性分数，这在较大的数据集和模型上计算成本很高。对较大的数据集和模型来说是昂贵的。

开放世界的物体检测包括OOD泛化、零照物体检测和增量物体检测等。一般来说，他们开发了缓解灾难性遗忘的措施，或者使用辅助信息，如类属性，来对未见过的数据进行目标检测——这两点都与我们的OOD检测重点不同。Wang等人在循环前进步骤中采用了异同度测量，但他们的重点是OOD泛化（标签空间保持不变）而不是OOD检测。此外，它没有考虑聚合多帧的时间信息。

视频异常检测（VAD）旨在通过骨架轨迹建模、弱监督学习、注意力、时间姿态图、自我监督学习和自动编码器等技术来识别对象层面和帧层面的异常事件。与STUD相比，VAD中的异常点不一定与ID训练数据有不同的语义。此外，这些方法都没有考虑在视频或基于能量的模型正则化的帮助下合成未知数。

6、结论

在本文中，我们提出了STUD，一个用于OOD检测的未知目标检测框架。STUD通过利用视频中丰富的时空信息，在训练期间提炼出不同的未知物体。经过提炼的未知物体有意义地改善了ID和OOD数据之间的决策边界，从而在保留ID任务性能的同时获得了最先进的OOD检测性能。我们希望我们的工作将激励未来的研究，在现实世界的环境中实现未知的深度学习。

背景:

1.构建能够检测出分布外(OOD)对象的可靠的目标检测器至关重要，但尚未得到充分的研究。关键的挑战之一是，模型缺乏来自未知数据的监督信号，导致对OOD对象的预测过于自信。

2.针对分类模型的OOD检测已经取得了很大的研究进展，在目标检测方面的问题仍未得到充分的研究。

问题:

模型缺乏来自未知数据的监督信号，导致对OOD对象的预测过于自信,（比如自动驾驶时将鹿自信的识别为人）, OOD目标太多，标记价格昂贵。

OOD预测过于自信原因：目标检测器最小化训练误差却没有明确考虑训练类别之外出现的不确定性。

方法：

我们提出了一种新的未知感知目标检测框架，通过时空未知蒸馏(STUD)，①通过在空间和时间维度上从野外视频提取（蒸馏）未知对象，②用不确定性正则化分支训练目标检测器，有意义地规范了模型的决策边界。③试图通过联合优化目标检测和OOD检测性能用于模型正则化。

整体：框架+损失函数。框架由两个部分组成，解决的挑战是1.从视频中提取不同的未知对象,2.用提取的未知对象正则化目标检测器。

挑战1解决办法：引入了一种新的时空未知提取方法，从空间和时间两个维度自动构造各种未知对象。

挑战2解决办法：进一步使用未知感知的训练目标。与普通的目标检测不同，我们用不确定性正则化分支训练目标检测器。

损失函数：由于对比不确定性损失扩大了已知对象和未知对象之间的能量差距，未知蒸馏模块可以受益于更准确的未知对象选择（通过基于能量的滤波）

步骤：

我们的未知感知目标检测框架与面向对象不确定性正则化分支一起训练目标检测器。两者共享特征提取器和预测头，并从头开始联合训练。我们的框架包含两个新的组件，它们涉及：（1）如何在空间和时间维度提取各种未知对象以及（2）如何利用未知对象进行有效的模型正则化。

对于一个来自关键帧的ID对象编码为 hˆ (x 0 ,b i )，我们进行能量过滤，以识别参考帧中的未知对象候选者。然后，我们通过线性组合特征空间中的未知对象来提炼出未知对象ô i，并以异同得分s i,j加权。蒸馏出来的未知物体和ID物体一起被用来训练不确定性正则化分支（L uncertainty ）。L uncertainty对比性地塑造了不确定性表面，对ID对象产生较大的分数，反之亦然。在测试过程中，我们使用逻辑回归的输出进行OOD检测。⊗表示方程（3）中的运算，1≤k≤T是参考框架的索引。

采用相异性测量两个特征之间的距离， hˆ（x 0，b i）和ˆh（x 1，b j）是由使用对象特征h（x，b）作为输入的小型网络获得的编码特征向量

在空间维度上，对于给定帧中的每个ID对象，我们通过参考帧中的对象特征的线性组合，通过相异性度量加权，创建未知的对应对象

我们对x1帧中的对象特征进行加权平均。使用多个对象捕获未知量的不同分布。权重α定义为不相似性得分的归一化指数

其中ôi是提取的未知对象（在特征空间中），对应于第x 0帧处的第i个对象。

空间未知提取机制在单个参考帧上运行，该参考帧可以扩展到多个视频帧。

αi，j表示等式2中定义的归一化不相似性分数。N=P T k=1 N k是跨越T个参考帧的对象总数。时间聚合机制允许在多个帧中搜索有意义和多样的未知发现。

未知候选对象选择。基于能量分数对提议进行预过滤，然后将选定的提议用于时空未知蒸馏。

能量分数是图像分类中面向对象数据的有效指标。为了计算目标检测网络的能量分数，我们将目标特征{h（x 1，b j）}N 1 j=1馈送到预测头，并遵循式子定义：

f k（h（x 1，b j）；w pred）是kway分类分支的logit输出。能量越高，则表示能量越大，反之亦然。

总体目标函数定义为越高，则表示能量越大，反之亦然。

不确定性正则化。我们采用了一个损失函数，对比塑造了不确定性表面，放大了已知ID对象和未知OOD对象之间的可分性。为了测量不确定性，我们使用等式（4）中的能量分数，该分数来自分类分支的输出。在这里，我们计算ID对象和提取的未知对象特征E（ô）的能量分数E（x，b）。然后将不确定性分数传递到具有权重系数θu的logistic回归分类器，该分类器预测ID对象（x，b）的高概率和未知对象的低概率。正则化损失计算如下：

O包含所有未知物体特征

使用logistic回归不确定性分支的输出进行OOD检测。特别是，给定测试输入x∗ , 物体检测器产生盒子预测b∗ 。预测对象的不确定性分数（x∗ ,b∗ ) 由以下公式得出：

对于OOD检测，我们使用通用阈值机制来区分ID和OOD对象：

你可能感兴趣的:(读论文,目标检测,计算机视觉)

Redis分片集群原理
1.为何需要分片集群？让我们先快速回顾一下Redis扩展的演进过程：单机Redis：最简单，但也最受限于服务器的物理资源（CPU、内存、网络带宽）。一旦宕机，服务完全中断。主从复制：通过设置一个主节点和多个从节点，实现了读写分离，提高了读并发能力，并提供了数据冗余以应对主节点故障。但所有数据仍存储在主节点上，内存容量和写性能依然受限于单个服务器，无法无限扩展。当业务数据量达到数十GB甚至TB级别，
2024年11月架构设计师论文真题回顾，附参考解答、解析及所涉知识点（一）一几文架构系统架构系统架构设计师软考高级 IT考证
软考高级系统架构设计师考试包含三个科目：信息系统综合知识、案例分析和系统架构设计论文。考试形式为机考。本文主要回顾2024年下半年(2024-11-10)系统架构设计师考试下午论文的题目，同时附带参考解答、解析和所涉知识点。综合知识2024年11月架构设计师综合知识真题回顾，附参考答案、解析及所涉知识点（一）2024年11月架构设计师综合知识真题回顾，附参考答案、解析及所涉知识点（二）2024年1
202505架构师论文《论静态负载均衡策略设计和应用》文琪小站系统架构师软考论文负载均衡运维软考论文
软件架构师论文范文系列摘要在当今高度依赖信息技术的时代，构建高性能、高可用的分布式系统已成为必然趋势。负载均衡作为分布式系统中的关键技术，旨在将请求或数据有效地分发到多个处理单元，以优化资源利用率、提升系统吞吐量并确保服务的稳定运行。本文深入探讨了静态负载均衡策略的设计原理、技术特点及其在实际项目中的应用。首先，概述了负载均衡的整体概念及静态策略的分类，重点介绍了基于哈希、轮询和权重等静态算法的实
YOLO学习笔记｜从YOLOv5到YOLOv11：技术演进与核心改进北斗猿 YOLO学习从零到1 YOLO 目标检测算法 python 计算机视觉
从YOLOv5到YOLOv11：技术演进与核心改进深度解析一、YOLO系列发展概述YOLO（YouOnlyLookOnce）目标检测算法自2016年诞生以来，凭借其"单次检测"的独特理念和卓越的实时性能，持续引领着计算机视觉领域的技术革新。从JosephRedmon的初代YOLO到AlexeyBochkovskiy的YOLOv4，再到Ultralytics团队的YOLOv5及后续系列，这一算法家族
mediapipe流水线分析三江太翁 Android NDK 人工智能 mediapipe android
目标检测Graph一流水线上游输入处理1TfLiteConverterCalculator将输入的数据转换成tensorflowapi支持的TensorTfLiteTensor并初始化相关输入输出节点，该类的业务主要通过interpreterstd::unique_ptrtflite::Interpreterinterpreter_=nullptr;实现类完成数据在cpu/gpu上的推理1.1Tf
【论文笔记】RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation AustinCyy 论文笔记论文阅读
论文信息论文标题：RAGLAB:AModularandResearch-OrientedUnifiedFrameworkforRetrieval-AugmentedGeneration-EMNLP24论文作者：XuanwangZhang-NanjingUniversity论文链接：https://arxiv.org/abs/2408.11381代码链接：https://github.com/fat
【超分辨率（Super-Resolution）】关于【超分辨率重建】专栏的相关说明，包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等十小大超分辨率重建（理论+实战科研+应用）超分辨率重建人工智能图像处理深度学习计算机视觉图像超分 pytorch
文章目录专栏简介专栏亮点适配人群相关说明关于答疑环境配置超分理解实现流程文章目录基础知识三个常用的SR框架数据集相关可解释性（论文中的可视化说明）图像超分（ImageSuper-Resolution）经典超分（ClassicalSR）任意尺度超分（Arbitrary-ScaleSR）高效/轻量化超分（Efficient/LightweightSR，ESR）盲超分/真实世界图像超分辨率（Blind/
【图像超分】论文复现：密集残差链接Transformer！DRCT的Pytorch源码复现，跑通超分源码，获得指标、模型复杂度、结果可视化，核心模块拆解与源码对应，注释详细！十小大超分辨率重建（理论+实战科研+应用）pytorch 深度学习超分辨率重建图像处理计算机视觉 python transformer
请先看【专栏介绍文章】：【超分辨率（Super-Resolution）】关于【超分辨率重建】专栏的相关说明，包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等）完整代码和训练好的模型权重文件下载链接见本文底部，订阅专栏免费获取！本文亮点：跑通DRCT源码，获得与论文一致的PSNR/SSIM、Params、超分可视化结果，修正论文中FLOPs的计
系统架构设计师论文分享-论软件架构复用
我的软考历程摘要2023年2月，我所在的公司通过了研发纱线MES系统的立项，该项目为国内纱线工厂提供SAAS服务，旨在提升纱线工厂的数字化和智能化水平。我在该项目中担任架构设计师，负责该项目的架构设计工作。本文结合我在该项目中的实践，详细论述了软件架构复用的实现过程。软件架构复用可以有效降低成本，提高开发速度和质量属性，架构复用方法的步骤分为三个过程：可复用资产的获取、架构复用的管理、架构复用的使
系统架构设计师论文分享-论软件体系结构的演化
我的软考历程摘要2023年2月，我所在的公司通过了研发纱线MES系统的立项，该系统为国内纱线工厂提供SAAS服务，旨在提高纱线工厂的数字化和智能化水平，我在该项目中担任架构设计师，负责该项目的架构设计工作。本文结合我在该项目中的实践，详细论述了软件体系结构的演化。系统上线后，为了满足新需求和适应新场景，就必须修改原有软件架构。在软件架构演化过程中遵循以下原则：演化适应新技术、有利于重构和重用、影响
系统架构设计师论文分享-论单元测试方法及其应用码农卿哥系统架构设计师系统架构单元测试
我的软考历程摘要2023年2月，我所在的公司做了开发纱线MES系统的决定，该系统为国内纱线工厂提供SAAS服务，旨在提高纱线工厂的智能化和数字化水平。我在该项目中被任命为系统架构设计师，全面掌管该项目的架构设计工作。本文将结合我在该项目中的架构设计工作经验，详细介绍如何把单元测试方法应用在项目中。在该项目中，我们采用了多种单元测试方法，包括静态测试和动态测试。静态测试在不运行程序的情况下，通过代码
初始CNN(卷积神经网络) 超龄超能程序猿机器学习 cnn 人工智能神经网络
卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）作为深度学习的重要分支，在图像识别、目标检测、语义分割等领域大放异彩。无论是手机上的人脸识别解锁，还是自动驾驶汽车对道路和行人的识别，背后都离不开CNN的强大能力一、CNN诞生的背景与意义在CNN出现之前，传统的图像识别方法主要依赖人工提取特征，例如使用SIFT（尺度不变特征变换）、HOG（方向梯度直方图）等算法。这些
深度学习相关指标工作笔记 Victor Zhong AI 框架深度学习笔记人工智能
这里写目录标题检测指标iou/Ｇou/Ｄiou/ＣiouMSE(MeanSquaredError)(均方误差)(回归问题)交叉熵损失函数(CrossEntropyErrorFunction)(分类问题)检测指标iou/Ｇou/Ｄiou/ＣiouIntersectionoverUnion(IoU)是目标检测里一种重要的评价值交并比令人遗憾的是IoU无法优化无重叠的bboxes如果用IoU作为loss
271万+学术论文数据集 (2007-2025.4) .Android安卓科研室. 数据引用数据分析
文章目录数据下载地址数据指标说明一、数据介绍二、数据指标三、数据概览项目备注数据下载地址数据下载地址点击这里下载数据数据指标说明arXiv是一个向所有人开放的学术资源共享平台，创立于1991年，是开放获取运动的先驱。该平台由全球志愿者团队维护，目前已收录超过200万篇学术论文，涵盖物理学、计算机科学、数学等八大核心学科领域。通过近30年的发展，arXiv不仅为科研人员提供了免费的知识共享渠道，也成
《卷积神经网络到Vision Transformer：计算机视觉的十年架构革命》 HeartException 人工智能学习
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站题目《卷积神经网络到VisionTransformer：计算机视觉的十年架构革命》展开深度解析，全文采用技术演进史+架构对比+产业影响的三段式结构，附关键数据与趋势预测：卷积神经网络到VisionTransformer：计算机视觉的十年架构革命副标题：从局部感知到全局建模，一场改变AI视觉基石的
10分钟掌握Python缓存
项目背景代码检查项目，需要存储每一步检查的中间结果，最终把结果汇总并写入文件中在中间结果的存储中可以使用context进行上下文的传递，但是整体对代码改动比较大，违背了开闭原则也可以利用缓存存储，处理完成之后再统一读缓存并写入文件在权衡了不同方案后，我决定采用缓存来存储中间结果。接下来，我将探讨Python中可用缓存组件。python缓存分类决定选择缓存，那么python中都有哪些类型的缓存呢?1
YOLO融合synergisticNet中的模块今天炼丹了吗 YOLOv11与自研模型专栏 YOLO
YOLOv11v10v8使用教程：YOLOv11入门到入土使用教程YOLOv11改进汇总贴：YOLOv11及自研模型更新汇总《HyperSINet:ASynergeticInteractionNetworkCombinedWithConvolutionandTransformerforHyperspectralImageClassification》一、模块介绍论文链接：https://ieeex
目标检测：从基础原理到前沿技术全面解析随机森林404 计算机视觉目标检测人工智能计算机视觉
引言在计算机视觉领域，目标检测是一项核心且极具挑战性的任务，它不仅要识别图像中有什么物体，还要确定这些物体在图像中的具体位置。随着人工智能技术的快速发展，目标检测已成为智能监控、自动驾驶、医疗影像分析等众多应用的基础技术。本文将全面介绍目标检测的基础概念、发展历程、关键技术、实践应用以及未来趋势，为读者提供系统性的知识框架。第一章目标检测概述1.1目标检测的定义与重要性目标检测（ObjectDet
计算机专业毕业答辩注意事项李子圆圆计算机网络 java 计算机人工智能
毕业答辩是计算机专业学习过程中的重要环节，它不仅是对学生多年学习成果的综合检验，也是展示个人专业能力和学术素养的重要机会。为了帮助同学们在答辩中取得优异成绩，顺利迈出校园，走向职场或更高的学术殿堂，以下为大家详细介绍计算机专业毕业答辩的注意事项。一、前期准备（一）论文内容把控熟悉论文细节：对自己撰写的毕业论文要了如指掌，从研究背景、目的、意义，到具体的研究方法、技术实现细节、实验过程及结果分析，每
水下目标检测：突破与创新加油吧zkf 目标跟踪人工智能计算机视觉
水下目标检测技术背景水下环境带来独特挑战：光线衰减导致对比度降低，散射引发图像模糊，色偏使颜色失真。动态水流造成目标形变，小目标（如10×10像素海胆）检测困难。声呐与光学数据融合可提升精度，但多模态对齐仍是技术难点。核心算法实现要点图像预处理直方图均衡化与Retinex算法结合改善对比度和色偏：defsingle_scale_retinex(img,sigma):retinex=np.log10
【科研写作自动化工具】如何用AI技术组合（大模型+多Agent+自动化）打造一个“智能论文生产线”，把枯燥的写作流程变成自动化
n8n是一款开源的工作流自动化工具，类似于Zapier或Make（原Integromat），但更注重灵活性和开发者友好性。在课程文件中提到的n8n自动化流水线主要用于科研写作的自动化流程集成，以下是详细解释：n8n的核心功能可视化工作流设计：通过拖拽节点（Nodes）连接不同工具和服务，无需编写复杂代码即可搭建自动化流程。多平台集成：支持连接文献数据库（如PubMed、arXiv）、AI模型（如O
YOLOv11 改进策略 | GFPN：超越 BiFPN，跳层与跨尺度连接重塑特征金字塔
YOLOv11改进策略|GFPN：超越BiFPN，跳层与跨尺度连接重塑特征金字塔！介绍颈部网络（Neck）在目标检测任务中扮演着至关重要的角色，它负责有效地融合来自骨干网络（Backbone）不同层级的特征图，为检测头部（Head）提供包含丰富语义和空间信息的多尺度特征。FPN、PANet和BiFPN等结构是特征金字塔融合的代表。BiFPN作为其中的佼佼者，通过双向连接和加权融合取得了优异的性能。
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
Latex beamer 常用操作记录
最近组会要讲论文，试着用latex做下slide，感觉效果不错。在此，记录一些可能会比较常用的一些操作。以后学到了新的操作，再继续更新。用的是这个主题，感觉比较简洁：https://www.overleaf.com/latex/templates/artrabeamer/cvtmgdbwvdmr放置图片图片感觉有好多参数，因为这次汇报比较水，所以只用了scale这个缩放参数凑合，以后再补上一些常用
【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
JSP汽车网站yzp17--（程序+源码+数据库+调试部署+开发环境） CK3042 java 汽车开发语言 oracle 数据库服务器大数据
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容一、项目背景随着互联网的飞速发展和人民生活水平的日益提高，汽车已成为许多家庭的重要交通工具。为了更好地满足消费者对汽车信息的需求，提升购车体验，我们计划开发一个功能全面、信息丰富的汽车网站。该项目旨在为用户提供便捷的汽车资讯查询、车型对比、购车指南以及售后服务等功能，打造
超详细yolov8/11-segment实例分割全流程概述：配置环境、数据标注、训练、验证/预测、onnx部署(c++/python)详解
因为yolo的检测/分割/姿态/旋转/分类模型的环境配置、训练、推理预测等命令非常类似，这里不再详细叙述，主要参考**【YOLOv8/11-detect目标检测全流程教程】**，下面有相关链接，这里主要针对数据标注、格式转换、模型部署等不同细节部分；【YOLOv8/11-detect目标检测全流程教程】超详细yolo8/11-detect目标检测全流程概述：配置环境、数据标注、训练、验证/预测、o
创新引入HAttention模块：提升YOLOv8小目标检测精度【YOLOv8】程序员Gloria YOLOv8 YOLO 目标跟踪人工智能目标检测
文章目录创新引入HAttention模块：提升YOLOv8小目标检测精度【YOLOv8】引言1.YOLOv8模型概述1.1YOLOv8架构1.2YOLOv8小目标检测的挑战2.HAttention模块：原理与设计2.1HAttention模块的动机2.2HAttention模块的结构3.HAttention模块在YOLOv8中的应用3.1引入HAttention模块3.2YOLOv8架构修改3.3
PHP接单涨薪系列（九）之计算机视觉实战：PHP+Stable Diffusion接单指南（2025高溢价秘籍）攻城狮凌霄 PHP PHP接单涨薪 AI php 计算机视觉 stable diffusion
案例场景某电商公司使用本方案后，产品图制作成本降低90%，广告转化率提升35%，单月节省设计费用超¥80,000。本文将彻底解密如何用PHP+AI视觉技术接取高单价设计外包，让你在竞争激烈的市场中脱颖而出！一、视觉设计市场的AI革命1.1传统设计vsAI设计设计任务传统流程AI流程需求沟通初稿设计反复修改最终交付AI生成微调即时交付2025年设计市场数据对比：指标传统设计AI设计提升幅度单图制作时
YOLOv11深度解析：Ultralytics新一代目标检测架构创新与实战指南芯作者 D2:YOLO YOLO 神经网络计算机视觉
2024年Ultralytics重磅推出YOLOv11**：在精度与速度的平衡木上再进一步，参数减少22%，推理速度提升2%，多任务支持全面升级！一、YOLOv11核心创新：轻量化与注意力机制的完美融合YOLOv11并非颠覆性重构，而是通过模块级优化实现“少参数、高精度、快推理”的目标。其三大创新点如下：1.1C3k2模块：动态卷积核的灵活设计取代YOLOv8的C2f模块，C3k2通过参数c3k动
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分