迪菲赫尔曼

You Only Look Once: 革命性目标检测算法论文解析

You Only Look Once 全论文完整翻译

You Only Look Once: Unified, Real-Time Object Detection

摘要

我们介绍了一种名为YOLO的新型目标检测方法。在目标检测的先前工作中，人们将分类器重新应用于执行检测任务。相反，我们将目标检测视为一个回归问题，其中涉及到对空间分离的边界框和相关类别概率的预测。一个单独的神经网络可以直接从完整图像中一次性预测出边界框和类别概率。由于整个检测流程是一个单一网络，因此可以直接进行端到端的优化以提高检测性能。

我们的统一架构非常快速。我们的基础YOLO模型可以以每秒45帧的速度实时处理图像。网络的一个较小版本，Fast YOLO，每秒处理155帧图像，同时实现了其他实时检测器两倍的mAP（平均准确率）。与最先进的检测系统相比，YOLO在定位方面可能会产生更多的错误，但在背景上预测假阳性的可能性较小。最后，YOLO学习到非常通用的目标表示。在从自然图像推广到艺术品等其他领域时，它的性能超过了其他检测方法，包括DPM和R-CNN。

1. Introduction

人类瞥一眼图像就能瞬间知道图像中有哪些物体，它们的位置以及它们之间的相互作用。人类的视觉系统快速而准确，使我们能够在几乎没有意识思考的情况下执行像驾驶这样的复杂任务。快速准确的目标检测算法将使计算机能够在没有专门传感器的情况下驾驶汽车，使辅助设备能够向人类用户传达实时场景信息，并释放出用于通用、响应性机器人系统的潜力。当前的检测系统将分类器重新应用于目标检测。为了检测一个物体，这些系统会在测试图像的各个位置和尺度上采用该物体的分类器进行评估。像可变形部件模型（DPM）这样的系统使用滑动窗口的方法，在整个图像上均匀分布的位置运行分类器[10]。

最近的方法，如R-CNN，使用区域建议方法首先在图像中生成潜在的边界框，然后在这些提议的框上运行分类器。在分类之后，使用后处理来细化边界框，消除重复检测，并根据场景中的其他对象重新评分这些框[13]。这些复杂的流程很慢，并且难以优化，因为每个组件都必须单独进行训练。

我们将目标检测重新构建为一个单一的回归问题，直接从图像像素到边界框坐标和类别概率。利用我们的系统，您只需对图像进行一次查看（You Only Look Once，即YOLO），即可预测出图像中存在哪些物体以及它们的位置。

YOLO以其简洁明快而令人耳目一新：请参见图1。一个卷积网络同时预测多个边界框和这些框的类别概率。YOLO在完整图像上进行训练，并直接优化检测性能。与传统的目标检测方法相比，这种统一模型具有多个优势。首先，YOLO的速度非常快。由于我们将检测视为一个回归问题，因此不需要复杂的流程。我们只需在测试时在新图像上运行神经网络以预测检测结果。我们的基础网络在Titan X GPU上以每秒45帧的速度运行，无需批处理，而快速版本的速度超过150帧每秒。这意味着我们可以实时处理流媒体视频，并且延迟低于25毫秒。此外，YOLO的平均精度比其他实时系统高出两倍以上。要了解我们的系统在网络摄像头上实时运行的演示，请参阅我们的项目网页：http://pjreddie.com/yolo/

图1：YOLO检测系统。使用YOLO处理图像简单而直接。我们的系统（1）将输入图像调整为448×448，（2）在图像上运行一个单独的卷积网络，然后（3）通过模型的置信度对生成的检测结果进行阈值处理。

其次，YOLO在进行预测时对整个图像进行全局推理。与滑动窗口和基于区域提议的技术不同，YOLO在训练和测试时可以看到整个图像，因此它隐含地编码了关于类别以及它们外观的上下文信息。快速R-CNN是一种顶级的检测方法[14]，但它会将图像中的背景区域误认为物体，因为它无法看到更大的上下文信息。与快速R-CNN相比，YOLO在背景错误方面的数量少于一半。

第三，YOLO学习到了具有通用性的目标表示。当在自然图像上进行训练并在艺术作品上进行测试时，YOLO在很大程度上优于DPM和R-CNN等顶级检测方法。由于YOLO具有高度的通用性，当应用于新领域或意外输入时，它不太可能出现故障。然而，YOLO在准确性方面仍然落后于最先进的检测系统。虽然它能够快速识别图像中的物体，但在精确定位一些物体，特别是较小的物体方面仍有困难。我们在实验中进一步研究了这些权衡。

2. 统一的检测

我们将目标检测的独立组件统一为一个神经网络。我们的网络利用整个图像的特征来预测每个边界框。它同时预测图像中所有类别的所有边界框。这意味着我们的网络在整个图像和图像中的所有对象方面进行全局推理。YOLO的设计实现了端到端训练和实时速度，同时保持高平均精度。我们的系统将输入图像分成一个S×S的网格。如果一个对象的中心落在一个网格单元内，那么该网格单元就负责检测该对象。

每个网格单元预测B个边界框以及这些边界框的置信度分数。这些置信度分数反映了模型对该边界框包含目标的自信程度，以及对其预测的边界框准确性的判断。形式上，我们将置信度定义为 $IOU^{truth}_{pred}$ 。如果该单元格内不存在目标，则置信度分数应为零。否则，我们希望置信度分数等于预测边界框与真实边界框之间的交并比（IOU）。

每个边界框包含5个预测值：x、y、w、h和置信度。其中，(x, y)坐标表示边界框相对于网格单元边界的中心位置。宽度和高度是相对于整个图像进行预测的。最后，置信度预测表示预测边界框与任何真实边界框之间的IOU（交并比）。

每个网格单元还预测C个条件类别概率， $Pr(Class_i|Object)$ 。这些概率是在网格单元中包含目标的条件下进行预测的。

我们所有的训练和测试代码都是开源的。还可以下载多种预训练模型。在每个网格单元中，只有一个类别概率集合，而不管边界框的数量B。在测试时，我们将条件类别概率和个体框置信度预测相乘。
$\operatorname{Pr}\left(\text { Class }_{i} \mid \text { Object }\right) * \operatorname{Pr}(\text { Object }) * \mathrm{IOU}_{\text {pred }}^{\text {truth }}=\operatorname{Pr}\left(\text { Class }_{i}\right) * \mathrm{IOU}_{\text {pred }}^{\text {truth }}$
这样可以为每个框提供特定类别的置信度得分。这些得分既编码了该类别在框中出现的概率，也反映了预测框与目标之间的匹配程度。

图2：模型。我们的系统将检测建模为回归问题。它将图像分割为一个S×S的网格，并为每个网格单元预测B个边界框、这些边界框的置信度和C个类别概率。这些预测被编码为一个S×S×(B*5+C)的张量。

在PASCAL VOC数据集上评估YOLO时，我们使用S = 7，B = 2。PASCAL VOC数据集有20个标注类别，因此C = 20。我们最终的预测结果是一个7 × 7 × 30的张量。

2.1 网络设计

我们将这个模型实现为一个卷积神经网络，并在PASCAL VOC检测数据集[9]上进行评估。网络的初始卷积层从图像中提取特征，而全连接层则预测输出的概率和坐标。我们的网络架构受到了用于图像分类的GoogLeNet模型[34]的启发。我们的网络包括24个卷积层和2个全连接层。与GoogLeNet使用的Inception模块不同，我们只是使用1×1的降维层，然后是3×3的卷积层，类似于Lin等人[22]的方法。完整的网络结构如图3所示。我们还训练了一个快速版本的YOLO，旨在推动快速目标检测的界限。快速YOLO使用的神经网络具有较少的卷积层（9个而不是24个），并且这些层中的过滤器也较少。除了网络的大小之外，YOLO和快速YOLO之间的所有训练和测试参数都是相同的。

图3：网络架构。我们的检测网络包含24个卷积层和2个全连接层。交替使用的1×1卷积层将特征空间从前面的层中减少。我们在ImageNet分类任务上对卷积层进行预训练，输入图像的分辨率为原来的一半（224 × 224），然后在检测时将分辨率加倍。

我们网络的最终输出是一个大小为7 × 7 × 30的预测张量。

2.2 训练

我们在ImageNet 1000类竞赛数据集[30]上对卷积层进行预训练。为了预训练，我们使用了图3中的前20个卷积层，然后是一个平均池化层和一个全连接层。我们将该网络训练约一周，并在ImageNet 2012验证集上实现了88%的单次裁剪前五准确率，与Caffe Model Zoo中的GoogLeNet模型相当[24]。我们使用Darknet框架进行所有的训练和推理[26]。然后，我们将模型转换为执行检测任务。Ren等人表明，向预训练网络中添加卷积层和全连接层可以提高性能[29]。在他们的例子中，我们添加了4个卷积层和2个全连接层，其权重是随机初始化的。由于检测通常需要精细的视觉信息，因此我们将网络的输入分辨率从224×224增加到448×448。我们的最后一层同时预测类别概率和边界框坐标。我们通过将边界框的宽度和高度归一化为图像的宽度和高度，使其介于0和1之间。我们将边界框的x和y坐标参数化为特定网格单元位置的偏移量，因此它们也被限制在0和1之间。我们在最后一层使用线性激活函数，而所有其他层使用以下泄漏修正线性激活函数（leaky rectified linear activation）：

$\phi(x)=\left\{\begin{array}{ll} x, & \text { if } x>0 \\ 0.1 x, & \text { otherwise } \end{array}\right.$

我们在模型输出中优化总均方误差。我们使用总均方误差是因为它易于优化，但它并不完全符合我们最大化平均精确度的目标。它将定位误差与分类误差等权重处理，这可能并不理想。此外，在每张图像中，许多网格单元不包含任何对象。这将这些单元格的“置信度”分数推向零，往往会压倒包含对象的单元格的梯度。这可能导致模型不稳定，使训练过早发散。

为了解决这个问题，我们增加了不包含对象的边界框坐标预测的损失，并减少了置信度预测的损失。我们使用了两个参数， $λ_{coord}$ 和 $λ_{noobj}$ 来实现这一点。我们将 $λ_{coord}$ 设置为5，将 $λ_{noobj}$ 设置为0.5。

平方损失函数同样对大框和小框的误差给予了相等的权重。然而，我们的误差度量应该反映出在大框中的小偏差相比于小框中的小偏差更为微不足道。为了部分解决这个问题，我们预测边界框宽度和高度的平方根，而不是直接预测宽度和高度。

YOLO在每个网格单元中预测多个边界框。在训练时，我们希望每个物体只有一个边界框预测器负责预测。我们根据当前与真实边界框的IOU（交并比）最高的预测结果，指定一个预测器来“负责”预测一个物体。这导致了边界框预测器之间的专业化。每个预测器在预测特定大小、长宽比或物体类别方面变得更加准确，从而提高整体召回率。

在训练过程中，我们优化以下多部分损失函数：

在这里， $1^{obj}_{i}$ 表示对象是否出现在第i个单元格中，而 $1^{obj}_{ij}$ 表示第i个单元格中的第j个边界框预测器对该预测负责。

请注意，损失函数仅在网格单元格中存在对象时（因此需要先前讨论的条件类别概率）对分类错误进行惩罚。如果该预测器对真实边界框负责（即在该网格单元格中具有最高的IOU），则它也只对边界框坐标误差进行惩罚。

我们在来自PASCAL VOC 2007和2012的训练和验证数据集上训练网络大约进行了135个epoch。在对2012年的测试中，我们还包括了VOC 2007的测试数据以进行训练。在整个训练过程中，我们使用64个样本的批量大小，动量为0.9，衰减为0.0005。

我们的学习率调度如下：在最初的几个epoch中，我们将学习率从10^(-3) 缓慢地提升到10^(-2) 。如果我们从较高的学习率开始，由于不稳定的梯度，模型往往会发散。我们继续以10^(-2) 进行75个epoch的训练，然后以10^(-3) 进行30个epoch的训练，最后以10^(-4)进行30个epoch的训练。

为了避免过拟合，我们使用了dropout和广泛的数据增强。在第一个连接层之后，使用丢失率(rate)为0.5的dropout层可以防止层之间的共适应性 [18]。对于数据增强，我们引入了最多原始图像尺寸的20%的随机缩放和平移。我们还随机调整图像在HSV颜色空间中的曝光和饱和度，调整幅度最多为1.5倍。

2.3 推理

就像在训练中一样，对于测试图像的检测预测只需要进行一次网络评估。在PASCAL VOC上，网络对每个图像预测98个边界框，并为每个框预测类别概率。YOLO在测试时非常快速，因为它只需要进行一次网络评估，而不像基于分类器的方法那样需要多次评估。

网格设计强制边界框预测中的空间多样性。通常可以明确知道对象落在哪个网格单元格中，网络只对每个对象预测一个框。然而，一些大型对象或靠近多个单元格边界的对象可以由多个单元格很好地定位。非极大值抑制可以用于修复这些多个检测结果。虽然对于性能来说不像R-CNN或DPM那样关键，但非极大值抑制可以提高2-3%的mAP（平均精确度均值）。

2.4 YOLO的局限性

YOLO对边界框预测施加了强烈的空间约束，因为每个网格单元格只预测两个框，并且只能有一个类别。这种空间约束限制了模型能够预测的附近对象的数量。我们的模型在出现成群的小型对象（如一群鸟）时表现不佳。

由于我们的模型是从数据中学习预测边界框的，因此它在泛化到具有新的或不寻常的纵横比或配置的对象时存在困难。我们的模型还使用相对粗糙的特征来预测边界框，因为我们的架构从输入图像中经过多个下采样层。

最后，尽管我们在一个近似检测性能的损失函数上进行训练，但我们的损失函数对于小边界框和大边界框中的错误处理方式是相同的。大框中的小错误通常是无害的，但小框中的小错误对IOU有更大的影响。我们主要的误差来源是错误的定位。

3. 与其他检测器的比较

目标检测是计算机视觉中的核心问题。检测流程通常从输入图像中提取一组稳健的特征（如Haar [25]、SIFT [23]、HOG [4]和卷积特征 [6]）。然后，分类器 [36, 21, 13, 10] 或定位器 [1, 32] 用于在特征空间中识别对象。这些分类器或定位器可以在整个图像上以滑动窗口方式运行，也可以在图像的某些区域子集上运行 [35, 15, 39]。

我们将YOLO检测系统与几个顶级的检测框架进行比较，突出了关键的相似性和差异。

可变形部件模型（Deformable parts models，DPM）使用滑动窗口方法进行目标检测[10]。DPM使用一个不连续的流程来提取静态特征，对区域进行分类，为得分较高的区域预测边界框等等。我们的系统用一个单独的卷积神经网络替代了所有这些不连续的部分。该网络同时进行特征提取、边界框预测、非极大值抑制和上下文推理。与静态特征不同，网络在线训练特征，并对其进行检测任务的优化。我们的统一架构比DPM更快、更准确。

R-CNN及其变种使用区域提议（region proposals）而不是滑动窗口来在图像中找到对象。Selective Search [35] 生成潜在的边界框，一个卷积网络提取特征，一个支持向量机（SVM）对边界框进行打分，一个线性模型调整边界框，非极大值抑制（non-max suppression）消除重复检测结果。这个复杂的流程的每个阶段都必须精确地独立调整，并且最终的系统非常缓慢，在测试时每张图像需要超过40秒的处理时间[14]。

YOLO与R-CNN有一些相似之处。每个网格单元格提出潜在的边界框，并使用卷积特征对这些边界框进行评分。然而，我们的系统对网格单元格的提议施加了空间约束，有助于减少对同一对象的多次检测。与Selective Search生成的约2000个边界框相比，我们的系统每张图像仅提出了98个边界框。最后，我们的系统将这些个别组件合并成一个单一的、联合优化的模型。

其他快速检测器如Fast R-CNN和Faster R-CNN专注于加速R-CNN框架，通过共享计算和使用神经网络来提议区域，而不是使用Selective Search [14] [28]。尽管它们在速度和准确性上相对于R-CNN有所提升，但仍无法达到实时性能。

许多研究工作着重于加速DPM流程 [31] [38] [5]。它们通过加速HOG计算、使用级联和将计算推向GPU等方法来提高速度。然而，只有30Hz DPM [31] 实际上能够实时运行。

与试图优化大型检测流程中的各个组件不同，YOLO完全舍弃了流程，并且其设计上就具备了快速性。

对于单个类别（如人脸或人体）的检测器可以进行高度优化，因为它们需要处理的变化要少得多 [37]。YOLO是一个通用目标的检测器，能够同时学习检测多种对象。

Deep MultiBox与R-CNN不同，Szegedy等人训练了一个卷积神经网络来预测感兴趣区域（regions of interest），而不是使用Selective Search。MultiBox也可以通过将置信度预测替换为单个类别预测来进行单个对象检测。然而，MultiBox无法进行通用的目标检测，仍然只是大型检测流程中的一部分，需要进一步进行图像块分类。YOLO和MultiBox都使用卷积网络来预测图像中的边界框，但YOLO是一个完整的检测系统。

OverFeat是由Sermanet等人训练的卷积神经网络，用于定位并适应该定位器进行检测。OverFeat能够高效地进行滑动窗口检测，但仍然是一个不连贯的系统。OverFeat优化的是定位而不是检测性能。与DPM类似，当进行预测时，该定位器只能看到局部信息。OverFeat无法推理全局上下文，因此需要进行重要的后处理以产生连贯的检测结果。

MultiGrasp. 我们的工作在设计上与Redmon等人的抓取检测工作相似 [27]。我们对边界框预测的网格方法基于MultiGrasp系统，该系统用于回归到抓取点。然而，抓取检测比目标检测要简单得多。MultiGrasp只需要为包含一个物体的图像预测一个可抓取区域。它不需要估计物体的大小、位置或边界，也不需要预测物体的类别，只需要找到一个适合抓取的区域。而YOLO在图像中预测多个类别的多个对象的边界框和类别概率。

4. 实验

首先，我们将YOLO与其他实时检测系统在PASCAL VOC 2007上进行比较。为了了解YOLO与R-CNN变体之间的差异，我们研究了YOLO和Fast R-CNN在VOC 2007上的错误。Fast R-CNN是R-CNN中性能最高的版本之一[14]。根据不同的错误特征，我们展示了YOLO可以用于重新评分Fast R-CNN的检测结果，并减少背景误报的错误，从而显著提高性能。我们还呈现了VOC 2012的结果，并将mAP与当前最先进的方法进行了比较。最后，我们展示了YOLO在两个艺术品数据集上相比其他检测器更好地泛化的情况。

4.1 与其他实时系统的比较

许多目标检测的研究工作都致力于提高标准检测流程的速度。[5] [38] [31] [14] [17] [28]然而，只有Sadeghi等人真正实现了实时运行的检测系统（每秒30帧或更快）[31]。我们将YOLO与他们的GPU实现的DPM进行比较，后者的运行速度为30Hz或100Hz。虽然其他工作并未达到实时的里程碑，我们也比较了它们相对的mAP和速度，以探讨目标检测系统在准确性和性能之间的权衡。

Fast YOLO是PASCAL数据集上最快的目标检测方法；据我们所知，它是目前存在的最快的目标检测器。其mAP为52.7%，比之前关于实时检测的工作精度提高了一倍多。而YOLO将mAP提升到了63.4%，同时保持实时性能。

我们还使用VGG-16训练了YOLO。这个模型更准确，但速度比YOLO慢得多。它对于与依赖VGG-16的其他检测系统进行比较很有用，但由于速度不足以实现实时性，本文的其余部分将重点关注我们更快的模型。

Fastest DPM有效地加快了DPM的速度，几乎没有牺牲太多mAP，但仍无法达到实时性能的两倍[38]。它也受到DPM相对较低准确性的限制。

任何关于目标检测的研究工作都致力于加速标准的检测流程。[5] [38] [31] [14] [17] [28]然而，只有Sadeghi等人真正实现了实时运行的检测系统（每秒30帧或更快）[31]。我们将YOLO与他们基于GPU的DPM实现进行比较，该实现的运行速度为30Hz或100Hz。虽然其他工作没有达到实时的里程碑，我们也比较了它们相对的mAP和速度，以研究目标检测系统中可用的准确性和性能权衡。

我们还使用VGG-16对YOLO进行训练。这个模型更准确，但速度比YOLO慢得多。它对于与依赖VGG-16的其他检测系统进行比较很有用，但由于速度不足以实现实时性，本文的其余部分将重点关注我们更快的模型。

Fastest DPM有效地加快了DPM的速度，几乎没有太多牺牲mAP，但仍然相对于实时性能差了一倍[38]。与神经网络方法相比，它在检测方面也受到DPM相对较低的准确性的限制。

R-CNN减去R的部分用静态边界框提议替代了Selective Search [20]。虽然它比R-CNN快得多，但仍无法达到实时性能，并且由于没有良好的提议而在准确性上受到了显著的影响。

Fast R-CNN加快了R-CNN的分类阶段，但仍然依赖于Selective Search，每张图像生成边界框提议大约需要2秒的时间。因此，它具有较高的mAP，但每秒0.5帧的速度仍远远不足以实时运行。

最近的Faster R-CNN将Selective Search替换为神经网络来提议边界框，类似于Szegedy等人的方法[8]。在我们的测试中，它们最准确的模型每秒达到7帧，而一个较小但准确性较低的模型以18帧的速度运行。Faster R-CNN的VGG-16版本比YOLO的mAP高10个百分点，但速度也慢了6倍。Zeiler-Fergus Faster R-CNN比YOLO只慢2.5倍，但准确性较低。

表格1：PASCAL VOC 2007上的实时系统。比较快速检测器的性能和速度。快速的YOLO是PASCAL VOC检测记录中最快的检测器，仍然比任何其他实时检测器准确率高出两倍。YOLO比快速版本准确率高出10个mAP，同时速度仍然保持在实时水平以上。

4.2 VOC 2007 错误分析

为了进一步研究YOLO和最先进的检测器之间的差异，我们详细分析了在VOC 2007上的结果。我们将YOLO与Fast R-CNN进行比较，因为Fast R-CNN是在PASCAL数据集上表现最好的检测器之一，而且其检测结果是公开可用的。

我们采用了Hoiem等人的方法和工具。在每个类别的测试时，我们查看该类别的前N个预测结果。每个预测结果要么是正确的，要么根据错误类型进行分类：

Correct: correct class and IOU > .5
Localization: correct class, .1 < IOU < .5
Similar: class is similar, IOU > .1
Other: class is wrong, IOU > .1
Background: IOU < .1 for any object

图4显示了所有20个类别中每种错误类型的细分情况的平均值。 YOLO在正确定位物体方面存在困难。定位错误占据了YOLO错误的主要部分，超过了其他所有错误来源的总和。Fast R-CNN的定位错误要少得多，但背景错误要多得多。它的前N个检测结果中有13.6%是假阳性，不包含任何物体。相比于YOLO，Fast R-CNN预测背景检测的可能性几乎是其三倍。

图4：错误分析：Fast R-CNN vs. YOLO 这些图表显示了各个类别中前N个检测结果中定位错误和背景错误的百分比（N = 该类别中的物体数量）。

4.3 将Fast R-CNN和YOLO相结合

YOLO在背景错误方面比Fast R-CNN要少得多。通过使用YOLO来消除Fast R-CNN的背景检测，我们可以显著提高性能。对于R-CNN预测的每个边界框，我们检查YOLO是否预测了一个相似的框。如果是的话，我们根据YOLO预测的概率和两个框之间的重叠程度来增加该预测的权重。

在VOC 2007测试集上，最好的Fast R-CNN模型的mAP为71.8%。与YOLO相结合后，其mAP增加了3.2%达到75.0%。我们还尝试将顶级Fast R-CNN模型与其他几个版本的Fast R-CNN组合。这些组合在mAP方面只产生了0.3%到0.6%之间的小幅增长，详见表2。

YOLO的提升并不仅仅是模型集成的副产品，因为组合不同版本的Fast R-CNN几乎没有任何好处。相反，正是因为YOLO在测试时会产生不同类型的错误，它才能有效地提升Fast R-CNN的性能。

不幸的是，这种组合并没有享受到YOLO的速度优势，因为我们分别运行每个模型，然后将结果组合起来。然而，由于YOLO非常快速，与Fast R-CNN相比，它并不会增加任何显著的计算时间。

表格2：VOC 2007上的模型组合实验。我们研究了将各种模型与最佳版本的快速R-CNN结合的效果。其他版本的快速R-CNN只能提供微小的效益，而YOLO则显著提升了性能。

4.4 VOC 2021 结果

在VOC 2012测试集上，YOLO的mAP得分为57.9%。这低于当前的最先进方法，接近使用VGG-16的原始R-CNN，详见表3。与其最接近的竞争对手相比，我们的系统在小物体上表现较差。在瓶子、绵羊和电视/显示器等类别中，YOLO的得分比R-CNN或Feature Edit低8-10%。然而，在其他类别如猫和火车中，YOLO取得了更高的性能。

我们结合了Fast R-CNN和YOLO的模型是最高性能的检测方法之一。Fast R-CNN通过与YOLO的结合获得了2.3%的改进，将其在公共排行榜上提升了5个名次。

表3：PASCAL VOC 2012排行榜。YOLO与完整的comp4（允许使用外部数据）公共排行榜进行了比较，数据截至2015年11月6日。显示了各种检测方法的平均精度和每类平均精度。YOLO是唯一的实时检测器。Fast R-CNN + YOLO是得分第四高的方法，比Fast R-CNN提升了2.3%。

4.5 泛化能力：艺术作品中的人体检测

学术数据集用于目标检测时，训练数据和测试数据都来自相同的分布。然而，在真实世界的应用中，很难预测所有可能的使用情况，测试数据可能与系统之前所见的数据不同[3]。我们将YOLO与其他检测系统在Picasso数据集[12]和People-Art数据集[3]上进行比较，这两个数据集用于测试艺术作品中的人体检测。

图5显示了YOLO与其他检测方法之间的性能比较。为了参考，我们给出了在人物上进行VOC 2007检测的平均精度（AP），其中所有模型仅在VOC 2007数据上进行训练。在Picasso数据集上，模型在VOC 2012上进行训练，而在People-Art数据集上，模型在VOC 2010上进行训练。

R-CNN在VOC 2007上具有较高的AP。然而，当应用于艺术作品时，R-CNN的性能显著下降。R-CNN使用Selective Search进行边界框提议，该方法针对自然图像进行了调整。R-CNN中的分类器仅看到小区域，并且需要良好的提议。

DPM在应用于艺术作品时保持了较好的AP。之前的研究认为DPM表现良好是因为它具有对物体的形状和布局具有强大的空间模型。尽管DPM的性能下降没有R-CNN那么明显，但它的起始AP较低。

YOLO在VOC 2007上表现良好，而在应用于艺术作品时，其AP下降比其他方法更少。像DPM一样，YOLO对物体的大小和形状进行建模，以及物体之间的关系和物体的常见出现位置。艺术作品和自然图像在像素级别上非常不同，但在物体的大小和形状上相似，因此YOLO仍然可以预测出良好的边界框和检测结果。

5. 野外实时检测

YOLO是一种快速、准确的目标检测器，使其非常适用于计算机视觉应用。我们将YOLO连接到网络摄像头，并验证其保持实时性能，包括从摄像头获取图像和显示检测结果所需的时间。

所得到的系统具有交互性和吸引力。虽然YOLO以单个图像为单位进行处理，但连接到网络摄像头时，它可以像一个跟踪系统一样工作，检测物体在移动和外观变化时的情况。该系统的演示和源代码可以在我们的项目网站上找到：http://pjreddie.com/yolo/。

6. 结论

我们引入了YOLO，一种用于目标检测的统一模型。我们的模型构建简单，并可以直接在完整图像上进行训练。与基于分类器的方法不同，YOLO是基于与检测性能直接对应的损失函数进行训练，整个模型是联合训练的。

Fast YOLO是文献中最快的通用目标检测器，而YOLO在实时目标检测方面推动了最新技术的发展。YOLO在新领域中也具有良好的泛化能力，使其成为依赖于快速、鲁棒目标检测的应用程序的理想选择。

相关推荐

目标检测蓝皮书
YOLOv5/v7 改进实战
YOLOv5/v7 进阶实战
YOLOv8 改进实战

你可能感兴趣的:(目标检测,目标检测,计算机视觉,人工智能,YOLO,chatgpt)

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
【目标检测】机场内部目标检测数据集4106张YOLO+VOC格式
数据集格式：VOC格式+YOLO格式压缩包内含：3个文件夹，分别存储图片、xml、txt文件JPEGImages文件夹中jpg图片总计：4106Annotations文件夹中xml文件总计：4106labels文件夹中txt文件总计：4106标签种类数：7标签名称:["Ground_vehicles","Horizontal_sign","Runaway_limit","Taxiway","Ver
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
模型训练与部署注意事项篇---resize Atticus-Orion 图像处理篇深度学习篇模型训练与部署注意事项篇深度学习计算机视觉人工智能
图像大小的影响在YOLOv系列模型的训练和推理部署过程中，图像大小的选择是影响模型性能（精度、速度、泛化能力）的关键因素之一。两者的关系既相互关联，又存在一定的灵活性，具体可从以下几个方面详细分析：一、核心关系：训练与推理图像大小的“基准一致性”YOLOv模型（如YOLOv5、v7、v8等）的训练和推理图像大小通常以**“基准尺寸”**为核心关联，即训练时设定的图像尺寸会作为模型设计的基础，而推理
Xcode 26 现已发布，并支持代码智能它与基于 Cursor 和 AI Agent 的工作流程相比如何？知识大胖 SwiftUI源码大全 xcode macos ide
简介Xcode26昨天发布了！惊喜的是，它支持macOS15，但要使用新的ChatGPT助手，你需要macOS26Tahoe。所以我把我的M3MaxMacBookPro升级到了Tahoe。我不是说你应该升级，但我这么做是为了测试Xcode的新功能并与大家分享！值得注意的是，这是迄今为止最小的Xcode版本（下载大小）！正如Apple在Xcode新功能会话视频（我建议您观看）中所说的那样，这是一项巨
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
12 个强大的 DeepSeek AI 提示将彻底改变您的日常生活知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
内容写作的最佳提示让我们从写作开始吧。无论您是博主、学生还是社交媒体创作者，这些提示都将帮助您创作出精彩的内容。提示1：“扮演专业文案撰稿人，为[产品/服务]撰写引人注目的广告文案。文案应引人入胜、具有说服力，且字数不得超过100个字。”这使得ChatGPT的响应结构就像真实的广告文案一样。提示2：“以更具吸引力和说服力的方式重写此段落，同时保持含义不变：[插入文本]。”推荐文章《Neo4j上使用
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 anythingllm llm
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志，以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型（教程含安装步骤）知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 ai anythinllm llama
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
将多个小型YOLO数据集合并为一个大型数据集梦实学习室 YOLO python YOLO python 机器学习
一、将多个小型YOLO数据集合并为一个大型数据集importosimportshutilimportargparsedefmerge_data(source_dir,target_dir,images_dir,labels_dir):images_target=os.path.join(target_dir,images_dir)labels_target=os.path.join(target_
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
目标检测中的NMS算法详解
好的，我们来详细解释一下目标检测中非极大值抑制（Non-MaximumSuppression,NMS）的相关概念和计算过程。1.为什么需要NMS？问题：目标检测模型（如FasterR-CNN,YOLO,SSD等）在推理时，对于同一个目标物体，通常会预测出多个重叠的、不同置信度（confidencescore）的候选边界框（BoundingBoxes）。直接输出所有这些框会导致：结果冗余：同一个物体
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
电梯开关状态人员进出检测数据集VOC+YOLO格式2220张4类别 fl176831 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：2220标注数量(xml文件个数)：2220标注数量(txt文件个数)：2220标注类别数：4标注类别名称:["CloseElevator","People-in-elevator","The-elevator-was-
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
低成本作弊神器？使用ESP32将通义千问AI接入学生计算器
前因：IT之家9月24日消息，YouTube频道ChromaLock于9天前发布视频，介绍了名为TI-32的改造电路板，加装在德州仪器TI-84Plus图形计算器上，可以接入ChatGPT。IT之家查询公开资料，在PSAT、SAT和ACT大学入学考试、IB和AP考试中，标准化组织已经批准考生使用TI-84Plus图形计算器。ChromaLock探索了该计算器的连接端口，设计了名为TI-32的改造电
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本