haixwang

object_detection API论文Speed/accuracy trade-offs for...的详细中文翻译

最近又反复读了几篇物体检测方面的论文，算作对即将“裸考”的CET-6的补偿。。。
好多内容其实没必要强行翻译，这篇译文只做增强理解用，最最准确的请参看原文：https://arxiv.org/abs/1611.10012
注：
1）.为了使译文读起来更“流畅”和“正确”：我去掉了部分引用；文章中出现的论文名、人名以及一些术语没有翻译。
2）.其实从3.1节开始才是咱们关心的内容

【】中的内容是我添加的注释

摘要

本文的目标是：作为选择一个detection architecture的指南，为给定的应用和平台实现速度、memory和精度之间的平衡。为此，我们研究了各种用速度来换memory和准确率的modern convolutional物体检测系统。近年来已经提出了许多成功的系统，但是由于不同的特征提取器（例如，VGG，残差网络）、不同的图像分辨率以及不同的硬件和软件平台，我们难以把它们拿来一一比较。我们提出了FASTER R-CNN ，R-FCN 和SSD 系统的统一实现，我们将其称为“META架构”，并且，对于每一个架构，我们都追踪由于使用可选的特征提取器以及其他像图像尺寸这样的critical 参数带来的速度和精确度（之间的变化）【注：简单说就是对各个指标进行了监控】。On one extreme end of this spectrum where speed and memory are critical【这个extreme end of不太好搞啊】，我们呈现了一个实时的，可以部署在移动设备上的检测器。在精确度更重要的一面，我们呈现了一个在COCO检测任务上表现为业界最顶尖性能的检测器。

1.简介

近年来，由于使用卷积神经网络（CNNs），物体检测方面取得了很多进展。基于这些网络的现代物体检测器，如FASTER R-CNN [31]，R-FCN [6]，Multibox [40]，SSD [26]和YOLO [29]，现在已经足够好了，（以至于可以）部署在消费者产品中（例如，Google照片，Pinterest视觉搜索），有些（检测器的检测结果）已经显示足够快，可以在移动设备上运行。

然而，业务人员很难确定哪种架构对于它们的应用来说是最合适的。(接下来一小段就不翻译了，没什么意思。)

不幸的是，只有一小部分论文（如RFCN [6]，SSD [26] YOLO [29]）详细地讨论了运行时间。此外，这些论文通常只说明他们实现了一定的帧速率，但是并没有给出效率和精度之间的权衡Trade-Off，这取决于许多其他因素，例如使用哪个特征提取器，输入图像大小，等等。

在本文中，我们以一种详尽且公平的方式探索现代检测系统的效率和精确度之间的权衡。虽然（业界）已经对图像分类进行了（一定的）研究（例如，[3]），但是检测模型往往要复杂得多，我们主要研究singlemodel/single-pass 检测器，也就是说我们的模型不使用【文章后文也提到了这个】合成、multi-crop【可理解为多处裁剪】方法或其他例如水平翻转等等的“技巧”，换句话说，我们只通过一个网络传递一个单一的图像，为了简单起见（因为这个技术的用户更重要），我们只关注测试耗时长短，而不关注这些模型训时间的长短。

尽管比较每个最近提出的检测系统是不切实际的，但幸运的是，许多现有的领先的技术方法已经汇聚在一个共同的方法论上（至少在高级别是这样的），这使得我们能够用统一的方式执行、和比较大量的（物体）检测系统，特别是我们已经实现了它
在高层由一个单一的卷积网络组成的FASTER R-CNN，R-FCN和SSD meta-architectures，用mixed regression和目标分类进行训练，并使用滑动窗口预测。总而言之，我们的主要贡献如下：
1.略（没用）
2.我们使用TensorFlow灵活的、统一的实现了三种元架构（FASTER R-CNN，R-FCN和SSD），我们使用它进行广泛的实验，追踪不同检测系统、不同的体系结构、提取器、图像分辨率等的准确度和速度之间的权衡曲线【就是说准确度的提升或下降与速度之间的关系】。
3.我们的研究结果表明，与SSD和RFCN相比，对FASTER R-CNN使用更少的proposals，可以显着提高速度而不会有大的精度损失。我们发现，相较于Faster R-CNN 和R-FCN，SDDs对特征提取器（提取的）质量更不敏感（就是说SDDs更不容易受到特征的质量的影响）。我们在精度与速度的相关曲线【突然发觉翻译为“相关”要更好一点，不就是在一张图里绘制了两条线然后权衡出更好的吗】上找出最佳点，只有在牺牲速度的情况下才能提高精度（在这里介绍的一系列的检测器中）。
4.我们所报告的一些meta-architectures和特征提取器组合在文献中从未出现过。我们讨论了我们如何使用这些新颖的组合来训练2016年COCO物体检测竞赛的获奖作品【这里指那些架构】。

2.Meta-architectures

近年来，神经网络已成为高质量的物体检测的主要手段。在本节中，我们将查探这些文献的一些亮点。 Girshick等人的R-CNN论文[11]是卷积网络检测的第一个现代化身。受到近期在图像分类方面取得成功的启发[20]，R-CNN采用直接的方法——cropping externally computed box proposals out of an input image，并在这些裁剪出来的成果（crops）【理解为区域感觉好一些】上运行神经网络分类器。这种方法的代价可能会很高，但是许多裁剪出来的区域又是必要的，导致重复计算裁剪出来的区域【注：很明显，因为这些区域会有重叠】。 Fast R-CNN [10]通过将整个图像一次通过特征提取器【注：在所选的神经网络的某个feature map提取特征】从中间层裁剪，从而减轻了这个问题，使裁剪出来的区域共担特征提取的计算负载。

而R-CNN和Fast R-CNN都依靠外部生成proposal，最近的研究表明，使用神经网络也可以生成box proposal[41,40,8,31]。In these works，it is typical to have a “anchors”在图像上的不同空间位置、不同尺度和长宽比，有时称为“priors”或“default boxs”）。然后对模型进行训练，对每个anchor进行两方面预测：（1）对每个anchor做类别预测;（2）a continuous prediction of an offset by which the anchor needs to be shifted to fit the groundtruth bounding box.（大致是说bbox，连续预测这个anchor，并移动它使得它与真实的box越来越近）

我们现在描述的是遵循这种anchors方法的论文，然后最小化综合分类和回归损失。对于每个锚点（之后的anchor翻译为锚点）a，我们首先找到最匹配的groundtruth框b（如果存在的话）。如果可以找到这样的匹配，我们称之为“positive anchor”，并将其分配给【后面这一小段还是看原文吧】：（1）.一个类标签:ya∈{1… K};（2）一个与锚点a相对应的b框的编码向量【FASTER RCNN论文中提到，reg层有4k个输出编码】a vector encoding of box b with respect to anchor a (called the box encoding φ(ba; a)).如果无法匹配，我们称之为“负锚”，我们将类标签设置为ya = 0。对于锚a，我们预测框编码为f loc（I; a，θ）并且相应的类为fcls（I; a ，θ），其中I是那张图像，θ是模型参数，a的损失计算为基于位置的损失和分类损失的加权和：
L(a, I; θ) = α · 1[a is positive] · loc(φ(ba; a) − floc(I; a, θ)) + β ·cls(ya, fcls(I; a, θ)), (1)
——其中α，β是衡量定位和分类损失的权重。为了训练模型，等式1在锚点上被平均并且相对于参数θ被最小化。

锚点的选择对精度和计算都有比较大的影响。在（第一个）Multibox论文[8]中，这些锚点（作者称之为“先验盒子”）是通过对数据集中的groundtruth框进行聚类而生成的。在最近的作品中，则通过在图像上定期以不同比例和长宽比平铺一组盒子来生成锚点。具有规则的网格的锚点的优点在于：可以在图像上使用共享参数（即，卷积网络）写为tiled predictors来对这些方框进行预测，这使人想起传统的滑动窗口方法，例如 [44]。第一批采用这种新方法的论文有FASTER R-CNN 论文和（第二个）Multibox论文（称这些tiled anchors为““convolutional priors”）。

2.1. Meta-architectures

在我们的论文中，我们主要关注以下最近的三个（meta）architectures：SSD（Single Shot Multibox Detector ），FASTER R-CNN 和R-FCN（Region-based Full Convolutional Networks ）。虽然这些论文最初是由特定的特征提取器（例如VGG，Resnet等）提供的，但我们现在回顾这三种方法，将元架构的选择从特征提取器中分离出来【意思是这篇文章中不再非得将VGG或者Rsnet这些网络与SSD、FASTER R-CNN、R-FCN固定搭配起来，换句话说，这里进行了更多的搭配】，从概念上说，任何特征提取器都可以用于SSD ，FASTER R-CNN或R-FCN。

2.1.1 Single Shot Detector (SSD).

（其实就是对SSD的一段简述，了解SSD的话可以略过）
虽然SSD论文是最近才发表的,但我们使用术语SSD来广泛地指代那些不需要第二阶段的per-proposal分类操作而使用单个前馈卷积网络来直接预测类别和锚点偏移的系统（图1中的a）。根据这个定义，SSD体系结构已经在[26]之前很久就被探索了。的Multibox和Faster R-CNN中的RON都使用这种方法来预测与类别不相关的box proposals。[33，29，30，9]使用类似SSD的架构来预测最终的（K个标签中的一个）类别标签。 Poirson等人将这个想法扩展到预测boxs，classes和pose。

表1：使用第二节中描述的元架构中的一个卷积检测模型。Boxes are encoded with respect to a matching anchor a via a function φ (等式 1)，其中[x 0，y 0，x 1，y 1]是一个box的最小坐标和最大坐标，xc，yc是它的中心坐标，w，h是它的宽度和高度。在某些情况下，也可以使用wa，ha，匹配锚点的宽度和高度。注意：
1).我们包含[26]中早期的arXiv版本（就是说包含了一个论文前后不同的版本），它的配置与ECCV 2016发布的版本不同;
2).[29]使用了一个受GoogLeNet [39]启发的快速特征提取器，这是我们没有比较的;
3).如果YOLO的中心位于锚点（我们称之为BoxCenter）内，YOLO会将一个groundtruth box匹配到一个锚点。

            图1：本文中比较的几个架构

2.1.2 Faster R-CNN.
（同理，对Faster R-CNN的一段简述，了解Faster R-CNN可以略过）
在FASTER R-CNN的设置中，有两个阶段都会去检测（图1b）。第一阶段，被称为RPN，图像由特征提取器（比如VGG-16）处理，并且选定某些中间层（比如“conv5”）的特征用于预测类别不相关的box proposals【仅仅使用网络的一部分】。第一阶段采用公式1的形式来计算损失函数——使用平铺在空间中的不同长宽比的锚点网格来计算。在第二阶段中，一些（通常为300）box proposals，这些box proposals都是从同一个feature map中裁剪（crop）出来的特征，这些特征在之后会被fed到剩下的特征提取器【注：上段内容比较长，建议读下原文，感觉自己还是理解对了的】，随后将其馈送到特征提取器的其余部分（比如“fc6”followed by“fc7”）【为什么fc6 followed fc7，原文说反了吗？】，以便对每个proposal的类和类专有的box（class-specific box）做精细的预测。
第二阶段分类器的损失函数也采用等式1的形式，使用由RPN产生的proposals作为锚。值得注意的是，不会直接从图像裁剪出proposals，也不通过特征提取器重新裁剪出proposals，（因为）这将是重复的计算。但是有一部分计算必须每个区域运行一次，因此运行时间取决于RPN产出的regions数量。
Faster R-CNN在2015年出来后产生了特别大的影响。并导致了一些后续工作[2，35，34，46，13，5，19，45，24，47]（包括SSD和R-FCN）。值得注意的是，截至2016年11月，COCO目标检测服务器提交的报告中有一半以某种方式基于FASTER R-CNN系统。
2.2. R-FCN
（同理，是对R-FCN的一段简述）
虽然FASTER R-CNN比Fast R-CNN快一个数量级，但是特定region组件必须在每个图像应用【注：可理解为“计算”】几百次这一事实导致Dai等人[6]提出了R-CNN方法，可以理解为FASTER R-FCN（(Region-based Fully Convolutional Networks——基于区域的全卷积网络），proposals不会直接在预测出的region proposal的layer中裁剪出来，而是从the last layer of features prior to prediction裁剪出（图1c）。这种将裁剪放在到最后一层的方法最大限度地减少了每个区域的计算量，而这个区域计算又是必要的。Dai等人认为对象检测任务需要本地化表示，以遵守translation variance，因此提出了一种位置敏感的裁剪机制，用来代替[10,31]中使用的更标准的ROI池操作和[5]中的可区出裁剪区域的机制。他们表示R-FCN模型（使用Resnet 101）在更快的运行时间内可以达到与FASTER R-CNN相当的精度。最近，R-FCN模型也被用来在最近的TAFCN模型[22]中进行实例分割，从而赢得了2016年COCO实例分割的挑战。
3.Experimental setup
近年来，像Imagenet [32]和COCO [25]等标准数据集的引入使得检测方法在准确性方面可以更简单的进行比较。然而，就速度和记忆而言，各种方法还是难以比较的。之前的作品依赖于不同的深度学习框架（例如DistBelief [7]，Caffe [18]，Torch [4]）和不同的硬件。一些论文对准确性进行了优化;还有一些则优化了速度。最后，在有的情况下，使用稍微有些不同的训练集（例如，COCO训练集与组合训练+验证集）来报告指标。
为了更好地进行apples-to-apples【注：这是个常见的俗语,指对两个东西的各个方面作一一对应的比较】的比较，我们在Tensorflow [1]中创建了一个检测平台，并在此平台上为SSD，R-CNN和R-FCN元架构重新创建了训练管道（training pipelines）【使用Object_detection进行训练时，需要定义pipiline.config文件】。拥有一个统一的框架使我们能够轻松地交换【注：就是说换各种各样的搭配】特征提取器、体系结构、损失函数，并使它在Tensorflow中可以方便地移植到不同的平台上进行部署。接下来我们讨论在我们的平台上配置模，丢失函数和输入的方法 - 可以用来交换速度和准确性的旋钮。
3.1 架构配置
3.1.1特征提取器。
在所有的元结构中，我们首先在输入图像中使用convolutional特征提取器【注：理解为卷积核就行】来取得高级特征。特征提取器的选择是至关重要的，因为layers的类型和参数数量直接影响检测器的记忆能力、速度和性能。在本文中，我们选择了六个有代表性的特征提取器进行比较，除了MobileNet [14]【注：这个是Google用于移动端的网络】之外，所有的都有Tensorflow的开源实现，（这些开源实现）对计算机视觉社区具有相当大的影响。
详细地说，我们使用了以下六个特征提取器。我们使用VGG-16 [37]和Resnet-101 [13]，者两者都在ILSVRC和COCO 2015（分类，检测和分割）等竞赛上获得过好成绩。我们还使用了在ILSVRC 2014的分类和检测挑战上表现得最好的Inception v2 [16]，它的升级版Inception v3也很厉害。这两个Inception网络都采用了“Inception units”【注：这里说的是Inception网络中的Inception model，它是一个network in network in network的结构。这也是Inception过人之处】，这样就可以在不增加计算负担的情况下增加网络的深度和宽度。最近，Szegedy等人[38]提出了Inception Resnet（v2），它将residual connections带来的的优化效益和Inception units的计算效率相结合。最后，我们将比较新的MobileNet网络[14]，该网络已经被证明在Imagenet上达到了VGG-16级的精度，而且只有VGG-16三十分之一的计算成本和模型大小。 MobileNet专为在各种移动视觉应用中进行高效推理而设计。它的building blocks是在深度上可分的卷积：将一个标准卷积分解为depthwise卷积和1×1的卷积，有效地降低了计算成本和参数的数量。
对于每个特征提取器，为了在元架构中使用它们。。。【注：这一段也没有什么有用信息，就不强行翻译了】。
Liu等人[26]表明，在SSD设置中，在多个尺度上使用多个特征映射进行位置和confidence预测对于获得良好的性能至关重要。对于VGG特征提取器，他们使用conv4_3，fc7（转换为卷积层）以及一系列添加的层。在我们的实验中，我们采用他们的方法，总是选择最上面卷积出来的feature map和较低的层中的高分辨率的feature map，然后添加一系列分辨率衰减2倍的卷积层，这些增加的卷积层会用于预测。然而与[26]不同的是，我们在所有附加层中使用批量标准化。
为了便于比较，在表1中列出了以前的工作中使用的特征提取器。在这项工作中，我们评估元架构和特征提取器的所有组合，其中大部分（组合）是新颖的。值得注意的是，Inception网络从来没有用于FASTER R-CNN框架，直到最近还没有开源[36]【注：现在已经开源了（2017/11/8）】。 Inception Resnet（v2）和MobileNet至今尚未出现在检测文献中【github上也已经有了，只是作者们写这篇文章时没有开源】。
3.1.2proposal的数量。
对于FASTER R-CNN和R-FCN，我们也可以在测试时选择发送给分类器的proposal的数量。通常情况下，这两个数都设置为300，降低计算量的一个简单方法是发送较少的boxes，这样可以会降低召回的风险。在我们的实验中，我们将这个proposal的数量控制在在10到300之间来探索trade-off【注：指探索速度与准确度等之间的变化】。

3.1.3 Resnet和Inception Resnet的输出步长设置。
我们对Resnet-101的实现是在原始的实现上稍微了些修改，输出步长由32改为了将会更有效的16;如在[6]中那样，我们通过将conv5_1层的步长由修改为1来实现这一点（通过在之后的层中使用atrous卷积来补偿这里缩小的步长）。对于FASTER R-CNN和R-FCN，除了16的默认步长之外，我们还在步长修改为1的conv4_1块中尝试了使用步长为8的Resnet-101（这个尝试代价更高）。同样，我们也试验了Inception Resnet网络的16步长和8步长版本。我们发现使用步长为8而不是16可以将mAP提高5％，但运行时间增加了63％。
3.2 损失函数配置
除了选择特征提取器之外，在可能影响训练稳定性和最终性能的损失函数（等式1）的配置方面有多种选择。这里我们描述我们在实验中所选择的，表1再次对比了其他作品中设置的损失函数。
3.2.1匹配
确定每个锚点的类别和回归目标需要将anchor匹配到groundtruth实例。常见的方法包括贪婪的二分配匹配（比如，基于Jaccard overlap）或不需要双方的配合的多对一的匹配策略，但是如果锚与groundtruth之间的Jaccard重叠太低，则匹配被忽略。我们将这些策略分别称为Bipartite或Argmax。在我们的实验中，我们使用Argmax策略进行匹配，采用的每个元架构的原始论文中建议的阈值。匹配后，通常有一个抽样程序，旨在使正锚和负锚的数量达到一定的预想比例。在我们的实验中，我们也将这些比率设置为每个元结构的相应论文推荐的比例。
3.2.2 Box encoding
为了编码一个匹配其锚点的groundtruth框，我们使用框编码函数φ（ba; a）= [10·xc wa，10·yc ha，5·log w，5·log h] （也使用[11,10,31,26]）。注意，在这之前的所有工作中，通常也使用乘数10和5，即使没有明确提到。
3.2.3 Location loss（&loc）
在[10，31，26]之后，我们在所有实验中使用L1 平滑（或Huber [15]）损失函数。
3.3输入大小配置。
在FASTER R-CNN和R-FCN中，模型训练前，图像会被为缩放边长较短的边的像素值【注：比如说400*500的原图，缩为400*400】；而在SSD中，图像总是被调整到固定的形状M×M. 我们探索评估每个图像缩小后的模型，以用准确度换速度。特别的，我们已经训练了每个模型的高分辨率和低分辨率版本。在“高分辨率”设置中，我们设置M = 600，在“低分辨率”设置中，我们设置M = 300.在这两种情况下，这意味着SSD方法平均处理的像素数少于FASTER R -CNN或R-FCN模型。其他变量都保持不变。
3.4 训练和调整超参数
我们在分布式集群上使用异步梯度更新来对所有模型进行端到端地联合训练[7]。对于FASTER RCNN和R-FCN，我们使用带有动量的【注：简单理解就是惯性】SGD，batch sizes为1（因为这些模型使用不同的图像大小进行训练）；对于SSD，我们使用RMSProp [43]，batch sizes为32（在少数例外的，由于记忆原因的情况下，我们减少了batch sizes大小）。最后我们手动调整每个特征提取器的学习速率。对于与文献（[31,6,13,26]）相匹配的模型的配置，我们已经达到或超过了报告的mAP结果^2.(2:对于使用VGG的SSD，我们已经达到了论文的ECCV版本中报告的数字，但最新的ArXiv版本使用数据增强方案获得了更高的mAP，这是我们尚未实验的。)
注意，对于FASTER R-CNN和R-FCN，这种端到端方法与通常使用的4阶段的训练程序略有不同。此外，我们使用Tensorflow里的“裁剪和调整大小”操作来替代[31,6]中使用的ROI池化层和位置敏感ROI池化层，Tensorflow里的“裁剪和调整大小”操作使用双线性插值（biliner interpolation）【注：关于双线性插值的维基百科https://en.wikipedia.org/wiki/Bilinear_interpolation】将图像的一部分重新采样到固定大小的网格上。这与[5]中的微cropping机制、[12]中的注意模型以及[17]中的空间变换网络类似。然而，我们禁止相对于bounding box的坐标的反向传播，因为我们发现这在训练期间是不稳定的。
我们的网络在COCO数据集上进行训练，使用所有的训练图像以及测试图像的一个子集，使用8000个样本进行测试^3(3：我们注意到，这个数据集是相似的，但相似度略小于已经在几篇论文，例如[2,26]中使用的trainval35k。)。最后，在测试时，我们通过无最大抑制来进行检测的后期处理，无最大抑制使用0.6的IOU阈值并将所有的方块剪切到图像窗口。为了评估我们的最终检测结果，我们使用官方的COCO API [23]，除了其他指标外，这个API在IOU为[0.5：0.05：0.95]范围内的均值上检测mAP值。
3.5 基准测试程序
为了测试我们的模型，我们使用了一台32GB RAM的机器，Intel Xeon E5-1650 v2处理器和一块Nvidia GeForce GTX Titan X GPU卡。计时为GPU上处理一个batch sizes所用的时间。用于计时的图像的大小被调整了，使得最小尺寸至少为k，然后被剪裁到k * K ,其中k是300或者600，根据模型而定。我们(用了)超过500个图像来做平均判断（We average the timings over 500 images）。
我们在我们的计时中包括后期处理（其包括非最大抑制，目前只在CPU上运行）。后期处理在最快的模型（大约40毫秒）中可能占据运行时间的大部分，目前我们的最大帧速率为每秒25帧。除此之外，这意味着虽然我们的计时结果可以相互比较，但它们可能与文献中其他报告的速度无法直接比较。其他潜在的差异包括硬件，软件驱动程序，框架（在我们的例子中为Tensorflow）和batch size（例如Liu等[26]使用8个batch sizes的报告时间）。最后，我们使用tfprof [27]来衡量模型在推理过程中的总得分。这提供了对于记忆量度的一个更独立的平台。我们测量的记忆值【可理解为准确度】为测试三个图像的平均值。

3.6 模型细节

表2：我们使用的6个特征提取器的属性(值)。 Top-1的精度是在ImageNet数据集上的分类精度
表2总结了我们使用的特征提取器。所有模型都是在ImageNet-CLS上预训练的。我们详细介绍了如何使用下面的这些特征提取器来训练目标检测器。
3.6.1 FASTER R-CNN
我们（是）紧紧按照FASTER RCNN [31]的原始实现【来进行试验的】，但是使用Tensorflow的“裁剪和调整大小”操作来替代标准ROI池化层。除VGG外，所有特征提取器都在卷积层后batch归一化。我们将batch归一化参数冻结为在ImageNet预训练期间估计的参数。我们训练速度FASTER RCN时，采用异步SGD，动量为0.9【对SGD的优化，可以解决SGD更新不稳定的问题：http://blog.csdn.net/luo123n/article/details/48239963】。初始学习率取决于我们使用的特征提取器，具体见这段文字段末。在900K次迭代之后，我们将学习率降低了10倍，在1.2M次迭代之后又降低了10倍。使用9个GPU进行分布式训练。每个GPU每次迭代只取一张图片; RPN训练的minibatch大小为256，而在对box分类器的训练中，minibatch大小为64。
• VGG [37]：我们从步长为16的“conv5”图层中提取特征。类似于[5]，我们裁剪并调整feature maps的大小为14x14，然后经过maxpool变为7x7。初始学习率是5e-4。
• Resnet 101 [13]：我们从“conv4”这个版块的最后一层提取特征。当以恶意模式操作时，步长大小是8，否则为16。feature maps被裁剪和调整到14x14，然后经过maxpooled变为7x7。初始化学习速率是3e-4.
• Inception V2 [16]：我们从步长为16的“Mixed_4e”图层中提取特征。feature maps被裁剪和调整为14x14，初始化学习速率是2e-4.
• Inception V3 [42]：我们从步长为16的“Mixed_4e”图层中提取特征。feature maps被裁剪和调整为14x14，初始学习速率是3e-4.
•Inception Resnet [38]：我们从“Mixed_6a”图层中提取特征，包括其相关的残留层。在恶意模式下操作时，步长为8，否则为16。feature maps被裁剪和调整为14x14，初始学习率是1e-3。
• MobileNet [14]：我们从步长为16的“Conv2d 11”图层中提取特征。feature maps被裁剪和调整到14x14。初始学习率是3e-3。
3.6.2 R-FCN
我们（是）紧紧按照R-FCN [6]来进行试验的，但是使用Tensorflow的“裁剪和调整大小”操作替代用ROI池化来从位置敏感score map中裁剪区域。所有特征提取器在卷积层之后使用batch归一化。我们将batch归一化参数冻结为在ImageNet预训练期间估计的参数。我们用动量为09的异步SGD训练R-FCN。使用9个GPU进行分布式训练。每个GPU每次迭代只取一张图片; RPN训练的minibatch大小为256，而在对box分类器的训练中，minibatch大小为64。截至本次提交时，我们没有R-FCN在VGG或Inception V3特征提取器下的结果。
• Resnet 101 [13]：我们从“block3”图层中提取特征。当以恶意模式操作时，步长大小是8，否则是16。位置敏感得分地图被裁剪为7x7的空间bins，并且重新调整尺寸为21x21。我们使用在线硬示例挖掘来对128个小号样本进行采样，以训练box分类器。初始学习率是3e-4。 100万步后减10倍，120万步之后再减10倍。

// TODO

【因暂时研究FASTER RCNN，故跳过原文第七页对R-FCN和SSD的相关分析。接下来是原文第八页】

4.1 分析
4.1.1 准确度VS时间
图2：准确度与时间的关系，不同形状的标记表示不同元架构，不同颜色表示不同的特征提取器。由于输入尺寸，步长等的变化，每个（元架构，特征提取器）对可以对应于该图上的多个点。

图2是。。。。。。【注：同上】。每个图像的运行时间范围为几十毫秒到1秒。一般来说，我们观察到R-FCN和SSD模型平均速度更快，而FASTER R-CNN模型更慢但更准确，每个图像至少需要100 ms。但是，正如我们下面所讨论的，如果我们限制region proposed的数量，FASTER R-CNN模型可以一样快。我们还覆盖了一个虚构的“最优性边界”，代表了在这个探测器系列中只有在牺牲速度的情况下才能达到更好的精度的点。在下面，我们重点介绍最优化边界的一些关键点，作为最好的探测器，并分别讨论各种模型配置选项的影响。
4.1.2最优边界上的关键点
（最快的：SSD with/MobileNet）：在这个最优化边缘【注：也就是图2中的虚线】的最快端【注：变化速率最快的阶段】，我们看到具有Inception v2和Mobilenet特征提取器的SSD模型是最快的模型中最精确的【注：看图2，在刚开始时，也就是图二的最左侧，时间耗费最少时，SSD w/MobileNet是精确度最高的】。注意，如果我们忽略后期处理花费的（时间），Mobilenet大概是Inception v2的两倍，而准确性只是稍差一点点【宣传自己的产品，可以理解】。（(Sweet Spot：R-FCN W / Resnet或FASTER R-CNN W / Resnet，只有50个proposals）：R-FCN模型使用残差网络特征提取器所占据的最优边界中间有一个“elbow”，看起来在我们的模型配置中达到速度和准确性之间的最佳平衡。正如我们在下面讨论的，如果我们将proposal的数量限制为50，FASTER R-CNN和Resnet模型可以达到相似的速度。（最准确的说：步骤8中的FASTER R-CNN w/Inception）【这是他们的发现之一，他们发觉使用50的proposal和300的proposal差别并不大】：最后，密集输出的更快的FASTER R-CNN结合输出密集的Inception Resnet网络的模型达到了最高的精度【mAP大概是36】，据我们所知，它是目前业界最先进的单一模型。然而这个模型很慢，需要近一秒的处理时间。这5个模型的整体mAP数字如表3所示。
4.1.3特征提取器的影响
直观地说，分类性能更好的话，在COCO数据集上检测的性能也应该更好。为了验证这一点，我们调查了不同模型的整体mAP和用于初始化每个模型的预训练特征提取器获得的Top-1 Imagenet分类精度之间的关系。图3表明分类和检测性能之间确实存在整体相关性。然而，这种相关性似乎只对FASTER R-CNN和R-FCN有意义，而SSD的性能似乎不太依赖于其特征提取器的分类准确性。

4.1.4物体大小的影响

图4显示了在不同大小的物体上，不同模型的性能。意料之中，所有方法在大对象上都做得更好。我们也看到，尽管SSD模型在小物体上的表现通常很差，但它们在较大的物体上具有与FASTER RCNN和R-FCN的竞争力。
4.1.5图像大小的影响
其他作者已经观察到，输入图像的分辨率会显着影响检测精度。根据我们的实验，我们观察到，在两个维度上将分辨率降低为原来的一半都会降低准确度（平均降低15.88％），但也将推测时间相对的平均减少了27.4％。
造成这种影响的一个原因是高分辨率输入使得模型可以找到小物体。
图5比较了大型物体和小型物体上的检测器的性能，证实高分辨率模型可以显着提高小物体的mAP值（在很多情况下为2倍），同时大型物体的mAP结果略好。我们也看到，在小型物体上的强大性能意味着在我们的模型检测大型物体的性能更好（但反过来不对，因为SSD模型在大型物体上表现良好但在小物体上变现不好）。
4.1.6 proposal数量的影响
对于FASTER R-CNN和R-FCN，我们可以调整RPN计算的proposal的数量。这两篇论文的作者使用了300 个框，但是，我们的实验表明，这个数字可以显着减少，而不会降低mAP（太多）。在一些“盒分类器”是Faster R-CNN的一部分的特征提取器中，300个框的计算是昂贵的，这可以显着的计算节省量。图6a为不同特征提取器的高分辨率输入显示了FASTER RCNN模型的这种权衡曲线。我们看到，具有300个proposal的Inception Resnet，mAP为35.4；但是当只有10个proposal时，它仍然具有惊人的高精度（29％的mAP）。最好的地方可能是50个proposal，我们能够获得使用300个proposal的96％的准确度，同时将运行时间减少了3倍。对于Inception Resnet，计算节省得最为明显，我们看到类似的折中适用于所有特征提取器。图6（b）显示了对R-FCN做类似改变的结果。
4.1.7 FLOPs分析
图7绘出了每个模型组合的GPU时间【毫秒，图像分辨率为300。可看出无论采用哪种卷积网络，都是SSD最快FASTER RCNN最慢】。但是，这是非常依赖于平台的。计算FLOPs【即“每秒浮点运算次数”，“每秒峰值速度”】（乘加）给了我们一个独立于平台的计算方法，由于诸如缓存、I / O、硬件优化等一系列问题，计算可能会也可能不会【我去。。。】与实际运行时间成线性关系，图8a和图8b 为分别在GPU和CPU上绘制的FLOP计数与观察到的wallclock时间。有趣的是，我们在GPU图（图8a）中观察到，每个模型具有不同的触发器与观察到的运行时间的平均比率（以毫秒为单位）。对于更密集的模块（例如Resnet 101），FLOP / GPU时间通常大于1，这可能是由于高速缓存的效率。对于Inception和Mobilenet模型，这个比率通常小于1–我们猜测这可能是因为分解减少了FLOP，但是在内存I / O中增加了更多的开销，或者当前的GPU指令（cuDNN）对于密集卷积更加优化。
4.1.8内存分析
对于内存基准测试，我们测量总使用量而不是高峰使用量。图10a，10b是针对GPU和CPU wallclock时间的内存使用情况进行绘制的。总的来说，我们观察到更大和更强大的特征提取器需要更多的内存。图9更详细地绘制了一些相同的信息，通过元架构和特征提取器选择进行深入研究。与速度一样，Mobilenet又是最cheap的，几乎所有的设置都需要不到1Gb（总计）的内存。

4.1.9良好的本地化，0.75的IOU意味着在所有的IOU thresholds良好的本地化
While slicing the data by object size leads to interesting insights，但通过IOU阈值对数据进行slicing并不能提供太多附加信息。图11显示了mAP @ .5和mAP @ .75的性能几乎与mAP @ [5：.95]完全线性相关。因此，在较高IOU阈值下性能较差的检测器总是在较低的IOU阈值下也表现不佳。这也就是说，我们还观察到，mAP @ .75与mAP @ [.5：.95]（R2> .99）的关系稍微更紧密一些，所以如果我们要在单个IOU阈值处用mAP代替标准的COCO度量，我们更愿意选择IOU 的值为 0.75。

4.2。 COCO上最先进的检测（系统）
最后，我们简要介绍一下如何整合我们的一些模型，以实现2016年COCO目标检测挑战上的最佳表现。我们的模型在COCO测试集上达到了41.3％的mAP @ [5，.95]，并且是基于Resnet和Inception Resnet特征提取器的五个FASTER R-CNN模型的集合。这比MSRA以前的最好结果（37.1％mAP @ [.5，.95]）要好，它使用了三个Resnet-101模型的集合[13]。表4总结了我们模型的表现，并突出显示了我们的模型如何在所有COCO度量指标的最佳技术上实现一些改进。最值得注意的是，与之前的最佳结果相比，我们的模型在小对象recall方面有近60％的提高。尽管这些结合最佳数字的这个集合可以被看作速度/精度折衷曲线上的一个极端点（每个图像需要约50个端到端的网络评估），但是我们选择单独提出这个模型是因为它与我们在本文其余部分重点讨论的“单一模型”结果没有可比性。为了构建我们的集合，我们从FASTER R-CNN模型中选择了五个模型。每个模型基于Resnet和Inception Resnet特征提取器，具有不同的输出步长，使用损失函数的变化再训练，以及训练数据的随机排序。。。。。。请注意，我们不使用文献中有时使用的多尺度训练，水平翻转，框精化，方框投票（box refinement, box voting）或全局上下文。表6比较了单个模型的表现与两种方式相结合的模型的表现，并且表明（1）encouraging for diversity did help against a hand
selected ensemble，以及（2）集合和多样性在单个模型上有近7个改进点。

4.3. Example detections
5.结论

我们已经对影响现代物体探测器的速度和准确度的一些主要方面进行了实验性比较。我们希望这将有助于从业人员在现实世界中部署物体检测时选择合适的方法。我们还提出了一些新的技术来提高速度，而不需要牺牲很多的准确度，比如比一般使用FASTER R-CNN时使用更少的proposal。

致谢

参考

你可能感兴趣的:(Deep/Machine,Learning,译文)

【人工智能】Python实战：构建高效的多任务学习模型蒙娜丽宁 Python杂谈 AI 人工智能 python 学习
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界多任务学习（Multi-taskLearning,MTL）作为机器学习领域中的一种重要方法，通过在单一模型中同时学习多个相关任务，不仅能够提高模型的泛化能力，还能有效利用任务间的共享信息。本文深入探讨了多任务学习的基本概念、优势及其在实际应用中的重要性。
DeepSeek：极致的中国技术理想 X_taiyang18 AI与机器学习人工智能
揭秘DeepSeek:一个更极致的中国技术理想主义故事划重点中国的大模型创业公司DeepSeek因其创新的MLA架构和DeepSeekMoESparse结构，使推理成本降低至每百万token仅1块钱，引发中国大模型价格战。与其他大公司烧钱补贴不同，DeepSeek是有利润的，背后是DeepSeek对模型架构的全面创新。DeepSeek创始人梁文锋认为，中国的大模型创业者除应用创新外，也可以加入到全
vscode accelerate deepspeed配置 Ctrl_Cver vscode ide 编辑器
accelerate训练{//UseIntelliSensetolearnaboutpossibleattributes.//Hovertoviewdescriptionsofexistingattributes.//Formoreinformation,visit:https://go.microsoft.com/fwlink/?linkid=830387"version":"0.2.0","c
deepin 23 Preview 运行自定义 exe 的方法 deepin
在deepin23Preview版本中，运行自定义的exe程序可以通过以下步骤实现：一、安装Wine运行器（一）使用linglong格式包的Wine应用如果你已经安装了linglong格式包的Wine程序，在WINE版本处将直接出现选项供你选择使用。需要注意的是：在使用linglong包的Wine应用时，必须先安装至少一个linglong的使用Wine软件包，才会出现该选项。程序识别到的Wine是
pythonffmpeg 推流_Python实现推流直播简单心理 pythonffmpeg 推流
教程https://codingchaozhang.blog.csdn.net/article/details/102732555?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param&depth_1-utm_source=distribute.pc_rele
AAAI2024论文解读|Towards Fairer Centroids in k-means Clustering面向更公平的 k 均值聚类中心 paixiaoxin 文献阅读论文合集支持向量机机器学习人工智能聚类公平性 k 均值聚类质心代表性群体代表性公平性
论文标题TowardsFairerCentroidsink-meansClustering面向更公平的k均值聚类中心论文链接TowardsFairerCentroidsink-meansClustering论文下载论文作者StanleySimoes,DeepakP,MuirisMacCarthaigh内容简介本文提出了一种新的聚类级质心公平性（Cluster-levelCentroidFairne
vue mvvm 原理 LikY03321 vue.js 学习前端
一.什么是mvvmMVVM是Model-View-ViewModel的简写。它本质上就是MVC的改进版。MVVM就是将其中的View的状态和行为抽象化，让我们将视图UI和业务逻辑分开。要实现一个mvvm的库，我们首先要理解清楚其实现的整体思路。先看看下图的流程：1.实现compile,进行模板的编译，包括编译元素（指令）、编译文本等，达到初始化视图的目的，并且还需要绑定好更新函数；2.实现Obse
大模型介绍詹姆斯爱研究Java spring
大模型（LargeModel）指的是拥有庞大参数量的机器学习模型。由于具有更多的参数，大模型能够更好地拟合复杂的数据和模式，从而提供更准确的预测和更好的性能。大模型的参数量通常远远超过常规模型，可以达到数百万甚至数十亿个参数。这些参数通常通过深度神经网络（DeepNeuralNetwork）来表示，包括多个隐藏层和大量的神经元。大模型的训练需要大量的计算资源和数据。通常，它们需要在多个GPU或TP
「AI 中国」榜单揭晓，OpenBayes贝式计算入选「大模型最具潜力创业企业 TOP 10」
日前，「AI中国」机器之心2024年度评选正式揭晓，OpenBayes贝式计算有幸入选「大模型最具潜力创业企业TOP10」。作为专业的人工智能媒体与产业服务平台，机器之心于2017年发布了AI榜单「SyncedMachineIntelligenceAwards」，在随后的时间里，伴随AI的跨越式发展，机器之心的年度评选也逐渐成为了产业风向标之一，覆盖的领域、范围更加广泛，维度更加细化。机器之心20
论文阅读：Deep Bilateral Learning for Real-Time Image Enhancement-google-hdrnet-slicing SetMaker 论文阅读
项目地址:https://gitcode.com/google/hdrnethdrnet作为超分领域的经典文章，由google提出主要用来用轻量化的方法来实现高分辨率的图像生成，hdrnet结合cnn可以让更高分辨率的图像部署在板端。如图所示，原始图像比如4k图像，首先分为两个主要模块：grid和guide。grid就是对应图上面的那一条特征提取网络，具体来说，原始图像经过下采样之后，默认256分
2017-SIGGRAPH-Google,MIT-(HDRNet)Deep Bilateral Learning for Real-Time Image Enhancements WX Chen HDR技术深度学习神经网络机器学习
双边网格本质上是一个可以保存边缘信息的3维的数据结构。对于一张2维图片,在2维空间中增加了一维代表像素的强度slice操作(上采样)BilateralGuidedUpsampling这篇文章用双边网格实现图像的操作算子的加速。算法的核心思想是将一幅高分辨率的图像通过下采样转换成一个双边网格,在双边网格中每个格子就是一个图像的仿射变换算子,它的原理是在空间与值域相近的区域内,相似输入图像的亮度经算子
Webservice 的设计和模式 Jaguar1982 webservice soap xml 文档 service 设计模式
这片文章是片译文（原文在devx，具体记不得了），对于想初步了解webservice的朋友可能有些帮助。其中有一些模式的应用，不过个人觉得太简单了，忘大家多想想，发表些意见。Webservice作为一项新的技术出现在我们面前，它的出世是用于解决在不同的平台下的应用的协同的。目前几乎每家厂商都要去开发Webservice应用，然而如果缺乏对Webservice更深的了解，不能很好的在设计阶段处理好一
AWS GCR EKS Resource：构建高效弹性云原生应用的利器杨女嫚
AWSGCREKSResource：构建高效弹性云原生应用的利器eks-workshop-greater-chinaAWSWorkshopforLearningEKSforGreaterChina项目地址:https://gitcode.com/gh_mirrors/ek/eks-workshop-greater-china在云计算的浪潮中，AWS（AmazonWebServices）一直处于创新
AI行业高压与人才健康：纪念Felix Hill，并探讨AI代码生成工具的价值前端
今天，我们怀着沉痛的心情悼念GoogleDeepMind研究科学家FelixHill，这位杰出的AI学者在41岁的年纪离开了我们。他的离世引发了我们对AI行业高压环境与人才健康问题的深刻反思。Felix生前曾公开表达AI行业前所未有的压力，这促使我们思考如何利用技术，例如AI代码生成器，来改善开发者的工作环境，提升效率，守护人才健康。FelixHill在自然语言处理和人工智能领域取得了令人瞩目的成
DeepSeek新模型霸榜，代码能力与OpenAI o1相当且确认开源，网友：今年编程只剩Tab键量子位
原创关注前沿科技量子位DeepSeek版o1，有消息了。还未正式发布，已在代码基准测试LiveCodeBench霸榜前三，表现与OpenAIo1的中档推理设置相当。注意了，这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview（轻量预览版）。而是摘掉了轻量版的帽子，称为DeepSeek-R1-Preview（预览版），意味着替换了规模更大的基础模型。Live
deepin 中 find 命令查找技巧 deepin
find命令是deepin系统中一个非常强大的文件查找工具，它可以帮助用户快速定位文件和目录。全面掌握这个命令可以使很多操作达到事半功倍的效果。本文将详细介绍find命令的各种查找技巧，包括基本用法、高级技巧和实际应用场景。基本用法1.1命令格式find命令的基本格式如下：find[路径][表达式]•路径：指定要搜索的目录路径。可以是一个或多个路径。•表达式：指定查找文件的条件和操作。表达式是fi
deepin桌面卡死问题应对策略 deepin
摘要：deepin操作系统，作为一款基于Linux的国产操作系统，以其美观的界面和稳定的性能受到用户的喜爱。然而，用户在使用过程中可能会遇到桌面卡死的问题。本文将提供一些常见的桌面卡死情况及其解决方案，帮助用户快速恢复系统的正常运行。引言deepin操作系统在提供高效能的同时，也可能会遇到桌面卡死的问题。这种情况可能是由于桌面环境、Xorg服务或者特定进程的异常造成的。本文将针对这些情况提供详细的
在 deepin 中使用原生 Wine 安装与运行 Windows 软件指南 deepin
一、前言deepin作为一款广受好评的国产Linux发行版，凭借其出色的性能和易用性，吸引了众多用户。然而，在使用deepin时，我们可能会遇到一些仅支持Windows平台的软件。借助Wine这一兼容层，我们可以在deepin中顺利安装和运行这些Windows软件。本文将详细阐述在deepin中利用原生Wine安装与运行Windows软件的全过程，以32位7-Zip的安装程序为例，助你轻松掌握相关
deepin下载mysql教程 deepinmysql
官方下载Mysql8.2支持here解压到需要的文件夹去(建议放到/opt/mysql/mysql8)建立mysql的用户与组（groupaddmysql&&useradd-r-gmysqlmysql）创建软链接到系统中,后继服务与配置中会使用到cd/usr/local&&sudoln-s/opt/mysql/mysql8mysql8cd/usr/bin&&sudoln-s/opt/mysql/m
deepin 中 apt 与 dpkg 安装包管理工具的区别 deepin
在Linux系统中，尤其是基于Debian的发行版如Ubuntu和deepin，apt和dpkg是两种常用的包管理工具。它们在功能和使用场景上有一些显著的区别。本文将详细介绍这两种工具的主要区别以及它们的常用命令。主要区别1.1dpkg•功能：dpkg侧重于本地软件包的管理。它主要用于安装、删除和查询本地的.deb文件。•依赖管理：dpkg不会自动处理依赖关系。如果安装的包有依赖，需要手动安装这些
deepin-如何在 ArchLinux 发行版上安装 DDE 桌面环境 deepin
ArchLinux是一个独立开发的x86-64通用GNU/Linux发行版，其用途广泛，足以适应任何角色。开发侧重于简单、极简主义和代码优雅。Arch是作为一个最小的基础系统安装的，由用户配置，通过仅安装其独特目的所需或所需的东西来组装他们自己的理想环境。官方没有提供GUI配置实用程序，大多数系统配置是通过编辑简单的文本文件从shell执行的。Arch努力保持领先，通常提供大多数软件的最新稳定版本
deepin操作系统壁纸管理操作及命令行指南 deepin
摘要：壁纸作为操作系统可视化的重要组成部分，不仅美化了桌面环境，也体现了用户的个性化需求。deepin操作系统提供了丰富的壁纸管理功能，包括为每个显示器设置壁纸、自定义壁纸、管理壁纸库等。本文将详细介绍如何通过命令行对Deepin的壁纸进行管理，包括设置壁纸、获取壁纸列表、删除壁纸以及获取当前壁纸路径等操作。引言deepin操作系统允许用户通过多种方式管理壁纸，包括图形界面和命令行。命令行操作为用
deepin系统升级后网络模块丢失问题的解决方案 deepin
摘要：在deepin操作系统的升级过程中，用户可能会遇到网络模块丢失的问题，这通常与升级命令处理推荐依赖的方式有关。本文将探讨这一问题的成因，并提供推荐的升级方法和解决方案，以确保系统升级的完整性和功能的完整性。引言deepin操作系统在升级过程中，如果使用不当的命令，可能会导致部分功能模块丢失，如网络模块。这可能会影响用户的正常使用。本文将提供解决方案，帮助用户恢复丢失的网络模块。问题分析2.1
deepin操作系统任务栏网络图标异常问题解决指南 deepin
摘要：在使用deepin操作系统时，用户可能会遇到任务栏网络图标显示异常的情况，即使网络连接正常，图标也可能错误地提示无法访问互联网。本文将探讨这一问题的成因，并提供一系列解决方案，以帮助用户解决任务栏网络图标状态异常的问题。引言deepin操作系统的任务栏网络图标有时会出现状态异常，这可能是由于网络检测机制的误判或配置文件的错误。本文将提供详细的解决方案，以确保网络图标能够准确反映网络连接状态。
deepin操作系统登录问题全面分析与解决方案 deepin
摘要：deepin操作系统，作为一款基于Linux的国产操作系统，以其美观的界面和稳定的性能受到用户的喜爱。然而，用户在使用过程中可能会遇到无法登录的问题。本文将对deepin无法登录的问题进行详细分析，并提供相应的解决方案。引言deepin操作系统在升级或使用过程中可能会出现无法登录的情况，这可能是由于系统升级、配置文件错误或软件冲突等原因造成的。本文旨在帮助用户解决这些问题，确保系统的正常使用
deepin桌面卡死问题处理指南 deepin
摘要：deepin操作系统以其优雅的界面和流畅的用户体验受到用户的青睐。然而，用户有时可能会遇到桌面卡死的问题，这可能由多种原因引起。本文将提供一些常见的桌面卡死情况及其解决方案，帮助用户快速恢复系统的正常运行。引言deepin操作系统在提供高效能的同时，也可能会遇到桌面卡死的问题。这种情况可能是由于桌面环境、Xorg服务或者特定进程的异常造成的。本文将针对这些情况提供详细的解决方案。桌面卡死常见
如何在 deepin文件夹中搜索包含特定内容、关键字的 Word 文档 deepin
在deepin系统中，搜索包含特定内容或关键字的Word文档是一项常见需求。以下是一个详细的步骤指南，帮助你在文件夹中高效地完成这项任务。一、安装依赖工具要搜索Word文档，首先需要安装一些必要的工具。这些工具包括catdoc、docx2txt、iconv和grep。它们分别用于处理不同格式的Word文档、字符编码转换和文本搜索。在终端执行以下命令安装这些工具：sudoaptinstallcatd
用deepin-wine6安装/运行exe程序的方法 deepin
一、建立deepin-wine6-stable环境对于新装的系统，首先需要安装一款应用商店里使用deepin-wine6-stable运行的wine应用，例如wine版微信或wine版QQ，并运行一下。这样，系统会自动建立deepin-wine6-stable环境，为后续安装其他exe程序奠定基础.二、安装exe程序以32位7-Zip的安装程序7z2107.exe（版本21.7.0.0）为例，该e
deepin 系统网络信息查看指南 deepin
deepin系统网络信息查看指南在Linux操作系统，如deepin和Ubuntu中，我们可以通过多种shell命令来查看网络信息和网络状态。本文将介绍这些命令，帮助您更好地理解和监控您的网络环境。1.ifconfig命令ifconfig是查看所有网卡信息的命令，但已被弃用，推荐使用ip命令。ifconfig2.ip命令ip命令用于查看所有网卡的信息。#查看所有接口信息：ipaddrshow#查看
什么是多模态机器学习：跨感知融合的智能前沿非凡暖阳人工智能神经网络
在人工智能的广阔天地里，多模态机器学习（MultimodalMachineLearning）作为一项前沿技术，正逐步解锁人机交互和信息理解的新境界。它超越了单一感官输入的限制，通过整合视觉、听觉、文本等多种数据类型，构建了一个更加丰富、立体的认知模型，为机器赋予了接近人类的综合感知与理解能力。本文将深入探讨多模态机器学习的定义、核心原理、关键技术、面临的挑战以及未来的应用前景，旨在为读者勾勒出这一
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不