Wabi―sabi

目标检测论文——对小的、杂乱的和旋转的物体进行更稳健的检测：SCRDet

论文简介

论文中文翻译:《对小的、杂乱的和旋转的物体进行更稳健的检测：SCRDet》

论文名称:《SCRDet: Towards More Robust Detection for Small, Cluttered and Rotated Objects》

录用日期：2019年8月10日

摘要

目标检测一直是计算机视觉中的一个重要组成部分。虽然已经取得了相当大的进展，但对于小尺寸、任意方向和密集分布的物体仍然存在挑战。除了自然图像外，这类问题对非常重要的航空图像尤其突出。本文提出了一种新型的多类别旋转检测器，用于小的、杂乱的和旋转的物体。设计了一种融合多层特征和有效锚点采样的采样融合网络，提高了对小目标的灵敏度。同时，通过抑制噪声和突出目标特征，共同探索有监督像素注意网络和通道注意网络，用于小杂波目标检测。为了得到更准确的旋转估计，在平滑L1损失中加入IoU常数因子来解决旋转包围盒的边界问题。两个遥感公共数据集DOTA, NWPU vdr -10以及自然图像数据集COCO, VOC2007和scene textdataicdar2015上的大量实验显示了我们的探测器的最先进性能。代码和模型将在https://github.com/DetectionTeamUCAS上获得

一、介绍

目标检测是计算机视觉的基本任务之一，各种通用检测器[12,15,11,26,30,5,31]已经被设计出来。希望的结果在COCO[24]和VOC2007[9]等基准上实现。然而，大多数现有的检测器并没有特别注意在开放环境中用于健壮的对象检测的一些有用方面:小的对象、杂乱的排列和任意的方向。
在现实世界的问题中，由于摄像头分辨率等原因的限制，感兴趣的对象可以是非常小的尺寸，例如用于检测交通标志，街道上公共摄像头下的小人脸。此外，物品的范围可以非常密集，例如购物中心的商品。此外，对象不能再定位水平，如在COCO, VOC2007，场景文本检测，文本可以在任何方向和位置。
特别是遥感图像面临着上述三大挑战，具体分析如下:

小目标：航拍图像通常包含小物体，与周围复杂的场景相映成景;
凌乱的安排：探测对象往往密集排列，如车辆、船舶等;
任意方向：航拍图像中的物体可以以不同的方向出现。遥感中普遍存在的大宽高比问题进一步挑战了这一问题。
在本文中，我们主要讨论了我们的方法在遥感的背景下，而方法和问题是通用的，我们已经测试了各种数据集超出航空图像将在实验中显示。

许多现有的通用探测器如FasterRCNN[31]已经被广泛应用于空中目标检测。然而，这类检测器的设计往往基于隐含的假设，即边界框基本处于水平位置，这对于航空图像(以及其他检测任务，如场景文本检测)不是这样的。流行的非最大抑制(NMS)技术进一步突出了这种限制处理，因为它会抑制在水平线上任意方向上密集排列的物体的检测。此外，基于水平区域的方法在方向估计上具有粗糙的分辨率，这是遥感提取的关键信息。
我们提出了一种新的多类别旋转检测器scdet，用于解决以下问题:

小对象:采样融合网络(SF-Net)，结合特征融合和更精细的锚点采样;
噪声背景:为了抑制噪声、突出前景，开发了由像素注意网络和通道注意网络组成的监督多维注意网络(MDA-Net)。
任意方向上的杂乱密集物体:通过引入角度相关参数进行估计，设计了一个角度敏感网络。

结合这三种技术，我们的方法在公共数据集上取得了最先进的性能，包括两个遥感基准DOTA和NWPU VHR-10。本文的贡献如下:

针对小目标，通过特征融合和锚点采样，设计出适合的特征融合结构。
针对杂乱的小目标检测，开发了一个有监督的多维注意网络，以减少背景噪声的不利影响。
通过增加iou常量因子，改进了平滑L1损耗，从而解决了旋转包围盒回归的边界问题。
也许更重要的是，在4.2节中，我们展示了所提出的技术是通用的，也可以应用于自然图像，并与通用的检测算法相结合，它超越了目前最先进的方法，或通过组合进一步改进现有的方法。

二、相关工作

现有的检测方法主要假设待检测目标位于图像中的水平线上。在开创性的工作[12]中，提出了一个用于基于区域的检测的多级R-CNN网络，并在精度和效率方面进行了一系列改进，包括Fast R-CNN[11]、Faster R-CNN[31]和基于区域的完全卷积网络(R-FCN)[5]。另一方面，也有一些最近的工作直接返回边界框，例如Single-Shot Object Detector (SSD)[26]和you only look once (YOLO)[30]，从而提高了速度。
正如上面所讨论的，对于小的物体、密集的排列和任意的旋转，存在一些具有挑战性的场景。然而，尽管上述探测器在实践中很重要，但它们并没有得到特别的解决。特别是航空图像，由于其对国家和社会的战略价值，还努力发展适合遥感的方法。RP-Faster R-CNN框架是在[14]中针对小对象开发的。[40]将变形卷积层[6]和R-FCN结合，提高了检测精度。最近，[40]中的作者采用了自顶向下和跳过连接的方法来生成一个高分辨率的单一高级别特征图，从而提高了可变形的Faster R-CNN的性能。然而，基于水平区域的探测器仍然面临着上述规模、方向和密度等瓶颈的挑战，这就需要在水平区域检测的设置之外采用更有原则的方法。另一方面，对于任意方向的目标的探测，在遥感方面有一个工作思路。但是，这些方法往往针对特定的对象类别，如vehicle [36]， ship [41, 42, 28, 43, 27]， aircraft[25]等。虽然最近有一些多类别旋转区域检测模型的方法[2,8]，但它们缺乏处理小尺寸高密度的原则性方法。
与自然图像的检测方法相比，关于场景文本检测的文献[19,29]往往更注重物体的方向。而这些方法在处理基于航空图像的目标检测时仍然存在困难:原因之一是大多数文本检测方法都局限于单类别目标检测[44,34,7]，而对于遥感来说往往有很多不同类别需要识别。另一个原因是航空图像中的目标往往比场景文本中的目标更接近，这限制了基于分割的检测算法的适用性[7,44]，而在其他情况下，基于分割的检测算法可以很好地处理场景文本。此外，通常存在大量密集分布的目标，需要有效的检测。
本文对上述各方面进行了综合考虑提出了一种有原则的航空图像多类别任意目标检测方法。

三、提出的方法

我们首先给出我们的两阶段方法的概述，如图1所示。在第一阶段，通过添加SF-Net和MDA-Net，期望feature map包含更多的feature信息和更少的噪点。对于角度参数的位置灵敏度，这一阶段仍然回归水平框。通过改进的五参数回归和第二阶段各方案的旋转非最大抑制(R-NMS)操作，我们可以得到任意旋转下的最终检测结果。

scdet包括针对小型和杂乱对象的SF-Net和MDA-Net，以及针对旋转对象的旋转分支。

3.1 精细采样与特征融合网络

在我们的分析中，检测小目标存在两个主要障碍:对象特征信息不足和锚点样本不足。这是因为由于使用了池化层，小对象在深层丢失了大部分特征信息。同时，高级别特征图较大的采样步幅往往会直接跳过较小的对象，导致采样不足。

特征融合

一般认为，低级特征映射可以保留小对象的位置信息，而高级特征映射可以包含更高层次的语义线索。特征金字塔网络(FPN)[23]、TopDown调制网络(TDM)[35]和反向连接目标先验网络(RON)[21]是常用的特征融合方法，这些方法包括以不同形式组合高、低层次特征图。

更好的抽样

训练样本不足和不平衡会影响检测性能。通过引入期望最大重叠(EMO)评分，作者在[45]中计算了锚点和对象的union (IoU)的期望最大交集。他们发现，锚步(SA)越小，EMO得分越高,统计上导致改善所有对象的平均最大IoU。下图分别显示了给定步长16和步长8的小目标采样结果。可以看出，S_A样本越小，越高质量的样本就能很好地捕捉到小目标，这对检测器的训练和推理都有帮助。

不同锚步S_A的锚点采样。黄橙色边界框代表anchor，绿色代表ground-truth，红色框代表ground-truth中IoU最大的anchor。
基于以上分析，我们设计了如下图所示的精细采样与特征融合网络(SF-Net)。在基于锚点的检测框架中，S_A的值等于特征地图相对于原始图像的约简因子。换句话说，S_A的值只是2的指数倍数。SF-Net通过改变feature map的大小来解决这一问题，使得S_A的设置更加灵活，可以进行更多的自适应采样。
SF-Net——F3的S_A较小，同时充分考虑了特征融合和对不同尺度的适应性
为了减少网络参数，SF-Net仅在Resnet[16]中使用C3和C4进行融合，平衡语义信息和位置信息，而忽略了其他不太相关的特征。简单地说，SF-Net的第一个通道对C4进行采样，使其S_A= S，其中S是预期的锚步。第二个通道也将C3的样本提升到相同的大小。然后，我们通过C3通过启始结构来扩展其接受域并增加语义信息。初始结构包含各种比值卷积核，以捕获对象形状的多样性。最后，将两个通道按元素顺序相加，得到一个新的特征映射F3。下表给出了不同S_A下DOTA的检测精度和训练开销。我们发现最优的S_A依赖于特定的数据集，特别是关于小物体的尺寸分布。为了兼顾精度和速度，本文普遍将S的值设为6。
不同步幅S_A下DOTA上18K迭代的精度和平均训练开销

3.2 多维关注网络

由于航空图像等真实数据的复杂性，RPN提供的方案可能会引入大量的噪声信息，如下图（b）所示。过大的噪声会淹没目标信息，目标之间的边界会变得模糊【下图(a)】，导致漏检和虚警增加。因此，有必要加强对象线索，削弱非对象信息。许多注意结构[18,17,37,38]已经被提出来解决遮挡、噪声和模糊问题。然而，大多数方法都是无监督的，难以指导网络学习的特定目的。

多维注意力网络的可视化：a. 模糊边界 b. 注意网络输入特征图 c. 注意网络输出特征图 d. 显著地图 e. 二进制映射 f. 地面实况
为了在复杂背景下更有效地捕获小对象，我们设计了一个监督多维注意力精简器(MDA-Net)，如下图所示。具体来说，在像素注意网络中，feature map F3经过不同比值卷积核的初始结构，然后通过卷积运算学习出一个双通道显著性map(上图d)。显著性地图分别表示前景和背景的分数。然后,Softmax操作在显著性映射上执行，并选择其中一个通道与F3相乘。最后得到一个新的信息特征图A3，如上图c所示。需要注意的是，Softmax函数后的显著性映射的值在[0,1]之间。换句话说，它可以降低噪声，相对增强目标信息。由于显著图是连续的，非对象信息不会被完全消除，有利于保留一定的上下文信息，提高鲁棒性。为了指导网络学习这一过程，我们采用了监督学习方法。首先，我们可以根据地面实况很容易得到一个二值图作为标签(如上图e所示)，然后用二值图和显著性图的交叉熵损失作为注意力损失。此外，我们还使用SENet[18]作为频道注意网络进行辅助，减少比的值为16。

设计的mda网络由通道注意网络和像素注意网络组成

3.3 旋转的分支

RPN网络为第二阶段提供了粗略的建议。为了提高RPN的计算速度，我们在培训阶段以网管操作回归箱中12000个的最高分作为建议，得到2000个。在测试阶段，NMS从10,000个回归箱中提取了300个建议。
在第二阶段，我们使用5个参数(x, y, w, h， θ)来表示任意方向的矩形。在[−π/2,0)范围内，θ定义为与x轴的锐角，另一侧定义为w。这一定义与OpenCV一致。因此，在轴向边界盒上计算欠条可能会导致歪斜交互边界盒的欠条不准确，进而破坏边界盒的预测。针对这一问题，提出了一种基于三角剖分的歪斜欠条计算[29]的实现方法。我们使用旋转非最大抑制(R-NMS)作为基于倾斜IoU计算的后处理操作。对于数据集中形状的多样性，我们为不同的R-NMS设置了不同的阈值类别。另外，为了充分利用预处理权值ResNet，我们将fc6和fc7两个全连接层替换为C5 block和global average pooling (GAP)。旋转包围盒的回归为:

其中x、y、w、h、θ分别表示方框的中心坐标、宽度、高度和角度。变量x, x_a, x^’分别是ground-truth box, anchor box和predicted box (y, w, h, θ)。

3.4 损失函数

使用 multi-task loss ，定义如下:其中N表示提案的个数，t_n表示对象的标签，p_n是由Softmax函数计算出的各类的概率分布，t_n^’是一个二进制值(t_n^’ = 1表示前景，t_n^’ = 0表示背景，不回归)。V^’ _*j表示预测的偏移向量，V _*j表示groundtruth的目标向量。U_ij, u^’_ij分别表示掩模像素的标签和预测。IoU表示预测框与ground-truth的重叠。超参数λ₁， λ₂， λ₃控制权衡。此外，分类损失Lclsis Softmax交叉熵。回归损失Lregis平滑L1损失定义在[11]，注意损失Lattis像素级Softmax交叉熵。
特别是旋转角度存在边界问题，如图6所示。它显示了一个理想的回归形式(蓝盒子对于红框逆时针旋转)，但由于角度的周期性，这种情况的损失是非常大的。

因此，模型还需要进行其他复杂形式的回归(如缩放w和h时蓝框顺时针旋转)，增加了回归的难度，如图7a所示。为了更好地解决这个问题，我们在传统平滑L1损耗中引入了IoU常数因子|−log(IoU)| / |L_reg(v^’_j,v_j)|，如multi-task loss定义式所示。

可以看出，在边界情况下，损失函数近似等于|−log(IoU)|≈0，消除了损失的突然增加，如图7b所示。新的回归损耗可以分为两个部分，L_reg(v^’_j,v_j) / | L_reg(v^’_j,v_j)|决定梯度传播的方向，|−log(IoU)|决定梯度的大小。此外，利用欠条优化定位精度与欠条主导度量相一致，比坐标回归更直接有效。

四、实验

测试是由TensorFlow[1]在Nvidia Geforce GTX 1080 GPU和8G内存的服务器上实现的。我们在空中基准和自然图像上进行实验，以验证我们的技术的通用性。注意，我们的技术与特定的网络骨干正交。在实验中，我们使用Resnet-101作为遥感基准的骨干，使用FPN和R2CNN分别作为COCO、VOC2007和ICDAR2015的基准。

4.1 航空影像实验

4.1.1 数据和规范

基准DOTA[39]用于航空图像中的目标检测。它包含了来自不同传感器和平台的2806张航空图像。图像大小范围从800×800到4,000×4,000像素，并包含显示各种规模、方向和形状的对象。然后专家用15种常见的对象类别对这些图像进行注解。完全注释的DOTA基准包含188,282个实例，每个实例都用任意四边形标记。DOTA有两个检测任务:水平边界框(HBB)和面向边界框(OBB)。随机选取一半的原始图像作为训练集，1/6作为验证集，1/3作为测试集。我们将图像分成800 × 800的子图像，重叠200像素。
公共基准NWPU VHR-10[4]包含10类用于检测的地理空间对象。这个数据集完全从谷歌Earth和V aihingen数据集中裁剪出800张高分辨率(VHR)遥感图像，并由专家手工标注。
我们使用预先训练的ResNet-101模型进行初始化。对于DOTA，该模型总共经过300k次迭代训练，从3e-4到3e-6，在100k和200k次迭代过程中学习率发生变化。对于NWPU VHR-10，训练数据集、验证数据集和测试数据集的分割率分别为60%、20%和20%。该模型总共经过20k次迭代训练，学习速率与DOTA相同。重量衰减为0.0001，动量为0.9。我们使用MomentumOptimizer作为优化器，除了在训练过程中随机翻转图像外，没有进行数据增强。
对于参数设置，我们将3.1节中讨论的期望锚步距S设置为6，并将基准锚尺寸设置为256，锚尺度设置为2−4至21。由于DOTA和NWPU VHR-10中的多分类对象形状不同，我们将锚定比设置为[1/1,1/2,1/3,1/4,1/5,1/6,1/7,1/9]。这些设置确保每个ground-truth都能分配阳性样本。当IoU > 0.7时，锚点被赋值为正样本，当IoU < 0.3时，锚点被赋值为负样本。此外，由于大长宽比矩形中角度与欠条之间的敏感性，第二阶段的两个阈值分别设置为0.4。对于训练，两个阶段的小批量大小是512。Eq. 3中的超参数设置为λ₁= 4， λ₂= 1， λ₃= 2。

4.1.2 Ablation Study

基线设置

我们选择Faster-RCNN-based R²CNN[19]作为消融研究的基线，但不限于此方法。为了公平起见，所有实验数据和参数设置严格一致。我们使用平均精度(mAP)作为性能的衡量标准。这里报告的DOTA结果是通过向官方DOTA评估服务器1提交我们的预测而获得的。

MDA-Net效果

如第3.2节所述，注意结构有利于抑制噪声的影响，突出对象信息。从表2也可以看出，加入像素注意网络后，大部分目标的检测结果都有不同程度的改善，总mAP增加了3.67%。MDA-Net进一步提高了桥梁、大型车辆、船舶、港口等大纵横比目标的检测精度。
与像素注意力相比，MDANet使mAP增加了约1%，达到65.33%。表5显示了监督学习是MDANet的主要贡献而不是计算。

SF-Net效果

减小锚点的步长和特征融合是提高小目标检测的有效手段。在表2中，我们还研究了[45]中提供的技术。移位锚点(shift anchor, SA)和移位抖动(shift jittering, SJ)都遵循了利用单个特征点回归多个子区域的边界框的思想。实验表明，这两种策略都很难按照原论文的观察结果提高准确率。扩大特征映射是一种很好的减少S_A的策略，包括双线性上采样(BU)、双线性上采样带跳跃连接(BUS)和扩展卷积(DC)。虽然这些方法都考虑到了采样对小目标检测的重要性，检测性能都有了不同程度的提高，但是S_A的设置仍然不够灵活，不能获得最好的采样结果。SF-Net有效地模拟了特征融合和S_A设置的灵活性，取得了68.89%的最佳性能，尤其受益于车辆、船舶、储罐等小目标的改进。

IoU-Smooth L1损耗的影响

IoU-Smooth L1 Loss消除了角度的边界效应，使模型更容易回归到物体坐标。这种新的损耗使检测精度提高到69.83%。

图像金字塔效应

基于图像金字塔的训练和测试是提高成绩的有效手段。ICN[2]方法采用图像级联网络结构，这和图像金字塔的概念很相似。这里我们将原始图像随机缩放到[600×600, 800×800, 1000 × 1000, 1200 × 1200]，然后发送到网络进行训练。为了进行测试，每个图像在四个尺度上进行测试，并由R-NMS组合。如表2所示，图像金字塔可以显著提高检测效率，达到72.61%的mAP。各类在DOTA上的检测结果如图8所示。

4.1.3 对等的方法比较

OBB Task

除了DOTA给出的官方基线外，我们还比较了适用于多类别旋转目标检测的RRPN[29]、R2CNN[19]、R-DFPN[41]、ICN[2]和RoI-Transformer[8]。表3显示了这些方法的性能。RoI-Transformer、ICN和SCRDet在小目标检测中的优异性能归功于特征融合。SCRDet 在融合过程中，减小了接收场的扩张和噪声的衰减，因此对大型目标的融合效果优于ICN和RoI-Transformer。我们的方法在现有发表的结果中排名第一，达到了72.61%的mAP。

HBB Task

我们使用DOTA和NWPU VHR-10来验证我们提出的方法，并在代码中屏蔽了角度参数。表3和表4分别显示了两个数据集的性能。在已有的DOTA文献中，我们也排名第一，75.35%左右。对于NWPU VHR-10数据集，我们将其与9种方法进行比较，获得了最好的检测性能，达到91.75%。我们的方法在超过一半的类别上达到了最好的检测精度。

4.2 自然图像实验

为了验证模型的通用性，我们在通用数据集和通用检测网络FPN[23]和R2CNN上进一步验证了所提出的技术[19]。我们选择COCO[24]和VOC2007[9]数据集，因为它们包含很多小对象。我们也使用ICDAR2015[20]，因为有旋转的文本用于场景文本检测。
由表6可知，在COCO[24]和VOC2007[9]数据集上，FPN∗加MDA-Net可以分别增加0.7%和2.22%。
提出的结构在通用数据集上的有效性。符号∗表示我们自己的实现。对于VOC2007，所有方法都在VOC2007训练集上进行训练，并在VOC2007测试集上进行测试。对于COCO，所有的结果都是在极小集上得到的。ICDAR2015的结果通过提交到官方网站获得。
如图9所示，MDA-Net在密集和小目标检测方面都有很好的性能。ioussmooth loss对水平区域检测改进不大，这也反映了它对旋转检测边界问题的针对性。
在ICDAR2015中，根据[19]，R²CNN-4单标度达到74.36%。由于它不是开源的，我们重新实现了它，根据论文中旋转框的定义，我们的版本称为R²CNN-4∗，没有多池大小结构，我们的版本可以实现77.23%的mAP。然后，我们用我们提出的技术装备R²CNN-4∗，并将其称为SCRDet-R²CNN。在单尺度下达到最高性能80.08%。再次证明了本文提出的结构的有效性。从图10可以看出，SCRDet-R²CNN对于密集目标检测具有明显的较好的召回效果。

COCO和ICDAR2015的检测结果。第一列是R²CNN-4∗使用我们的技术(SCRDet-R²CNN)的结果，第二列是普通的R²CNN-4∗。红色箭头表示遗漏的对象

五、结论

针对航空图像中常见的任意旋转目标，提出了一种端到端多分类检测器。考虑特征融合和锚点采样等因素，提出了一种添加较小S_A的采样融合网络。同时，该算法通过一个有监督的多维注意力网络来减弱噪声的影响，突出目标信息。此外，我们还实现了旋转检测，以保持方向信息，解决密集的问题。我们的方法在两个公共遥感数据集:DOTA和NWPU VHR-10上实现了最先进的性能。最后，我们在COCO、VOC2007和ICDAR2015等自然数据集上进一步验证了我们的结构。

AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
【3.6 python中的numpy编写一个“手写数字识”的神经网络】 wang151038606 深度学习入门 python numpy 神经网络
3.6python中的numpy编写一个“手写数字识”的神经网络要使用Python中的NumPy库从头开始编写一个“手写数字识别”的神经网络，我们通常会处理MNIST数据集，这是一个广泛使用的包含手写数字的图像数据集。但是，完全用NumPy来实现神经网络（包括数据的加载、预处理、模型定义、前向传播、损失计算、反向传播和权重更新）是一个相当复杂的任务，因为NumPy本身不提供自动微分或高级优化算法（
Python计算机视觉编程第三章图像到图像的映射一只小小程序猿计算机视觉 python opencv
目录单应性变换直接线性变换算法仿射变换图像扭曲图像中的图像分段仿射扭曲创建全景图RANSAC拼接图像单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。单应性变换本质上是一种二维到二维的映射，可以将一个平面内的点映射到另一个平面上的对应点。代码如下：impo
DIODE：超高分辨率室内室外数据集（猫脸码客第186期）猫脸码客: catCode2024 开源数据集猫脸码客开源数据集超高分辨率室内室外数据集
亲爱的读者们，您是否在寻找某个特定的数据集，用于研究或项目实践？欢迎您在评论区留言，或者通过公众号私信告诉我，您想要的数据集的类型主题。小编会竭尽全力为您寻找，并在找到后第一时间与您分享。在计算机视觉和深度学习领域，深度信息作为三维空间感知的重要组成部分，对于实现高级视觉任务如场景理解、机器人导航、增强现实等具有至关重要的作用。然而，获取准确且密集的深度数据一直是一个挑战，尤其是在同时涵盖室内和室
yolov5单目测距+速度测量+目标跟踪 cv_2025 YOLO 目标跟踪人工智能计算机视觉机器学习图像处理 opencv
要在YOLOv5中添加测距和测速功能，您需要了解以下两个部分的原理：单目测距算法单目测距是使用单个摄像头来估计场景中物体的距离。常见的单目测距算法包括基于视差的方法（如立体匹配）和基于深度学习的方法（如神经网络）。基于深度学习的方法通常使用卷积神经网络（CNN）来学习从图像到深度图的映射关系。单目测距代码单目测距涉及到坐标转换，代码如下：defconvert_2D_to_3D(point2D,R,
深度学习入门篇：PyTorch实现手写数字识别 AI_Guru人工智能深度学习 pytorch 人工智能
深度学习作为机器学习的一个分支，近年来在图像识别、自然语言处理等领域取得了显著的成就。在众多的深度学习框架中，PyTorch以其动态计算图、易用性强和灵活度高等特点，受到了广泛的喜爱。本篇文章将带领大家使用PyTorch框架，实现一个手写数字识别的基础模型。手写数字识别简介手写数字识别是计算机视觉领域的一个经典问题，目的是让计算机能够识别并理解手写数字图像。这个问题通常作为深度学习入门的练习，因为
探索深度学习的奥秘：从理论到实践的奇幻之旅小周不想卷深度学习
目录引言：穿越智能的迷雾一、深度学习的奇幻起源：从感知机到神经网络1.1感知机的启蒙1.2神经网络的诞生与演进1.3深度学习的崛起二、深度学习的核心魔法：神经网络架构2.1前馈神经网络（FeedforwardNeuralNetwork,FNN）2.2卷积神经网络（CNN）2.3循环神经网络（RNN）及其变体（LSTM,GRU）2.4生成对抗网络（GAN）三、深度学习的魔法秘籍：算法与训练3.1损失
卷积神经网络（CNN）详细介绍及其原理详解（二） FFmpeg123 Pytorch cnn 深度学习人工智能
接上一文继续;五、全连接层假设还是上面人的脑袋的示例，现在我们已经通过卷积和池化提取到了这个人的眼睛、鼻子和嘴的特征，如果我想利用这些特征来识别这个图片是否是人的脑袋该怎么办呢？此时我们只需要将提取到的所有特征图进行“展平”，将其维度变为1×x1×x1×x，这个过程就是全连接的过程。也就是说，此步我们将所有的特征都展开并进行运算，最后会得到一个概率值，这个概率值就是输入图片是否是人的概率，这个过程
OpenCV高阶操作富士达幸运星 opencv 人工智能计算机视觉
在图像处理与计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）无疑是最为强大且广泛使用的工具之一。从基础的图像读取、1.图片的上下，采样下采样（Downsampling）下采样通常用于减小图像的尺寸，从而减少图像中的像素数。这个过程可以通过多种方法实现，但最常见的是通过图像金字塔中的pyrDown函数（在OpenCV中）或其他类似的滤波器（如平均池化、最
深入掌握大模型精髓：《实战AI大模型》带你全面理解大模型开发！努力的光头强人工智能 langchain prompt transformer 深度学习
今天，人工智能技术的快速发展和广泛应用已经引起了大众的关注和兴趣，它不仅成为技术发展的核心驱动力，更是推动着社会生活的全方位变革。特别是作为AI重要分支的深度学习，通过不断刷新的表现力已引领并定义了一场科技革命。大型深度学习模型（简称AI大模型）以其强大的表征能力和卓越的性能，在自然语言处理、计算机视觉、推荐系统等领域均取得了突破性的进展。尤其随着AI大模型的广泛应用，无数领域因此受益。AI大模型
【图像压缩】奇异值分解SVD灰色图像压缩（可设置压缩比）【含Matlab源码 4358期】 Matlab武动乾坤 Matlab图像处理（进阶版）matlab
✅博主简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，Matlab项目合作可私信。个人主页：海神之光代码获取方式：海神之光Matlab王者学习之路—代码获取方式⛳️座右铭：行百里者，半于九十。更多Matlab仿真内容点击Matlab图像处理（进阶版）路径规划（Matlab）神经网络预测与分类（Matlab）优化求解（Matlab）语音处理（Matlab）信号处理（Matlab）车间调度
计算机视觉—照相机（下） zidea
封面焦距(FieldofView)同一位置相机用不同焦距，28mmFieldofView就变小，85mm时候的Fieldofview也就是只有28度视野，每一个物体在通常尺寸的胶片上像素也就是越多，chromaticAberration焦距和是波长相关，不同颜色光聚焦在不同位置。这种现象在物体边缘尤为明显。颜色颜色说简单也简单，说复杂也复杂，我们在高中物理已经知道可见光是电磁波，不同颜色对应不同波
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

目标检测论文——对小的、杂乱的和旋转的物体进行更稳健的检测：SCRDet

论文简介

论文中文翻译:《对小的、杂乱的和旋转的物体进行更稳健的检测：SCRDet》

论文名称:《SCRDet: Towards More Robust Detection for Small, Cluttered and Rotated Objects》

摘要

一、介绍

二、相关工作

三、提出的方法

3.1 精细采样与特征融合网络

特征融合

更好的抽样

3.2 多维关注网络

3.3 旋转的分支

3.4 损失函数

四、实验

4.1 航空影像实验

4.1.1 数据和规范

4.1.2 Ablation Study

基线设置

MDA-Net效果

SF-Net效果

IoU-Smooth L1损耗的影响

图像金字塔效应

4.1.3 对等的方法比较

OBB Task

HBB Task

4.2 自然图像实验

五、结论

你可能感兴趣的:(计算机视觉,神经网络)