CarNong_Blog

【深度学习-目标检测】06 - FPN 论文学习与总结

论文地址：Feature Pyramid Networks for Object Detection

论文学习

1. 摘要

多尺度特征的重要性：
- 论文强调在对象检测任务中，多尺度特征对于处理不同大小的对象至关重要。这些特征有助于编码具有尺度变化的对象。
现有方法的局限性：
- 传统的多尺度特征提取策略，如使用经典的自上而下和自下而上的特征金字塔网络，存在一定的局限性。这些方法可能导致特征信息的丢失或降级，影响了特征融合的效果。
特征金字塔网络（FPN）的提出：
- 为了克服这些限制，论文提出了一种新的网络结构，即特征金字塔网络（FPN）。FPN 旨在利用深度卷积网络的多尺度、金字塔形状的特征层次结构，创建具有强大语义信息的特征金字塔。
FPN的设计和优势：
- FPN通过自上而下的路径和横向连接结合低分辨率、语义强的特征与高分辨率、语义弱的特征。这种结构生成了在所有层次上都具有丰富语义的特征金字塔，并且从单一输入图像尺度快速构建。
应用和性能评估：
- 使用FPN的方法在基础的Faster R-CNN系统中实现了在COCO检测基准测试中的最先进单模型结果，超越了所有现有的单模型方案，包括COCO 2016挑战赛的获胜者。
- 此外，该方法在GPU上的运行速度为每秒5帧，是一种实用且准确的多尺度对象检测解决方案。

补充：传统特征金字塔和特征金字塔网络（FPN）

传统特征金字塔
- 构建方法：
  - 通过对原始图像进行多次下采样（例如每次减半）来构建一系列缩小的图像。
- 特征提取：
  - 在每个尺度上独立提取特征，通常需要对每个缩小的图像分别进行特征提取。
- 计算成本：
  - 较高，因为需要对每个尺度的图像都进行特征提取。
- 特征融合：
  - 通常不涉及跨尺度的特征融合，每个尺度的特征独立使用。
- 应用局限性：
  - 由于计算成本高，难以直接应用于深度学习模型中。
特征金字塔网络（FPN）
- 构建方法：
  - 在卷积神经网络（CNN）的基础上构建，利用网络内部的层次结构。
- 特征提取：
  - 结合了CNN中的底层（高分辨率、低语义）和高层（低分辨率、高语义）特征。
- 计算成本：
  - 相对较低，因为利用了CNN的特征提取能力，避免了重复的特征计算。
- 特征融合：
  - 通过自上而下的路径和横向连接实现跨尺度的特征融合。
- 应用灵活性：
  - 适用于深度学习和对象检测，能够有效处理多尺度信息。

2. 引言

多尺度对象识别的挑战
- 在计算机视觉中，识别不同尺度的对象是一个基本挑战。为了解决这个问题，传统上依赖于特征金字塔，这些金字塔是基于图像金字塔构建的（简称为特征化图像金字塔）。
特征化图像金字塔的作用（传统特征金字塔）
- 这些金字塔在概念上是尺度不变的，意味着对象的尺度变化可以通过在金字塔中改变其级别来抵消。这使得模型能够通过在不同位置和金字塔层级上扫描来检测不同尺度的对象。
手工设计特征的时代
- 在手工设计特征的时代，如DPM（Deformable Parts Model）对象检测器，特征化图像金字塔被广泛使用，并且需要密集的尺度采样（例如，每个八度音阶10个尺度）来获得良好的结果。
深度卷积网络的兴起
- 随着深度卷积网络（ConvNets）的发展，手工设计的特征被深度学习特征所取代。ConvNets在表示高级语义方面更加强大，对尺度变化也更加鲁棒，使得从单一输入尺度计算的特征足以进行识别。
现有方法的局限性
- 尽管ConvNets对尺度变化有一定的鲁棒性，但为了获得最准确的结果，仍然需要使用多尺度测试，并在特征化图像金字塔上进行。然而，这种方法在推理时间上的显著增加（例如，增加四倍），使其在实际应用中变得不切实际。
特征金字塔网络（FPN）的提出
- 为了解决这些限制，论文提出了特征金字塔网络（FPN）。FPN利用深度卷积网络内在的多尺度、金字塔形层次结构，以较小的额外成本构建特征金字塔。
- FPN通过自上而下的架构和横向连接来构建在所有尺度上都具有高级语义特征图。这种架构在多个应用中显示出作为通用特征提取器的显著改进。
FPN的性能和实用性
- 在基本的Faster R-CNN系统中使用FPN，作者的方法在COCO检测基准上实现了最先进的单模型结果，超越了所有现有的单模型方案，包括COCO 2016挑战赛的获胜者。
- 此外，该方法在GPU上的运行速度为每秒6帧，因此是多尺度对象检测的一个实用且准确的解决方案。

3. 相关工作

手工设计的特征和早期神经网络
- SIFT特征：最初在尺度空间极值点提取，用于特征点匹配。
- HOG特征：后来，SIFT特征和HOG特征被密集地计算在整个图像金字塔上。这些HOG和SIFT金字塔被广泛应用于图像分类、对象检测、人体姿态估计等领域。
- 快速计算特征化图像金字塔：有研究致力于快速计算特征化图像金字塔。例如，Dollár等人展示了通过首先计算在尺度上稀疏采样的金字塔，然后插值缺失层级来快速计算金字塔的方法。
- 早期的ConvNet应用：在HOG和SIFT之前，早期关于使用卷积神经网络（ConvNets）进行人脸检测的工作，通过在图像金字塔上计算浅层网络来检测不同尺度的面部。
深度卷积神经网络对象检测器
- 论文指出，尽管深度卷积网络（ConvNets）在对象检测中取得了显著进步，但在处理不同尺度的对象时，仍然面临挑战。ConvNet计算的特征层次结构具有固有的多尺度、金字塔形状，但由于不同深度导致的大的语义差距，高分辨率的映射具有低级特征，这损害了它们用于对象识别的表征能力。
单次检测器（SSD）
- SSD是首次尝试使用ConvNet的金字塔特征层次作为特征化图像金字塔的例子。理想情况下，SSD风格的金字塔将重用在前向传递中计算的不同层的多尺度特征映射。但为了避免使用低级特征，SSD放弃了重用已计算的层，而是从网络的较高层（例如VGG网络的conv4_3）开始构建金字塔，并添加了几个新层。因此，它错过了重用特征层次结构中的高分辨率映射的机会，这对于检测小对象很重要。
FPN的目标
- 论文的目标是自然地利用ConvNet的金字塔形特征层次结构，同时创建在所有尺度上都具有强语义的特征金字塔。为此，论文依赖于一个结构，该结构通过自上而下的路径和横向连接结合低分辨率、语义强的特征与高分辨率、语义弱的特征。结果是一个在所有层次上都具有丰富语义的特征金字塔，且能够从单一输入图像尺度快速构建。

4. 特征金字塔网络（FPN）

FPN的目标
- FPN的目标是利用卷积神经网络（ConvNet）的金字塔形特征层次结构，这些层次结构在低到高各个层级上都具有语义信息。FPN旨在构建一个在所有层级上都具有高级语义的特征金字塔。
- FPN是一个通用的网络，主要关注于滑动窗口提议器（如区域提议网络，RPN）和基于区域的检测器（如Fast R-CNN）。FPN也被推广到实例分割提议中。
FPN的输入和输出
- FPN处理单尺度图像作为输入，并输出在多个层级上大小成比例的特征图，这一过程是完全卷积的。这个过程与背景卷积架构（如ResNet）无关。
FPN的构建
- FPN的构建涉及自下而上的路径、自上而下的路径和横向连接。
- 自下而上的路径：这是背景ConvNet的前向计算，它计算了多个尺度的特征图，每个尺度的步长为2。在ResNet中，使用每个阶段的最后一个残差块的输出作为特征图。
- 自上而下的路径和横向连接：自上而下的路径通过上采样空间粗糙但语义上更强的特征图来模拟更高分辨率的特征。这些特征随后通过横向连接与自下而上路径的特征结合。每个横向连接合并了来自自下而上路径和自上而下路径的相同空间尺寸的特征图。
FPN的特点
- 自下而上的特征图具有较低级的语义，但由于较少的下采样，其激活更精确地定位。通过结合这些特征，FPN在所有层级上都能提供丰富的语义信息。
- FPN通过简单的最近邻上采样来增加空间分辨率，并通过额外的卷积层来减少上采样的混叠效应。

5. 应用

FPN在RPN中的应用
- RPN（区域提议网络）：RPN是一种滑动窗口的类别不可知的对象检测器。在原始的RPN设计中，一个小型子网络在单尺度的卷积特征图上的密集3x3滑动窗口上进行评估，执行对象/非对象的二元分类和边界框回归。
- FPN的适配：在FPN中，作者将RPN的单尺度特征图替换为FPN。在特征金字塔的每个层级上附加一个与原始RPN设计相同的头部（3x3卷积和两个1x1卷积）。由于头部在所有金字塔层级的所有位置上密集滑动，因此不需要在特定层级上有多尺度锚点。作者为每个金字塔层级指定单一尺度的锚点。
- 训练标签分配：训练标签基于锚点与真实边界框之间的交并比（IoU）分配。如果锚点与给定真实框的IoU最高或超过0.7，则分配正标签；如果所有真实框的IoU均低于0.3，则分配负标签。
FPN在Fast R-CNN中的应用
- Fast R-CNN（区域基础对象检测器）：Fast R-CNN使用感兴趣区域（RoI）池化来提取特征。通常在单尺度特征图上执行。
- FPN的适配：为了在FPN中使用Fast R-CNN，需要将不同尺度的RoI分配到金字塔层级。作者将特征金字塔视为由图像金字塔产生的，并据此调整区域基础检测器在图像金字塔上运行时的分配策略。具体来说，RoI的宽度和高度用于确定其应该映射到的金字塔层级。

6. 拓展：分割建议

FPN在分割建议中的应用：
- FPN不仅适用于对象检测，还可以用于生成分割提议，遵循DeepMask/SharpMask框架。 DeepMask和SharpMask在图像裁剪上训练，用于预测实例分割和对象/非对象得分。在推理时，这些模型以卷积方式运行，以在图像中生成密集的提议。
FPN的适配和实现：
- FPN易于适配以生成掩码提议。作者使用完全卷积的设置进行训练和推理。在特征金字塔的每个层级上，应用一个小型的5x5多层感知器（MLP）来预测14x14的掩码和对象得分。
  受到DeepMask和SharpMask使用图像金字塔中每个八度音阶的两个尺度的启发，作者还使用了一个输入尺寸为7x7的第二个MLP来处理半八度音阶。这两个MLP的作用类似于RPN中的锚点。
分割提议的结果：
- 基线FPN模型使用单个5x5 MLP达到了43.4的平均召回率（AR）。使用稍大的7x7 MLP，准确率基本保持不变。同时使用两个MLP可以将准确率提高到45.7 AR。将掩码输出尺寸从14x14增加到28x28可以进一步提高AR（尽管更大的尺寸开始降低准确率）。最后，将训练迭代次数加倍可以将AR提高到48.1。
- 与DeepMask、SharpMask和InstanceFCN等先前的最先进方法相比，FPN在掩码提议生成方面的准确率提高了超过8.3个点的AR。特别是在小对象上，准确率几乎翻倍。
FPN的优势和效率：
- 现有的掩码提议方法基于密集采样的图像金字塔，计算成本高。相比之下，基于FPN的方法显著更快（运行速度为每秒6到7帧）。这些结果表明，FPN是一个通用的特征提取器，可以替代图像金字塔来处理其他多尺度检测问题。

7. 结论

FPN的框架简介
- 论文提出了一种清晰简单的框架，用于在卷积神经网络（ConvNets）内部构建特征金字塔。这种方法在多个强基线和竞赛获胜者的基础上显示出显著的改进。
FPN的实用性和应用
- FPN提供了一个实用的解决方案，用于研究和应用特征金字塔，而无需计算图像金字塔。这使得FPN成为处理多尺度问题的有效工具，特别是在对象检测和分割等领域。
深度ConvNets的表现力和多尺度问题
- 尽管深度ConvNets具有强大的表征能力，并且对尺度变化具有一定的鲁棒性，但论文强调，使用金字塔表示来显式地处理多尺度问题仍然至关重要。
FPN的优势
- FPN能够在不牺牲表征能力、速度或内存的情况下，替代传统的特征化图像金字塔。这一点在对象检测和实例分割的应用中尤为突出。
未来的研究和应用
- 论文认为，FPN的这些进步将促进未来的研究和应用，并为处理多尺度问题提供了新的视角和方法。

这篇论文《Feature Pyramid Networks for Object Detection》的主要创新点和贡献可以总结如下：

特征金字塔网络（FPN）的提出：
- 论文提出了FPN，这是一种新型的网络架构，用于在卷积神经网络（ConvNets）内部构建特征金字塔。FPN有效地利用了ConvNets的多尺度、金字塔形特征层次结构。
自上而下的架构与横向连接：
- FPN采用了独特的自上而下的架构和横向连接，这种结构能够将高层的语义强特征与低层的高分辨率特征有效结合，从而在所有尺度上都生成具有丰富语义信息的特征图。
单尺度输入图像的多尺度特征提取：
- 与传统的多尺度特征提取（如图像金字塔）不同，FPN能够从单一尺度的输入图像中提取多尺度特征，显著提高了计算效率。
提高对象检测性能：
- 在标准对象检测框架（如Faster R-CNN）中应用FPN，显著提高了对象检测的准确率，特别是在处理不同尺度对象时。
实用性和效率：
- FPN提供了一种实用且高效的方法来处理多尺度问题，无需依赖于计算成本高昂的图像金字塔，同时保持了高速度和准确性。
通用性和灵活性：
- FPN不仅适用于对象检测，还可以扩展到其他应用，如实例分割，展示了其作为通用特征提取器的潜力。
推动深度学习和计算机视觉研究：
- FPN的提出为深度学习和计算机视觉领域中的多尺度问题提供了新的解决方案，有助于推动相关研究和技术的发展。

FPN

FPN的主要工作流程如下：

输入图像处理：
- 输入单尺度图像到网络。
自下而上的路径：
- 利用卷积神经网络（如ResNet）进行前向计算。
- 生成多个尺度的特征图，每个尺度的步长为2。
- 选择每个阶段的最后一层作为参考特征图。
构建顶层特征图：
- 在最高层（如ResNet的conv5）上附加一个1x1卷积层，生成最粗糙的特征图。
自上而下的路径和横向连接：
- 从顶层开始，逐层向下进行特征融合。
- 每一层的特征图通过上采样（放大2倍）与下一层的特征图合并。
- 合并时，使用1x1卷积调整通道数，并通过元素相加的方式融合特征。
生成最终特征图：
- 在每个合并后的特征图上附加一个3x3卷积层，以减少上采样的混叠效应。
- 生成一系列不同尺度但语义丰富的特征图。
对象检测或分割：
- 在特征金字塔的每个层级上进行对象检测或分割任务。
- 对于对象检测，可以使用RPN（Region Proposal Network）在每个层级上生成提议。
- 对于分割，可以在每个层级上生成分割掩码。

以YOLOv8中的FPN为例

红色是YOLOv8的主干特征提取网络，用于特征提取，生成特征图。
蓝色是YOLOv8采用的FPN结构，用于特征融合，这也是我们之后重点理解的地方。
绿色是YOLOv8的分类器。

我们可以看到，在主干特征提取网络部分，将三个不同尺度的特征图传递给了蓝色的FPN网络如下：

feat1、feat2、feat3 分别是三个尺度不同的特征层：

feat1：（80，80，256）（H,W,C）
feat2：（40，40，512）（H,W,C）
feat3：（20，20，1024）（H,W,C）(暂时忽略deep_mul)

首先，我们来看 feat3 和 feat2 特征融合的过程：

feat3 进行上采样，变成（40，40，1024），需要将宽、高变成与feat2一样。
feat3（40，40，1024）与feat2（40，40，512）在通道维度上进行融合（concat）。
feat3 + feat2 （40，40，1024+512）通过CSP（暂时理解为1x1Conv），生成了feat3 和 feat2 特征融合的结果（40，40，512)。
至此，我们获得的结果，就是融合了feat3和feat2两个特征尺度的融合特征图，这个特征图可以继续向上层feat1进行融合，以相同的方式（首先向上采样成feat1的尺寸，然后在通道维度进行融合，最后使用1x1Conv，得到融合结果）。

以上内容旨在记录自己的学习过程以及复习，如有错误，欢迎批评指正，谢谢阅读。

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
2019-12-22-22:30 涓涓1016
今天是冬至，写下我的日更，是因为这两天的学习真的是能量的满满，让我看到了自己，未来另外一种可能性，也让我看到了这两年这几年的过程中我所接受那些痛苦的来源。一切的根源和痛苦都来自于人生，家庭，而你的原生家庭，你的爸爸和妈妈，是因为你这个灵魂在那一刻选择他们作为你的爸爸和妈妈来的，所以你得接受他，你得接纳他，他就是因为他的存在而给你的学习和成长带来这些痛苦，那其实是你必然要经历的这个过程，当你去接纳的
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
阶段总结反思轻争
马上就要进入10月份了，今天做一下前段时间的总结和反思。前段时间，日更、英语、健身、护肤坚持的比较好。阅读、书法坚持的不好。1.中间被迫停更半个多月，其余时间一直在坚持日更挑战。偶尔也有不想写的时候，就做一下摘抄。因为阅读（输入）没跟上来，所以写作（输出）质量有待进一步加强。2.英语做到了一周至少学习5天，每次不少于30分钟，但是小班课没有跟上更新速度，下一步要争取利用零碎时间补听小班课。3.减肥
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
ARM驱动学习之4小结 JT灬新一嵌入式 C++arm开发学习 linux
ARM驱动学习之4小结#include#include#include#include#include#defineDEVICE_NAME"hello_ctl123"MODULE_LICENSE("DualBSD/GPL");MODULE_AUTHOR("TOPEET");staticlonghello_ioctl(structfile*file,unsignedintcmd,unsignedlo
展现思维导图魅力，不断挖掘人生宝藏思维导图讲师Mandy
第13期最强思维导图训练营已经结束一周了，但是我依旧是感觉所有学员还在努力的学习，这些学员中有教师、学生、白领、公务员、宝妈等等，只要你努力，只要你想改变自己，任何行业，任何岗位都可以参与进来，28天足以让你见成效，在这28天中，我们的学员不仅仅是收获了一枚毕业证，最重要的是让自己的思维方式得到升级，今天的你为自己投资，明天的你就会感谢你今天的付出，我们来听一听来自13期最强思维导图训练营优秀学员
2019-3-23晨间日记红红火火小耳朵
今天是什么日子起床：7点40就寝：23点半天气：有太阳，不过一会儿出来一会儿进去特别清爽的凉意，还蛮舒服的心情：小激动要给女朋友过生日啦纪念日：田田女士过生日任务清单昨日完成的任务，最重要的三件事：1.英语一对一2.运动计划3.认真护肤习惯养成：调整状态周目标·完成进度英语七天打卡（5/7）轻课阅读（87/180）音标课（25/30）读书（福尔摩斯一章）学习·信息·阅读#英语课#Cookingte
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
教育用心灵温暖心灵
@陈春丽长期学习班冯倩。今天一早就听到说高职合并，取消中专教育的教育信息。感觉是虽然知道，再听还是吓一跳。国家重视职业教育为何还要取消中专技术学校的教育？再听高中就要进行技术教育了，一部分人学习好继续努力学习考大学，一部分人在高中就可以进行职业教育接受职业教育了还要中专技术教育学校干什么呢！a有些职业教育学校转型升级快，不是孩子上完给找工作，而是学校帮孩子创业，我觉得是不错的方向！新闻新你得实时更
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
学习“论语”-第59天春峰轩
12.14子张问政。子曰：“居之无倦，行之以忠。”子张问为政之道。孔子说：“在位尽职不懈怠，执行政令要忠诚。”12.15子曰：“博学于文，约之以礼，亦可以弗畔矣夫！”孔子说：“君子广泛地学习文献，并且用礼节约束自己，也就不会离经叛道了。”12.16子曰：“君子成人之美，不成人之恶。小人反是。”孔子说：“君子成全别人的好事，而不助长别人的坏处。小人则与此相反行事。”知识点:“成人之美，不成人之恶”贯
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep