Hali_Botebie

【论文】Poly-yolo: 改进anchor分配问题

文章目录

Poly-yolo: higher speed,more precise detection and instance segmentation for yolov3
- 1 修改了骨干网络增加CE模块
- 2 重写标签
- 3、修改了输出层
- 3.1 修改细节
- 3.2 修改目的：改进anchor分配问题
- 4 检测多边形 Instance segmentation with Poly-YOLO
- 4.1 The principle of bounding polygons
- 4.2 Integration with Poly-YOLO
cites

Poly-yolo: higher speed,more precise detection and instance segmentation for yolov3

Poly-YOLO建立在YOLOv3的原始思想的基础上. 本文的贡献
1、修改了骨干网络增加CE模块
2、修改了标签分配的逻辑，avoid to miss the training with close object at small feature map.
3、修改了输出层，融合特征图后在进行回归，适应在单一的检测场景中提升更好的性能。
4、多边形检测

1 修改了骨干网络增加CE模块

修改YOLO架构，是在主干中使用squeeze-and-excitation(SE)块。像其他许多神经网络一样，Darknet-53使用重复块，其中每个块由卷积和跳连组成。(SE)块允许使用空间和通道的信息，这带来准确性的提高。通过(SE)块和提高输出分辨率，降低了计算速度。由于速度是YOLO的主要优势，为了平衡我们在特征提取阶段减少了卷积滤波器的数量，即设置为原始数的75%。

此外，neck和head较轻，共有37.1M的参数，明显低于YOLOv3(61.5M)。不过，Poly-YOLO比YOLOv3的精度更高。

再者，我们还提出了poly-yolo lite，旨在提高处理速度。在特征提取器和head中，这个版本只有Poly-YOLO66%的滤波器数量。最后，s1减到1/4。yolo lite的参数个数为16.5M。

2 重写标签

由于YOLO系列都是基于图像cell栅格作为单元进行检测，以416416大小的图像为例，在图像分辨率随着卷积下降到1313的特征图大小时，这时候特征图一个像素点的感受野是32*32大小的图像patch。而YOLOV3在训练时候，如果出现相同两个目标的中心位于同一个cell，那么前面一个目标就会被后面目标重写，也就是说两个目标由于中心距离太近以至于在特征图上将采样成为同一个像素点的时候，这时候其中有个目标会被重写而无法进行到训练当中。

label重写问题：不会在原分辨率大小时候发生，本文的关注点是在尺度scale=1/8，1/16，1/32的尺度上的情况。

如下图所示，红色目标为因为重写而没有加入到训练中的目标，可以看到，在这样一个特征图上，重写的目标数量还不少，27个目标里有10个都被重写，特别是比较稠密的地方。

3、修改了输出层

上图显示了原始体系结构和新体系结构之间的比较。Poly-YOLO在特征提取器部分每层使用较少的卷积滤波器，并通过squeeze-and-excitation模块扩展它。较重的neck block被使用stairstep进行上采样、带有hypercolmn的轻量block所取代。head使用一个而不是三个输出，具有更高的分辨率。

3.1 修改细节

使用hypercolmn实现对于多个尺度部分的单尺度输出合成：
设O是一个特征图，u(·ω)函数表示以因子ω对输入图像进行上采样，m(·)函数表示一个转换，把a×b×c·转为a×b×c×δ维度的映射，δ是一个常数。此外，认为g(O1，…，On) 是一个n元的composition/aggregation函数。为此，使用hypercolmn的输出特征图如下所示：

从公式中可以明显看出，存在着很高的不平衡:

一个 $O_1$ 的单值投影到O的单值中，
而 $O_n$ 的单值却直接投影成 $2^{n−1}$ 的值中。

为了打破这种不平衡，我们建议使用计算机图形中已知的staircase方法，
staircase插值增加(或降低)图像分辨率最大10%，直到达到期望的分辨率。与直接上采样相比，输出更平滑。这里使用最低可用的upscale因子2。形式上定义staircase输出特征映射O '为：

参见下图:

如果我们考虑最近邻上采样，O=O '保持不变。对于双线性插值(和其他)，O/=O '用于非齐次输入。关键是，无论是直接上采样还是staircase方法，计算复杂度都是相同的。虽然staircase方法实现了更多的添加，但它们是通过分辨率较低的特征图计算的，因此添加的元素数量是相同的。

3.2 修改目的：改进anchor分配问题

YOLOv3中采用kmeans算法聚类得到特定的9个anchor，并且以每三个为一组，大尺度的特征图负责预测小物体，中等尺度和小尺度的特征图负责预测大物体。一个特定的GT框与哪个scale的anchor匹配度最高，就会被指定给哪个scale，正常情况下应该是不同大小的物体会被anchor分配到不同预测层进行预测。

但是这种分配机制只适用于标准分布M~U(0,r)，均值u=0，标准差σ^2 = r

然而，在实际问题中，均值u=0.5r，标准差σ^2 = r是一个更现实的情况，这将导致大多数box将被中间输出层(中等大小)捕获，而其他两个层将未得到充分利用。

为了说明这个问题，假设两个box：m1和m2；前者与放置在高速公路上的摄像头的车牌检测任务相连接，后者与放置在车门前的摄像头的人检测任务相连接。
对于这样的任务，我们可以获得：

m1∼(0.3r,0.2r)，因为这些牌将会覆盖小的区域，
m2∼(0.7r,0.2r)，因为人类将会覆盖大的区域。

对于这两个集合，分别计算anchor。第一种情况导致的问题是，中、大型的输出规模也将包括小的anchor，因为数据集不包括大的目标。这里，标签重写的问题将逐步升级，因为需要在粗网格中检测小目标。反之亦然。大目标将被检测在小和中等输出层。在这里，检测将不会是精确的，因为中小输出层有有限的感受野。三种常用量表的感受野为{85×85,181×181,365×365}。这两种情况的实际影响是相同的：性能退化。

在介绍YOLOv3的文章中，作者说:“YOLOv3具有较高的小目标AP性能。但是，在中、大型目标上的性能相对较差。” 我们认为YOLOv3出现这些问题的原因就是在此。

anchor分布问题，有两种解决办法：
第一种方法：
kmeans聚类流程不变，但是要避免出现小物体被分配到小的特征图上训练和大目标被分配到大输出特征图上面训练问题，具体就是首先基于网络输出层感受野，定义三个大概范围尺度，然后设置两个阈值，强行将三个尺度离散化分开；然后对bbox进行单独三次聚类，每次聚类都是在前面指定的范围内选择特定的bbox进行，而不是作用于整个数据集。主要是保证kmeans仅仅作用于特定bbox大小范围内即可。但是缺点也非常明显，如果物体大小都差不多，那么几乎仅仅只有一个输出层有物体分配预测，其余两个尺度在“摸鱼”。

第二种方法：
创建具有单个输出的体系结构，所有物体都是在这个层预测。可以避免kmeans聚类问题，但是为了防止标签重写，所以把输出分辨率调高。作者采用的事1/4尺度输出，属于高分辨率输出，重写概率很低。（创建一个具有单个输出的体系结构，该输出将聚合来自各种scale的信息。然后一次性处理所有的anchor。）
本文是采用第二种处理方法进行优化

4 检测多边形 Instance segmentation with Poly-YOLO

v3的作者说框狠傻逼我也狠喜欢掩膜但我没法应用到YOLO中。我们搞出来了一个让YOLO能做实例分割但是没有对速度有巨大负面影响的方法。在我们之前的工作[1]，我们专注于通过不规则四边形的方式让YOLO有更高准确率。我们证明了不规则四边形的方式能收敛更快，并且分类上四边形近似比矩形近似能有更高的准确率。限制在于顶点数量只能有4个。我们这里介绍了一种不需要使用递归神经网络的多边形能够使用多个顶点去检测目标的方式并且也不会减慢检测速度。
与Poly-YOLO集成(实例分割和目标检测集成)

检测多边形的思想是通用的，可以很容易地集成到任意的神经网络中。通常，必须修改三个部分：数据准备的方式、体系结构和损失函数。在Poly-YOLO中，输出层中卷积滤波器的数量必须更新。当我们只检查box时，最后一层输出维度为n=na(nc +5),na=9(anchor的个数)，nc为类别数。对基于多边形的目标检测进行集成，得到n=na(nc+5+3nv)，nv为每个多边形检测到的顶点数的最大值。

损失函数如下图所示：

l1(i,j)是对边界框中心预测的损失；
l2(i,j)是对框的尺寸的损失；
l3(i,j)是置信度的损失；
l4(i,j)是类别预测的损失；
l5(i,j)是由距离、角度和顶点置信度预测组成的边界多边形的损失。最后，qi,j∈{0, 1}是一个常数，指示第
个单元格和第j个锚点是否包含标签。
l1到l4都是和YOLOv3一样，l5是Poly-YOLO基于多边形预测扩展出来的。

4.1 The principle of bounding polygons

YOLOv3使用垂直网格，每个网格都能检测回归框，或者多个锚框中的回归框。我们用一个增加的极坐标子单元扩展每个网格，就像Figure 9中展示的那样。

v3中的回归框被描述为bi = (bix1，biy，bix2，biy2)，也就是左上和右下，我们扩展了这个元组，即bi = (bix1，biy，bix2，biy2，Vi)，Vi = {vi0，…，vin}是一个给定目标的n个极单元的一组多边形顶点。vij = {αij，βij，γij}，α和β是一个顶点的极坐标，γ是置信度。如果没有坐标存在于一个极单元，那么置信度为0，否则为1。

在常见数据集中，许多物体可以被用相似的形状覆盖因为他们经常被从相似的视角观察，区别在于目标大小而已。比如车牌，手势，人，车，几乎都有相似的形状。通用形状可以很容易被极坐标表示，这也是我们选择极坐标而不是围绕多边形的笛卡尔方法的原因。

αij表示顶点到原点的距离，βij表示角度。中心点的确定使用旧方法。我们将α归一化使用顶点到原点的距离比上回归框的对角线。

推理时，可以通过αij乘以回归框对角线取得的值来得到顶点距离原点的距离的绝对值。

这套方法让网络学习大小无关的、通用的案例，而不是大小依赖的案例。举个例子，同一辆车被放到不同的距离拍下两张照片，图片上的大小会不同，并且模型预测的各种值，置信度，角度，顶点的相对距离，两张图片都相同。当目标被检测到时，顶点到原点的距离会被乘以回归框对角线距离，两套具体值会得到，与需要直接预测每个目标的具体值的PolarMask[25]对比，这种分享的方法能使得学习更加容易。

进一步的提升也是可能的。对于βij属于[0,360]来说，可以改变为βij属于[0,1]这种线性转换。因为我们的极坐标被分为极单元，可以专注于每个单元内部的角度间隙。当一个极单元有高置信度时说明一定有顶点在其中，那么我们使用βij属于[β1，β2]来表示，其中βij1和βij2是顶点可能存在的角度的最低值与最高值。接着我们在线性转换时令βij1=0和βij2=1。以上方式就能知道顶点准确的位置。

4.2 Integration with Poly-YOLO

检测边界多边形的想法是通用的，可以很容易地集成到任意神经网络中。一般来说，需要修改三个部分：准备数据的方式、架构和损失函数。有关从语义分割标签中提取边界多边形，请参见第 5.1 节。提取的边界多边形必须以与边界框数据相同的方式进行扩充。

必须修改架构以产生预期的值。在 Poly-YOLO 的情况下，必须更新输出层中卷积滤波器的数量。当我们只检测边界框时，最后一层由 n = na(nc + 5) 卷积滤波器表示，其内核维度为 (1, 1)，其中 na 是锚点的数量（在我们的例子中是 9 个）和 nc代表多个类。在集成基于多边形的对象检测的扩展后，我们得到 n = na(nc + 5 + 3nv)，其中 nv 是每个多边形检测到的最大顶点数。我们可以观察到 nv 对卷积滤波器的数量有很大的影响。例如，当我们有 9 个锚点、20 个类和 30 个顶点时，检测边界框和多边形的输出层的过滤器将比仅检测边界框时多 4.6 倍。另一方面，增加只发生在最后一层；所有剩余的 YOLO 层都具有相同数量的参数。从这一点来看，NN参数的总数增加了可以忽略不计的0.83%，并且处理速度不受影响。弱点在于增加在最后一层，它处理高分辨率的特征图。这会导致在训练网络时对符号张量的 VRAM 需求增加，这可能会导致学习阶段使用的最大可能批大小减少。

为了解释如何修改损失函数，我们将 Poly-YOLO 中使用的多部分损失函数描述如下：

其中L1（i，j）是边界框中心预测的损失，L2（i，j）是框尺寸的损失，L3（i，j）是置信度损失，L 4(i, j) 是类预测损失，L5(i, j) 是由距离、角度和顶点置信度预测组成的边界多边形的损失。

最后，qi,j ∈ {0, 1} 是一个常数，表示第 i 个单元格和第 j 个锚点是否包含标签。

损失迭代 GwGh 网格单元和 na 锚。部分1，. . . , 4 取自 YOLOv3 并修改为使用单个输出层的形式。第 5 部分是新的，并通过多边形检测功能扩展了 Poly-YOLO。在以下公式中，我们使用 b·来表示网络的预测。损失函数的各部分定义如下：

其中 cxi,j 和 cyi,j 是盒子中心的坐标，H(·,·) 是二元交叉熵，

zi,j = 2 − w*h 用于根据其宽度 wi,j 和高度 hi,j 对第 (i, j) 个框大小进行相对加权。

其中 awj 和 ahj 是第 j 个锚点的宽度和高度

其中 q^i,j 是预测的置信度，Ii,j 是一个掩码，如果 qi,j = 0 但其预测的 IoU>0.5，则排除第 i 个单元的损失部分。

其中 Ci,j,k 是第 i 个单元格中的第 k 个类别概率。

其中 adj 是第 j 个锚点的对角线。请注意，最后一个等式是我们的多边形表示损失，这是我们的主要贡献之一。

所描述的集成方案导致同时检测边界框和边界多边形。由于协同作用，这种组合可能是有益的——卷积神经网络在其底部检测边缘，然后在中间将它们组合成更复杂的形状，并在头部 [35] 中提出高度描述性的抽象特征。因为多边形的顶点始终位于边界框内，并且顶点与边界框划定相同的对象，直觉是边界多边形部分会找到对边界框有用的特征，反之亦然。假设是带有多边形形状检测扩展的 YOLO 的训练会更高效并且收敛更快。该原理是众所周知的，并在文献中描述为辅助任务学习[36]。为了完整起见，让我们假设一个特殊情况，当一个对象是一个垂直的盒子。对于这种情况，边界框的轮廓将与边界多边形的轮廓重合，并且边界框和多边形都将检测到左操作顶点。尽管如此，这两种检测将是协同的，并且训练所需的时间将比普通边界框检测的训练更短。有关声明的验证，请参见第 5.3 节中带/不带边界多边形检测的 Poly-YOLO 检测结果

cites

Poly-YOLO：更快，更精确的检测和实例分割

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
女儿考研完报考雅思捡拾流年
是否我过于焦虑？会不会无形间让女儿觉得压力太大了啊。2022年对于我们家来说是不平常的一年。女儿今年大四，为了准备考研，暑假也没回家，年初去了学校到了年末才回家。女儿自己一个人面对考研，没有参加培训，大四学校作业论文等课业也多，她同时也是很努力复习考研的。在疫情开放很多羊的时期，女儿终于顺顺利利参加12月24、25号的考研，我们和家人都觉得女儿回家来要好好休息调养。可女儿回到家，我再查阅考研信息，
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
自动写论文的网站推荐这5款实用类工具小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款实用类工具推荐，特别是千笔-AIPassPaper。1.千笔-AIPassPaper千笔-AIPassPaper是一款功能强大且全面的AI论文写作助手，用户只需输入基本的研究需求和关键词，便能迅速生成一篇完整的论文。该工具利用先进的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
4款毕业论文参考文献格式生成器（附加详细步骤）小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在撰写毕业论文时，参考文献的格式规范是至关重要的。为了帮助学生和学者们更高效地生成符合要求的参考文献格式，本文将详细介绍四款推荐的参考文献格式生成器，并提供详细的使用步骤。1.千笔-AIPassPaper千笔-AIPassPaper是一款先进的AI辅助论文写作工具，不仅能够自动生成大纲、开题报告，还能一键生成参考文献。AI论文，免费大纲，10分钟3万字https://www.aipaperpass
AI论文写作推荐哪个好？分享5款AI论文写作带数据图表网站小猪包333 写论文人工智能深度学习计算机视觉
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款推荐的AI论文写作工具，包括千笔-AIPassPaper。千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文写作助手，旨在帮助用户快速生成高质量的论文内容。AI论文，免费大纲，10分钟3万字https:
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
毕业论文附录一般都写什么?大学生写论文是干嘛用的写个原创论文人工智能深度学习 AI写作 chatgpt 论文阅读
毕业论文的附录通常包含一些在正文中不便于展示或详细阐述的内容，但对理解论文整体又具有重要意义的资料。具体来说，附录可能包含以下内容：AI论文，免费大纲，10分钟3万字，查重高于15%退费，支持数据图表！！AIPaperPass-AI论文写作指导平台AIPaperPass是AI原创论文写作平台，免费千字大纲，5分钟生成3万字初稿，提供答辩汇报ppt、开题报告、任务书等，40篇真实中英文知网参考文献，
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
《拖延心理学》（一）你为什么会拖延？|木盒笔记纯se蓝调
《拖延心理学》是帮助你向拖延症宣战的一本书，作者简·博克和莱诺拉·袁是全球知名的拖延症治疗专家。大概每个人或多或少总会有一点拖延症的行为。比如明天要叫论文了，今天你还没有写好，你一边在焦虑症怎么办，一边又拿着手机漫无目的的刷新闻；比如你想了很久准备减肥，但是迟迟又没有行动，想着今天晚上少吃一点吧、明天我就开始运动。今天分析的笔记来告诉你“你为什么会拖延？”，解读人杨坚。有人说拖延就像巨大的泥沼，让
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
2024年华为杯数学建模研赛C题思路代码+论文助攻 DS数模 2024华为杯数学建模华为 2024华为杯 2024研究生数学建模 2024研赛
2024年华为杯研究生数学建模竞赛（以下简研赛）将于9月21日上午8时正式开始。下文包含：2024研赛思路解析、研赛参赛时间及规则信息说明、好用的数模技巧及如何备战数学建模竞赛C君将会第一时间发布选题建议、所有题目的思路解析、相关代码、参考文献、参考论文等多项资料，帮助大家取得好成绩。2024年研赛将于9月21日上午8时正式开始这里有些资料，大家可以看看：【2024最全国赛研赛数模资料包】C君珍贵
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
基于JavaWeb开发的Java+SpringMvc+vue+element实现上海汽车博物馆平台网顺技术团队成品程序项目 java vue.js 汽车课程设计 spring boot
基于JavaWeb开发的Java+SpringMvc+vue+element实现上海汽车博物馆平台作者主页网顺技术团队欢迎点赞收藏⭐留言文末获取源码联系方式查看下方微信号获取联系方式承接各种定制系统精彩系列推荐精彩专栏推荐订阅不然下次找不到哟Java毕设项目精品实战案例《1000套》感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章目录基
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方