大王子呀

《Res2Net: A New Multi-scale BackboneArchitecture》论文笔记

Res2Net: A New Multi-scale BackboneArchitecture

1 INTRODUCTION
2 RELATEDWORK
- - 2.1 Backbone Networks
  - 2.2 Multi-scale Representations for Vision Tasks
  - - - 2.2.1 Object detection.
      - 2.2.2 Semantic segmentation.
      - 2.2.3 Salient object detection.
  - 2.3 Concurrent Works
3 RES2NET
- - 3.1 Res2Net Module
  - 3.2 Integration with Modern Modules
  - - - 3.2.1 Dimension cardinality.
      - 3.2.2 SE block.
4 EXPERIMENTS
- - 4.1 Implementation Details

论文链接：https://arxiv.org/abs/1904.01169
论文概述：通过在单个残差块内构造类似于分层的残差连接，为CNN提出了一种新颖的构建块。Res2Net在粒度级别表示多尺度功能，并增加了每个网络层的接收范围。可以将建议的Res2Net块插入最新的主干CNN模型，例如ResNet，ResNeXt和DLA。

1 INTRODUCTION

在自然场景中，视觉模式多以多尺度出现，如图一所示。首先，物体可能以不同的大小出现在场景中。第二，一个对象上下文基本信息可能占据一个比它本身大的区域。例如，我们需要依靠大桌子作为上下文来更好地辨别放在上面的小黑点是杯子还是笔架。第三，感知来自不同尺度的信息对于理解部件和任务对象(图像分类，对象检测，注意力预测，目标跟踪，动作识别，语义分割，对象检测，对象建议，骨架提取，立体匹配和边缘检测)是至关重要的。
不足为奇的是，多尺度特征已经广泛应用于传统特征设计和深度学习。在视觉任务中获得多尺度表示要求特征提取器使用大范围的接受域来描述不同尺度的对象/部分/上下文，卷积神经网络（CNN）通过一堆卷积算子自然学习从粗到细的多尺度特征。 CNN的这种固有的多尺度特征提取能力可以有效地解决众多视觉任务。如何设计更有效的网络架构是进一步提高CNN性能的关键。
在过去的几年中，几个骨干网络在众多具有先进性能的视觉任务中取得了显着进步。诸如AlexNet和VGGNet的早期体系结构会叠加卷积运算符，从而使数据驱动的多尺度特征学习成为可能。随后，通过使用不同内核大小的凹凸层(例如，InceptionNet)、剩余模块(例如，ResNet)、快捷连接(例如，DenseNet)和分层次层聚合(例如，DLA)。CNN主干网架构的进步表明了一种更有效、更高效的多尺度表示的趋势。

在这项工作中，我们提出了一种简单而有效的多尺度处理方法。与大多数现有的增强CNN的分层多尺度表示强度的方法不同，我们在更细粒度的层次上提高了多尺度表示能力。与一些并发工作通过利用具有不同分辨率的特征来提高多尺度能力的方法不同，我们提出的方法的多尺度是指更细粒度的多个可用接收场。为了实现此目标，我们用一组较小的滤镜组替换 $n$ 个通道的 $3 \times 3$ 滤镜组，每个滤镜组都有 $w$ 个通道（在不失一般性的情况下，我们使用 $n = s \times w$ ）。如图2所示，这些较小的滤波器组以分层的残差状样式连接，以增加输出特征可以表示的比例数。具体来说，我们将输入要素图分为几个组。一组过滤器首先从一组输入要素图中提取要素。然后将上一组的输出要素与另一组输入要素图一起发送到下一组过滤器。此过程重复多次，直到处理完所有输入要素图。最后，来自所有组的特征图被连接起来并发送到另一组 $1 \times 1$ 过滤器以完全融合信息。连同将输入要素转换为输出要素的任何可能路径，当等效接收场通过3×3滤波器时，等效接收场都会增加，由于组合效应，导致许多等效要素比例缩放。
除了现有的深度，宽度和基数，Res2Net策略还公开了一个新的维度，即规模（Res2Net块中功能组的数量），作为一个重要因素。我们在第4.4节中指出扩大规模比增加其他规模更有效。
注意，所提出的方法在更细的层次上利用多尺度潜力，这与利用分层操作的现有方法是正交的。因此，提出的构建块，即Res2Net模块，可以很容易地插入到许多现有的CNN架构中。大量的实验结果表明，Res2Net模块可以进一步提高国家最先进的CNNs的性能，例如:，ResNet，ResNeXt，DLA。

2 RELATEDWORK

2.1 Backbone Networks

近年来，目睹了无数的骨干网络，在各种情况下均实现了最先进的性能更强大的多尺度表示能力的视觉任务。按照设计，由于输入信息遵循从细到粗的方式，因此CNN具有基本的多尺度特征表示功能。AlexNet顺序堆叠过滤器，与传统的视觉识别方法相比，可显着提高性能。然而，由于有限的网络深度和过滤器的内核大小，AlexNet只有一个相对较小的接受域。VGGNet增加了网络深度，并使用更小内核的过滤器，更深层次的结构来扩展接受域，这对于从更大的范围提取特性非常有用。因此，VGGNet提供了比AlexNet更强的多尺度表示模型，参数更少。然而，AlexNet和VGGNet都直接过滤，这意味着每个特性层都有一个相对固定的接受域。
NIN将多层感知器作为微网络插入到大型网络中，以增强接收域内局部补丁的模型可分辨性。NIN中引入的 $1 \times 1$ 卷积是融合功能的流行模块。GoogLeNet利用具有不同内核大小的并行滤波器来增强多尺度表示能力。然而，由于其有限的参数效率，这种能力通常受到计算约束的限制。Inception Nets在GoogLeNet的并行路径的每个路径中堆叠更多的过滤器，以进一步扩展接收范围。

2.2 Multi-scale Representations for Vision Tasks

CNNs的多尺度特征表示对目标检测、人脸分析、边缘检测、语义分割、突出目标检测、骨架检测等视觉任务具有重要意义，提高了这些领域的模型性能。

2.2.1 Object detection.

有效的CNN模型需要在场景中定位不同尺度的物体。早期的R-CNN等工作主要依靠骨干网络，以提取多个尺度的特征。Heet .提出了SPP-Net方法，该方法在骨干网之后利用空间金字塔池来增强多尺度能力。Faster R-CNN方法进一步提出了区域提议网络，以生成各种规模的边界框。FPN方法基于Faster R-CNN，引入了特征金字塔，可从单个图像中提取具有不同比例的特征。SSD方法利用不同阶段的特征图来处理不同规模的视觉信息。

2.2.2 Semantic segmentation.

提取对象的基本上下文信息需要CNN模型来处理各种规模的特征，以进行有效的语义分割。Longet等人提出了最早的方法之一，该方法使全卷积网络（FCN）能够进行多尺度表示以实现语义分割任务。 Chenet等人在DeepLab中引入了级联无规则卷积模块，以在保持空间分辨率的同时进一步扩展接收场。最近，全球上下文信息通过PSPNet中的金字塔池方案从基于区域的特征中聚合。

2.2.3 Salient object detection.

精确定位图像中的对象区域需要了解用于确定对象显着性的大规模上下文信息，以及需要精确定位对象边界的小尺度特征。早期方法利用手工制作的整体对比度或多尺度区域特征。

2.3 Concurrent Works

最近，有一些并行的工作旨在通过利用多尺度特征来提高性能。Big-Little Net由具有不同计算复杂度的分支组成的多分支网络。OctaveConv将标准卷积分解为两种分辨率以处理不同频率的特征。MSNet通过使用由低分辨率网络学习的上采样低分辨率功能，利用高分辨率网络来学习高频残差。除了目前作品中的低分辨率表征，HRNet在网络中引入了高分辨率表征，并反复进行多尺度融合以增强高分辨率表征。或都使用或向上采样来将特征图的大小调整到原来的2倍，从而在保持甚至提高性能的同时节省计算预算。在Res2Net块中时，单个残差块模块中的分层残差状连接使接收域的变化在更细粒度的层次上可以捕获细节和全局特征。实验结果表明，Res2Net模块可以与那些新颖的网络设计集成在一起，以进一步提高性能。

3 RES2NET

3.1 Res2Net Module

图2(a)所示的瓶颈结构是许多现代主干CNNs架构中的基本构建块，例如:ResNet[23]、ResNeXt[56]和DLA[60]。与在瓶颈块中使用一组 $3 \times 3$ 过滤器来提取特征不同，我们寻求具有更强的多尺度特征提取能力的替代架构，同时保持类似的计算负载。具体来说，我们将一组 $3 \times 3$ 过滤器替换为更小的过滤器组，同时以一种分级的残差样式连接不同的过滤器组。由于我们提出的神经网络模块在单个残差块内涉及类似残差的连接，因此将其命名为Res2Net。
图2显示了瓶颈块和提出的Res2Net模块之间的区别。在进行了 $1 \times 1$ 次卷积之后，我们将特征映射均匀地分割成特征映射子集，用 $x_{i}$ 表示，其中 $\in {\{1,2,...,s\}}$ 。与输入特征相比，每个特征子图 $X_{i}$ 的空间大小相同，但通道数量为 $1 / 3$ ，除去 $x_{1}$ 外，每个 $x_{i}$ 都有相应的 $3 \times 3$ 转换，用 $K_{i}()$ 表示。特征子图 $X_{i}$ 和 $K_{i-1}()$ 的输出相加，然后输入给 $K_{i}()$ 。为了在增加 $s$ 的同事减少参数，我们忽略了 $x_{1}$ 的33个卷积。因此 $y_{i}$ 可以写成：

注意，每个 $3 \times 3$ 卷积运算符 $K_{i}()$ 都可能从所有特征分割 ${x_{j}，j≤i\}$ 中接收特征信息。每次特征通过一个 $3 \times 3$ 卷积算子进行分解时，输出结果的接收场都可能大于 $x_{j}$ 。由于组合爆炸效应，Res2Net模块的输出包含不同数量和不同组合的接收场大小/尺度。
在Res2Net模块中，拆分以多尺度方式进行处理，这有利于提取全局和本地信息。为了更好地融合不同规模的信息，我们将所有拆分合并在一起，并通过一个 $1 \times 1$ 卷积传递。拆分和级联策略可以更有效地强制卷积以增强处理功能。为了减少参数的数量，我们省略了第一个分割的卷积，这也可以被视为特征重用的一种形式。
在这项工作中，我们使用 $s$ 作为比例尺尺寸的控制参数。较大的 $s$ 可能允许学习具有更丰富的接收字段大小的特征，而级联引入的计算/内存开销可以忽略不计。

3.2 Integration with Modern Modules

近年来提出了许多神经网络模块，包括Xie等人提出的基数维度，Huet等人提出的挤压和激励(SE)块。Res2Net模块引入了与这些改进正交的尺度维度。如图3所示，我们可以很容易地将基数维和SE块与提议的Res2Net模块集成在一起。

3.2.1 Dimension cardinality.

维数基数表示过滤器中的组数。此维度将过滤器从单分支更改为多分支，并提高了CNN模型的表示能力。在我们的设计中，我们可以将 $3 \times 3$ 卷积替换为 $3 \times 3$ 组卷积。尺度维度和基数之间的实验比较见4.2节和4.4节。

3.2.2 SE block.

SE块通过显式地建模通道之间的相互依赖关系，自适应地重新校准通道方向的特征响应。我们在Res2Net模块的连接之前添加了SE块。我们的Res2Net模块得益于SE块的集成，我们在4.2节和4.3节中已经通过实验证明了这一点。
由于拟议的Res2Net模块对整体网络结构没有特殊要求，并且Res2Net模块的多尺度表示能力与CNN的分层特征聚合模型正交，因此我们可以轻松地将拟议的Res2Net模块集成到状态中最先进的模型，例如ResNet，ResNeXt，DLA和Big-Little Net。相应的模型分别称为Res2Net，Res2NeXt，Res2Net-DLA和bLRes2Net-50。
建议的比例尺尺寸与先前工作的基数尺寸和宽度尺寸正交。因此，在设置比例后，我们调整基数和宽度的值以保持总体模型的复杂性与其对应部分相似。由于这项工作需要更细致的设计，例如深度方向上可分离的卷积，模型修剪和模型压缩，因此我们不着重于减少模型的大小。

4 EXPERIMENTS

4.1 Implementation Details

我们使用Pytorch框架实现建议的模型。为了进行公平的比较，我们使用ResNet，ResNeXt，DLA 以及bLResNet-50的Pytorch实现，仅替换原始的瓶颈块与建议的Res2Net模块。与之前的工作类似，在ImageNet数据集上，每张图像都是从调整大小的图像中随机裁剪出来的 $224 \times 224$ 像素。我们使用SGD来训练网络，它的权值衰减为0.0001，动量为0.9，在4个Titan Xp gpu上有256个小批量。学习速率最初设置为0.1，每30个epoch除以10。

python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
自动写论文的网站推荐这5款实用类工具小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款实用类工具推荐，特别是千笔-AIPassPaper。1.千笔-AIPassPaper千笔-AIPassPaper是一款功能强大且全面的AI论文写作助手，用户只需输入基本的研究需求和关键词，便能迅速生成一篇完整的论文。该工具利用先进的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
4款毕业论文参考文献格式生成器（附加详细步骤）小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在撰写毕业论文时，参考文献的格式规范是至关重要的。为了帮助学生和学者们更高效地生成符合要求的参考文献格式，本文将详细介绍四款推荐的参考文献格式生成器，并提供详细的使用步骤。1.千笔-AIPassPaper千笔-AIPassPaper是一款先进的AI辅助论文写作工具，不仅能够自动生成大纲、开题报告，还能一键生成参考文献。AI论文，免费大纲，10分钟3万字https://www.aipaperpass
AI论文写作推荐哪个好？分享5款AI论文写作带数据图表网站小猪包333 写论文人工智能深度学习计算机视觉
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款推荐的AI论文写作工具，包括千笔-AIPassPaper。千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文写作助手，旨在帮助用户快速生成高质量的论文内容。AI论文，免费大纲，10分钟3万字https:
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
毕业论文附录一般都写什么?大学生写论文是干嘛用的写个原创论文人工智能深度学习 AI写作 chatgpt 论文阅读
毕业论文的附录通常包含一些在正文中不便于展示或详细阐述的内容，但对理解论文整体又具有重要意义的资料。具体来说，附录可能包含以下内容：AI论文，免费大纲，10分钟3万字，查重高于15%退费，支持数据图表！！AIPaperPass-AI论文写作指导平台AIPaperPass是AI原创论文写作平台，免费千字大纲，5分钟生成3万字初稿，提供答辩汇报ppt、开题报告、任务书等，40篇真实中英文知网参考文献，
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图亚图跨际 Python 交叉知识算法量化检查图像压缩质量低分辨率多光谱峰值信噪比端到端优化图像压缩手术机器人三维实景实时可微分渲染重建三维可视化
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现超分辨率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG图像相似性近似算法图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU变速图像压缩手术机器人深度估计算法重建三维可视化推理图像超分辨率算法模型三维实景实时可微分渲染算法MATLAB结构
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
EP6 同一组件通过传递不同属性展示不同效果京城五 uniapp壁纸小程序项目实践前端学习脚步 css 前端 html
文件路径：E:/homework/uniappv3tswallpaper/pages/index/index.vue公告文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容每日推荐专题精选More+.homeLayout{.banner{width:750rpx;padding:30rpx0;swiper{width:10
EP7 底部tab切换页面标签京城五 uniapp壁纸小程序项目实践前端知识杂合前端 uniapp 小程序
文件路径：E:/homework/uniappv3tswallpaper/pages/classify/classify.vue.classify{padding:30rpx;display:grid;grid-template-columns:repeat(3,1fr);gap:15rpx;}文件路径：E:/homework/uniappv3tswallpaper/pages/user/user
基于Pytorch框架的CIFAR-10图像分类任务（附带完整代码）难得北窗高卧 pytorch 人工智能 python 深度学习
本文主要实现在pytorch框架下，训练CIFAR数据集，通过观察训练和验证的误差、准确率图像来进一步改善。保存最好的模型。测试集打印整体准确率和每一类别的准确率，并生成混淆矩阵，将其中每一个错误的图片并保存下来。语言：python实现方式：pytorch框架,CPU关键词:CIFAR-10数据集、Dataset和Dataloader、SummaryWriter画图、网络模型搭建、混淆矩阵、统计所
探索任务的隐秘世界：推荐Task2Vec 邓越浪Henry
探索任务的隐秘世界：推荐Task2Vecaws-cv-task2vecOfficialcodeforthepaper"Task2Vec:TaskEmbeddingforMeta-Learning"(https://arxiv.org/abs/1902.03545,ICCV2019)项目地址:https://gitcode.com/gh_mirrors/aw/aws-cv-task2vec在机器学习
验证resneXt，densenet，mobilenet和SENet的特色结构 dfj77477 人工智能 python
简介图像分类对网络结构的要求，一个是精度，另一个是速度。这两个需求推动了网络结构的发展。resneXt：分组卷积，降低了网络参数个数。densenet：密集的跳连接。mobilenet：标准卷积分解成深度卷积和逐点卷积，即深度分离卷积。SENet：注意力机制。简单起见，使用了[1]的代码，注释掉layer4，作为基本框架resnet14。然后改变局部结构，验证分类效果。实验结果GPU：gtx107
Coding and Paper Letter（十四） G小调的Qing歌
资源整理。1Coding:1.R语言包ungeviz，ggplot2的拓展包，专门用来作不确定性的可视化。ungeviz2.计算机图形学相关开源项目。计算机图形学光线追踪开源项目C++源码。computergraphicsraytracing计算机图形学格网开源项目C++源码。computergraphicsmeshes计算机图形学介绍开源项目。computergraphics3.R语言包GLMM
基于深度学习的对抗样本生成与防御 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的对抗样本生成与防御是当前人工智能安全领域的关键研究方向。对抗样本是通过对输入数据进行微小扰动而产生的，能够导致深度学习模型做出错误预测。这对图像分类、自然语言处理、语音识别等应用构成了严重威胁，因此相应的防御措施也在不断发展。1.对抗样本生成对抗样本生成的方法主要有两大类：基于梯度的方法和基于优化的方法。1.1基于梯度的方法这些方法利用模型的梯度信息，通过细微的扰动来生成对抗样本，迫
05-树9 Huffman Codes（C） L_glonar c语言数据结构
日常，这一次，耗费我三天，其实第二天时便已经将对整个框架有清晰的了解了，（看了解析了），但是一步步排除，确实让我学到了很多。In1953,DavidA.Huffmanpublishedhispaper"AMethodfortheConstructionofMinimum-RedundancyCodes",andhenceprintedhisnameinthehistoryofcomputersci
线性代数|机器学习-P33卷积神经网络ImageNet和卷积规则取个名字真难呐算法机器学习矩阵人工智能线性代数
文章目录1.ImageNet2.卷积计算2.1两个多项式卷积2.2函数卷积2.3循环卷积3.周期循环矩阵和非周期循环矩阵4.循环卷积特征值4.1卷积计算的分解4.2运算量4.3二维卷积公式5.KroneckerProduct1.ImageNetImageNet的论文paper链接如下：详细请直接阅读相关论文即可通过网盘分享的文件：imagenet_cvpr09.pdf链接:https://pan.
IJCAI2024 无脑敲代码，bug漫天飞会议
CallforPapers–IJCAI2024重要日期(所有时间都是地球上的任何地方，UTC-12)摘要提交截止日期:2024年1月10日作者信息截止日期:2024年1月16日论文全文截止日期:2024年1月17日附录和重新提交信息截止日期:2024年1月24日简易拒绝通知:2024年2月22日作者回复时间:2024年3月18日至21日书面通知:2024年4月16日会议:2024年8月3日星期六至
【Python】成功解决TypeError: list indices must be integers or slices, not str 高斯小哥 BUG解决方案合集 python list 新手入门学习 debug
【Python】成功解决TypeError:listindicesmustbeintegersorslices,notstr欢迎进入我的个人主页，我是高斯小哥！博主档案：广东某985本硕，SCI顶刊一作，深耕深度学习多年，熟练掌握PyTorch框架。技术专长：擅长处理各类深度学习任务，包括但不限于图像分类、图像重构(去雾\去模糊\修复)、目标检测、图像分割、人脸识别、多标签分类、重识别(行人\车辆
Transformer+目标检测，这一篇入门就够了 BIT可达鸭 ▶深度学习-计算机视觉 transformer 深度学习目标检测计算机视觉自然语言处理
VisionTransformerforObjectDetection本文作者：Encoder-Decoder简介：Encoder-Decoder的缺陷：Attention机制：Self-Attention机制：Multi-HeadAttention：Transformer结构：图像分类之ViT：图像分类之PyramidViT：目标检测之DETR：目标检测之DeformableDETR：本文作者：
2019-01-12 q若水
Youcan'trewriteyourpast,butyoucangrabacleansheetofpaperandwriteyourfuture.你不能重写过去，但是你可以用一张干净的纸去书写你的未来。
经典网络训练图像分类模型一三十度角阳光的问候分类数据挖掘人工智能
目录数据预处理部分：网络模块设置：网络模型保存与测试数据读取与预处理操作制作好数据源：读取标签对应的实际名字加载models中提供的模型，并且直接用训练的好权重当做初始化参数模型参数更新把模型输出层改成自己的设置哪些层需要训练优化器设置数据预处理部分：-数据增强：torchvision中transforms模块自带功能，比较实用-数据预处理：torchvision中transforms也帮我们实现
第66期 | GPTSecurity周报云起无垠 GPTSecurity AIGC gpt
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.利用高级大语言模型
Bilingual engineering 201707 No.360 Alyee AlyeeBonnie
GamesandDailylife:Makealittlemousewithher.Steps1.Useorangepapertomakeacone2.Maketworoundearsandalongtailwiththeorangepaper3.Cutasmallpieceofblackpapertomakethemouseswhiskers4.Pasteallthepartstogether5
识别实验笔记和经验总结 Wils0nEdwards 笔记
1.跑对比实验之前，首先保证对比的公平性和可靠性！在进行图像分类模型对比实验时，为了确保对比的公平性和可靠性，以下几个因素需要重点考虑：数据集的一致性：数据集分割：确保训练集、验证集和测试集的划分是一致的。各模型使用相同的训练数据和测试数据。数据集大小：确保数据集的样本数量充足且具有代表性，避免数据集过小导致结果不具备普遍性。数据预处理：图像预处理方法：所有模型使用相同的预处理方法（如归一化、裁剪
IROS2023 马少爷学术人工智能自然语言处理
1、论文要求论文征集提交给IROS会议文件审查委员会作为同行评审的档案出版物，所有被接受的论文都将在IEEEXplore上托管。邀请潜在作者提交代表原创作品的高质量论文。欢迎就主题以及智能机器人和应用的所有领域提交意见。请通过传统的PaperPlaza流程提交论文。格式指南LaTex模板MSWord模板论文长度应为六页（美国字母大小），最多可多出两页（每多出一页收费205美元，应在验收后付款）。页
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓