guo_rx

deeplab v3论文翻译 Rethinking Atrous Convolution for Semantic Image Segmentation

摘要
引言
相关工作
方法
- 带孔卷积提取精细特征
- 深入了解带孔卷积
  - 多网格方法
- 带孔空间金字塔池化
实验验证
- 训练规定
- 深入带孔卷积
- 带孔空间金字塔池化
总结

摘要

本文中，我们再次讨论带孔卷积，一个调整卷积核感受野的强大工具，并且可以控制深度卷积神经网络计算得到特征的分辨率，应用在图像语义分割上。为了处理在多尺度条件下的语义分割难题，我们设计了串行和并行的带孔卷积模块，采用多种不同的孔洞步长来获取多尺度的内容信息。除此之外，我们还提出了多层级空间金字塔式孔洞池化模块，挖掘多尺度卷积特征，以及编码了全局内容信息的图像层特征，提升分割效果。我们还详细阐述了实施细节，并分享了我们训练自己系统的经验。我们提出的“deeplabv3”系统比起我们以前的deeplab版本有了显著的提高，在没有使用全连接条件随机场做后置处理的情况下达到媲美与其他模型在PASCAL VOC 2012图像语义分割的性能。

引言

对于语义分割的任务[ 20, 63, 14,97, 7 ]，我们考虑应用深度卷积神经网络 (DCNNs)的两个挑战[50]。第一个是连续池化操作或者步长大于一的卷积引起的特征分辨率减少，这些操作可以使得深度卷积神经网络可以学习到越来越多的抽象特征表示。然而，这对局部图像变换的不变性可能妨碍精细的预测任务，这种任务需要详细的空间信息。为了克服这个问题，我们提倡使用带孔卷积[ 36, 26, 74，66 ]，这种方法已被证明在图像语义分割中很有效[ 10, 90, 11 ]。带孔卷积，也被称为扩张卷积，使我们能够通过去除最后几层的下采样操作和相应的上采样filter重新调整ImageNet [ 72 ] 之前训练好的网络来提取出更精细的特征映射，这就相当于在卷积核各个权重之间插入孔洞。使用带孔卷积，能够在深度卷积神经网络不需要学习额外的参数的情况下控制特征映射的分辨率。
另一个困难来自于如何获取尽可能多的目标的总体特征和细节特征，即不同尺度下的特征。已经提出了几种方法来处理这个问题，本文中我们主要提出四个方法，如图2所示。首先，DCNN是应用于图像金字塔从而在每个输入的尺度下提取特征[ 22, 19, 69，55, 12, 11 ]，不同特征映射、不同尺度下目标都很突出。第二、编码器解码器结构[ 3, 71, 25，54, 70, 68，39 ]在编码器部分就利用起多尺度的特征，解码器部分恢复图像同时保证空间分辨率。第三，用额外添加的模块级联在原来的网络上，从而捕获长跨度的信息。特别是，DenseCRF [ 45 ]用来编码相连像素的相似性[ 10, 96, 55，73 ]，而[ 59, 90 ]开发了几个额外的卷积层级联处理，从而逐步捕获长范围上下文信息。第四，空间金字塔池化[ 11, 95 ]探索了用有着多种步长、多种有效感受野的filters或者池化操作处理输入特征映射，从而多尺度条件下捕获目标。

在这项工作中，我们重新研究带孔卷积的应用，在级联模块和空间金字塔池化的框架下，使我们能够有效地扩大filter的视野，以组合多尺度的图片信息。特别是，我们提出的带孔卷积模块中多种孔的步长和批次归一化层，发现在训练中也非常重要。我们的实验按级联或并行排列模块（特别实验了带孔的空间金字塔池化（ASPP）方法[ 11 ]）。我们讨论一个重要的现实问题，当应用3×3带孔卷积时孔的步长非常大的时候，因为图像边界的影响就不能捕捉到长跨度的信息，事实上会退化为1×1的卷积，并提出将图像级特征纳入ASPP模块。此外，我们分享了精心设计的一些技术细节和模型的训练经验，包括简单而有效的自助抽样法处理标签稀少和标签精细对象。在最后，我们提出的“DeepLabv3”模型，超越了我们以前的工作[ 10, 11 ]，并且在没有使用DenseCRF做最后的处理的情况下在PASCAL VOC 2012的测试集上达到了85.7%的正确率。

方法

在这一章，我们回顾带孔卷积是如何应用到语义分割提取精细特征。之后我们讨论提出的有带孔卷积的模块级联使用还是并行使用。

带孔卷积提取精细特征

深度卷积神经网络（DCNNs）应用在全卷积结构上已经在语义分割中表现的效果卓越。然而，这些网络中连续几层中重复的max-pooling和striding结合的操作大大减小了结果特征映射的空间分辨率,最近的深度卷积神经网络中在每个方向上有32倍的缩小。反卷积层（或转置卷积）已经被使用来恢复空间分辨率。我们建议使用带孔卷积代替上文的操作，带孔卷积最初是为了在“algorithme atrous”高效计算非抽样小波变换而且这种方法在之前的深度卷积神经网络中已经被使用过。
假设2-d信号，针对每个位置i，对应的输出 y，以及filter w，对于输入特征映射x进行带孔卷积计算：

y [i] = \sum k x [i + r \cdot k] w [k]

其中，孔洞步长r 表示对输入信号进行采样的步长，等价于将输入x和通过在两个连续的filters值间沿着各空间维度插入 r−1 个零值得到的上采样filters进行卷积（因此带孔卷积中法语的trous在英语中意思是holes）。标准卷积即是一种r = 1的特殊形式，而且带孔卷积允许我们通过改变步长的值，来修改卷积核的接受野，如图片1所示。
带孔卷积也允许我们明确控制全卷积神经网络计算的特征紧凑程度。这里，我们把输入图像空间分辨率与输出图像分辨率的比值记为输出步长。深度卷积神经网络在执行图像分割的任务时，最终的特征响应（在全连接或者全局池化之前）和输入图像维度相比缩小了32倍，因此输出步长为32。如果想要在深度卷积神经网络计算的特征响应上使空间分辨率加倍（输出步长为16），最后一个池化或者卷积层这种减小分辨率的操作的步长设置为1来避免信号的丢失。然后，所有随后的卷积层被步长r = 2的带孔卷积层替换掉。这就允许我们在不需要学习任何额外的参数的情况下得到更精细的特征响应。请参考[11] 获得更多的细节。

深入了解带孔卷积

首先我们探索带孔卷积模块串行级联的设计。具体来说，我们复制几份ResNet最后模块的拷贝，在图3中记为模块4，并且将他们级联起来。在这些模块中有三个3×3的卷积，而且除去最后一个模块之外，所有的卷积最后一步步长为2，与初始的ResNet相似。这个模型的目的是介绍striding这种操作使得在更深模块中捕获长跨度的信息很容易。例如，整个图像的特征可以被集中在最后一个小分辨率的特征映射当中，正如图3（a）中展示的那样。然而，我们发现连续的striding操作对于语义分割是有害的（详见第四章的表1）因为细节信息被损伤了，因此我们应用步长确定的带孔卷积，按照输出步长的要求而设计，如图3（b）中展示的，这里输出步长为16。

在这个模型当中，我们实验了级联ResNet到第7个模块（额外的模块5，模块6，模块7是由模块4复制而来），在没有使用带孔卷积的情况下它的输出步长是256。

多网格方法

受多网格方法的驱动，使用不同尺寸网格的集合[4, 81, 5, 67]，参考了[84, 18]两篇论文，我们在模型中对模块4到模块7采用不同的孔洞步长。特别是，我们定义了Multi_Grid = ( r1, r2, r3)，对于从模块4到模块7每个模块有着独立的单元步长。最终的带孔步长对于卷积层来说与单元步长和对应的步长相乘的值相等。例如，当输出步长为16，Multi_Grid = （1，2，4），模块4中三个卷积的步长将会分别等于2×( 1，2，4 ) =（2，4，8）。

带孔空间金字塔池化

我们回顾之前提出的带孔空间金字塔池化，四个并行的带孔步长不同带孔卷积被应用在特征映射之上。ASPP是被空间金字塔池化[28, 49,31] 的成功而想到的，空间金字塔池化在用不同尺度重复采样特征提高精确率方面是有效的而且任意的尺度都对分割很有效果。与之前的ASPP不同，本文我们的ASPP加入了批次归一化。

具有不同的孔洞步长的ASPP对捕获多尺度信息很有效果。然而，我们发现随着采样率的提高，有效的filter权重（即有效特征区域，而不是补零区域的权重）却在变小。这种影响如图4所示，当把一个3 × 3 的filter用不同的带孔步长应用到65 × 65的特征映射当中。在极端情况下，步长增大到接近特征映射的尺寸，该 3×3 的filter 不能捕获整个图像内容，而退化成了一个简单的 1×1 filter，因为只有中心 filter 权重才是有效的。
针对上面的问题，并将全局内容信息整合进模型中，我们采用图像级特征。特别是，我们应用了全局平均池化处理模型的特征映射，将得到的图像级特征输入到一个有256个filter的 1×1 卷积(加入批次归一化)中，然后将特征进行双线性上采样(bilinearly upsample)到特定的空间维度。最后，我们的改进的ASPP由一个 1×1 卷积，和三个 3×3卷积组成，步长为（6，12，18），输出步长为16（所有的filter个数为256，并加入批次归一化)，如图5所示，（b）是图像级的特征。需要注意的是，当输出步长为8时，步长将加倍。所有分支处理好的特征将会连接在一起通过另一个 1×1 卷积（也有着256个filter，加入批次归一化），最后还有一个 1×1 卷积产生最终的分类。

实验验证

我们采用了在ImageNet上预训练的语义分割模型ResNet为框架，应用带孔卷积获取精细特征。回顾一下，输出步长定义为输入图像空间分辨率与输出分辨率的比值。例如，当输出步长为8的时候，最后两个模块（模块3和模块4先固定）在原来的ResNet中分别加入步长为2和步长为4的带孔卷积。我们在Tensorflow中实验。
我们在包含20个前景目标类别和1个背景类别的PASCAL VOC 2012语义分割基准上测试了本文的模型，初始的数据集包括1464个训练集，1499个验证集，和1456个测试集，这些图片都有像素级的标注，数据集经过[29]的额外标注，现在有10582个训练图片。评价方法是计算平均21类的预测像素的准确率（IOU），即模型产生的目标窗口和原来标记窗口的交叠率。具体计算方法为：检测结果(DetectionResult)与 Ground Truth 的交集比上它们的并集。

训练规定

这部分我们讨论训练遵守的一些细节。
学习率公式：与[58,11]相似，我们使用一个叫做“poly”的学习率公式，初始的学习率与 (1−itermax i ter ) power 相乘， power = 0.9。
裁剪尺寸：根据最开始的训练规定[10,11]，每一批图片在训练之前都要裁剪。为了步长较大的带孔卷积能够发挥效果，需要裁剪出比较大的图片；否则的话，filter的权重将会主要乘在补零的区域中。因此我们使用513作为采集爱你尺寸在训练和测试PASCAL VOC 2012数据集的时候。
批次归一化：我们在ResNet上加入的模块都有批次归一化参数，我们发现这在训练中很有用。因为训练批次归一化参数需要每批的图片比较多，我们令输出步长为16。批次归一化参数训练得到衰减为0.9997。初始学习率为0.007，在训练集上训练3万次之后，我们固定了批次归一化参数，使用输出步长为8的时候，我们用小一点的初始学习率0.001，在离线的PASCAL VOC 2012 trainval上又训练了3万次。注意带孔卷积允许我们在不同的训练阶段控制输出步长的值，不需要学习额外的模型参数。还有注意当输出步长为16时训练速度要比输出步长为8时快好几倍因为中间的特征映射小了4倍，但是输出步长为16时特征映像会更粗糙，牺牲了精确率。
上采样预测结果：在我们之前的工作中，输出步长设置为8时，目标的真实结果被下采样了8倍。我们发现使真实结果保持原来的尺寸非常重要，因此需要上采样我们预测的结果，因为下采样真实结果会除去掉没有反向传播的很好的标注细节。
数据扩张：我们通过随机缩小或者放大输入图片（从0.5倍到2倍）和训练时随机左右反转图片来使数据扩张。

深入带孔卷积

首先我们实验了将更多的带孔卷积模块级联起来的效果。
ResNet-50：在表1，我们实验了输出步长改变对结果的影响。我们使用有7个模块的ResNet-50实验。正如表中所示的。当输出步长为256时（这时没有任何带孔卷积），因为信息的丢失，预测结果的表现比对照组差很多。当输出步长从256变到8的过程中，应用带孔卷积时，准确率就从20.29%提升到了75.18%，说明带孔卷积在语义分割中级联更多模块时非常重要。

ResNet-50与ResNet-101对比：我们将ResNet-50换成更深的网络ResNet-101，改变了级联模块的数量。正如表2所示，随着级联更多的模块，准确率越来越好，但是效果提升速度是在下降的。注意，使用7模块稍微降低了ResNet-50的表现，但对于ResNet-101的结果还是有提高的。

多网格：我们在ResNet-101上对几个级联的添加模块应用多网格方法，如表3所示。单元步长，Multi_Grid = ( r1, r2, r3)被应用在所有添加的模块当中。正如表中所示，我们观察到使用多网格方法普遍比原来要好，单纯地加倍单元步长没有效果，同样使用多网格方法随着网络变深，效果也更好。我们最好的模型是7层( r1, r2, r3)=（1，2，1）。

在验证集上测试推广的策略：开始模型是在输出步长为16的基础上训练的，之后我们推断，用输出步长为8可以得到更多的特征映射的细节。如表4所示，当输出步长为8时，我们用之前表现最好的级联结构，7层( r1, r2, r3)=（1，2，1），准确率比步长为16时提高了1.39%。加入缩小放大输入图片和左右翻转图片的操作之后，准确率进一步提高（放大比例有｛0.5, 0.75, 1.0, 1.25, 1.5, 1.75｝）。特别地，我们将多个尺度和翻转图像计算出的平均值作为最终的计算结果。

带孔空间金字塔池化

之后我们实验了实验了带孔空间金字塔池化（ASPP）模型，和之前模型的主要区别是这次我们使用了调好的批次归一化参数和图像尺度的特征。
ASPP：在表5中，我们实验了在第4模块包含多网格操作和图像级别特征的ASPP模型。首先我们固定ASPP =（6，12，18）（即在三个并行的3×3 带孔卷积分支规定步长分别为（6，12，18）），改变多网格的值。Multi_Grid = ( 1，2，1)的结果比Multi_Grid = ( 1，1，1)要好，不过这种步长下最好的Multi_Grid = ( 1，2，4)。如果再加一个并行的步长为24的带孔卷积层来获取更大范围的上下文信息，准确率会稍微降低到0.12%。另一方面，在ASPP模型上加入图像级别的特征是有效的，最终准确率达到了77.21%。

在验证集上测试推广的策略：相似的，我们将模型的输出步长改为8。如表6所示，准确率增加了1.3%，加入缩小放大输入图片和左右翻转图片的操作之后，准确率进一步提高了0.94%和0.32%，ASPP最好的模型准确率为79.77%，比级联带孔卷积模型的最优值更高，因此选择ASPP作为我们最终的模型。

和DeepLabv2对比：v3的级联模型和ASPP模型在PASCAL VOC 2012的验证集上表现都要比v2好，提升主要来自增加了调好的批次归一化参数和更好地编码多尺度上下文信息。
测试集上的结果和有效的自助抽样法：我们注意到PASCAL VOC 2012数据集提供的标注信息比增加的数据集要更有质量，特别是自行车这一类。因此我们在测试集上测试之前先在PASCAL VOC 2012的训练集和验证集上进一步微调我们的模型。我们的模型是在输出步长为8的情况下训练的（因此标注细节得以保留），批次归一化参数固定。除此之外，与[85,70]的pixel
hard example mining方法不同，我们用自助抽样法处理不好训练的图片。特别是，我们在训练集中复制了一些图片，包含的类别不好训练（自行车，椅子，桌子，盆栽和沙发）。如图7所示，自助抽样法对分割自行车很有效。最后，DeepLabv3在没有用全连接条件随机场预处理的情况下达到了85.7%的准确率，见图7。

在JFT-300M上预训练模型：收到[79]最近工作的启发，我们进一步使用了已经在ImageNet和JFT-300M数据集上预训练的ResNet-101模型，结果在PASCAL VOC 2012的测试集上达到了86.9%的准确率。

总结

我们的DeepLabv3模型使用了有着上采样filter的带孔卷积，来使特征映像更精确、捕获长跨度的上下文信息。特别是为了编码多尺度的信息，我们提出了级联模块使孔洞步长加倍，我们的带孔空间金字塔池化模型增大了图像级别的特征，探索filters的多个采样率和感受野。我们的实验结果表明DeepLabv3相较于之前的DeepLab模型有了极大的提高，达到媲美与其他模型在PASCAL VOC 2012图像语义分割的性能。

【星闪开发连载】WS63E模块的雷达功能浅析神一样的老师星闪技术 OpenHarmony 物联网
目录引言功能简介程序分析操作步骤简单测试结语引言WS63E星闪模块有个特色功能就是雷达运动感知，检测物体是否有运动，作用距离不超过6米。hi3863芯片本身不带雷达功能，是模块提供的相关功能。海思还有个WS63星闪模块，没有雷达感知能力。功能简介从开发板的图片上可以看到，右下角有个安装雷达天线的地方，使用使用1代IPEX接口。润和的套件里面没有带天线，从我的测试看没有天线，其实雷达功能是不正常的。
TVBOX最新配置地址,TVBOX直播源接口配置地址,TVBOX最新直播接口 keysoso TV电视盒子电视盒子电视电视机
TVbox直播源最新配置地址如何获取与设置？TVbox直播源的配置与获取是许多用户关心的问题，因为这关系到能否顺利观看各类直播节目。下面，我们将逐步向大家介绍如何获取和设置TVbox最新的直播源配置地址。一、TVbox直播源的基本认识TVbox直播源最新配置地址如何获取与设置？上述标题满足了您的要求，它是一个带疑问的中文长标题，且符合用户搜索需求，同时包含了tvbox直播源和最新配置地址的关键词，
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
卷积神经网络 - 理解卷积核的尺寸 k×k×Cin 谦亨有终 AI学习笔记 cnn 人工智能神经网络深度学习机器学习
卷积神经网络中，每个卷积核的尺寸为k×k×Cin，这一设计的核心原因在于多通道输入的数据结构和跨通道特征整合的需求。以下是详细解释：1.输入数据的结构输入形状：假设输入数据为三维张量，形状为H×W×Cin，其中：H：高度（Height）W：宽度（Width）Cin：通道数（Channelsin）多通道的物理意义：对于RGB图像，Cin=3（红、绿、蓝三通道）。对于中间层的特征图，Cin可能为64、
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
2014-2023年各区县数字普惠金融指数数据 -夜深- 数据区县区县数字普惠金融指数
2014-2023年各区县数字普惠金融指数数据1、时间：2014-2023年2、来源：北大数字普惠金融指数3、范围：2800个县4、指标：综合指数、覆盖广度、使用深度、支付业务、保险业务、货币基金业务、投资业务、信用业务、信贷业务、数字化程度5、参考文献：郭峰,王靖一,王芳,孔涛,张勋,程志云.测度中国数字普惠金融发展:指数编制与空间特征6、下载链接：2014-2023年各区县数字普惠金融指数数据
青少年编程与数学 02-011 MySQL数据库应用 10课题、记录的操作明月看潮生编程与数学第02阶段数据库青少年编程 mysql 编程与数学
青少年编程与数学02-011MySQL数据库应用10课题、记录的操作一、表的记录表的记录的组成示例插入记录查看记录记录的操作1.插入记录（INSERT）2.更新记录（UPDATE）3.删除记录（DELETE）4.查询记录（SELECT）记录的约束示例：带约束的表总结二、添加记录1.插入单条记录插入单条记录2.插入多条记录插入多条记录3.插入部分字段插入部分字段4.插入查询结果插入查询结果5.插入时
一切靠抢的带抢的都是非常赚钱的，比如抢号抢票抢购等小黄人软件经验分享
“带抢”的东西通常意味着供需极度不平衡，信息不对称，或者时间、资源有限，因此具备高利润空间。除了抢号之外，以下这些领域也符合这个特点：1.抢购类抢票：包括演唱会、热门球赛、春运火车票、热门景区门票（如故宫）等，提供代抢服务或者软件。抢鞋、抢限量潮牌：如耐克SNKRS、Supreme等品牌的限量款，通过Bot代抢再高价转卖。抢游戏账号/虚拟物品：抢注游戏ID、游戏道具、限量皮肤，再转卖给需求方。抢新
达梦数据库学习笔记 lwq979991632 数据库
达梦数据库学习资料一、操作系统安装1、配置信息CPU：4核心内存：4G网络：NAT2.安装包选择选择带GUI的服务器，勾选Java平台、KDE二、安装前准备1.数据库远程访问：关闭防火墙systemctlstopfirewalld（禁用）systemctldisablefirewalld(停止，关闭开机自启动)systemctlstatusfirewalld（查看状态）2.安装gcc包rpm-qa
oracle数据库——游标隐式游标显式游标带参数的游标带锁的游标动态游标强类型一JJL 数据库游标隐式游标显式游标带参数的游标带锁的游标动态游标强类型
游标逐行提取查询结果，所以返回结果可以超过一行%NOTFOUND--如果FETCH语句失败，则该属性为"TRUE"，否则为"FALSE";%FOUND--如果FETCH语句成功，则该属性为"TRUE"，否则为"FALSE";%ROWCOUNT--返回游标当前行的行数;1.隐式游标--查看修改数据后会影响到多少行数据beginupdateempsetsal=sal+100wheredeptno=&d
关于forward函数 oioz 深度学习
定义forward函数是模型的核心前向传播逻辑，定义了输入数据如何在模型中传递和计算。它将输入数据通过模型的各层（如卷积层、全连接层等），计算出模型的输出。作用负责模型的主要计算逻辑。在训练和验证过程中都会被调用。特点必须实现：在PyTorch中，forward函数是模型的核心部分，必须显式定义。灵活性高：可以根据模型需要，自由定义forward函数的内容，包括各种计算操作。示例（PyTorch）
卷积神经网络Batch Normalization的作用 arron8899 cnn batch 人工智能
BatchNormalization的作用（通俗版）1.像“稳定器”一样校准每层输入想象你在烤多层蛋糕，每层蛋糕的烘烤温度不同（相当于神经网络的每一层数据分布不同）。没有BN时，烤箱温度忽高忽低，导致有的层烤焦（梯度爆炸），有的层不熟（梯度消失）。BN的作用相当于给每一层装了一个自动温度调节器，实时将输入数据调整到标准温度（均值为0，方差为1），保证每层都能均匀受热，训练更稳定。2.让模型训练“少
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
算法及数据结构系列 - 动态规划诺亚凹凸曼算法及数据结构算法数据结构动态规划
系列文章目录算法及数据结构系列-二分查找算法及数据结构系列-BFS算法文章目录框架思路子序列问题解题模板一维dp数组二维dp数组经典题型322.零钱兑换暴力递归带备忘录的暴力递归动态规划300.最长上升子序列1143.最长公共子序列72.编辑距离框架思路动态规划问题的一般形式就是求最值。动态规划其实是运筹学的一种最优化方法，只不过在计算机问题上应用比较多，比如说求最长递增子序列，最小编辑距离等等。
CBNetV2: A Composite Backbone Network Architecture for Object Detection论文阅读 Laughing-q 论文阅读深度学习人工智能目标检测实例分割 transformer
CBNetV2:ACompositeBackboneNetworkArchitectureforObjectDetection论文阅读介绍方法CBNetV2融合方式对Assistant的监督实验与SOTA的比较在主流backbone架构上的通用性与更宽更深的网络比较与可变形卷积的兼容在主流检测器上的模型适用性在SwinTransformer上的模型适用性消融实验paper：https://arxi
在Ubuntu20.04上交叉编译能在Windows上运行的Qt5应用 daqinzl linux qt C++Ubuntu20.04 Qt5 交叉编译 Windows应用
参考链接：https://blog.csdn.net/Interview_TC/article/details/146050419https://bugreports.qt.io/browse/QTBUG-82592重要设置sudoupdate-alternatives--configx86_64-w64-mingw32-g++选择后缀带posix的，（/usr/bin/x86_64-w64-mi
计算机集成电板 ppt,史上最全，PCB板和集成电路解析（干货分享）姚脑师计算机集成电板 ppt
原标题：史上最全，PCB板和集成电路解析(干货分享)目前的电路板，主要由以下组成：线路与图面(Pattern)：线路是做为原件之间导通的工具，在设计上会另外设计大铜面作为接地及电源层。线路与图面是同时做出的。介电层(Dielectric)：用来保持线路及各层之间的绝缘性，俗称为基材。孔(Throughhole/via)：导通孔可使两层次以上的线路彼此导通，较大的导通孔则做为零件插件用，另外有非导通
python if用法 IT技术土狗 python从入门到入狱 python
pythonif用法流程控制流程控制即控制流程，具体指控制程序的执行流程，而程序的执行流程分为三种结构：顺序结构（之前我们写的代码都是顺序结构）、分支结构（用到if判断）、循环结构（用到while与for）1、分支结构分支结构就是根据条件判断的真假去执行不同分支对应的子代码2、为什么需要分支结构人类某些时候需要根据条件来决定做什么事情，比如：如果今天下雨，就带伞所以程序中必须有相应的机制来控制计算
C语言 - getchar() 和 getch() 的区别 Peter_Deng. c语言算法
getchar()和getch()都是用于读取单个字符的函数，但它们有一些关键区别，主要涉及缓冲区、回显和移植性。1.getchar()特点头文件：#include从标准输入（stdin）读取一个字符，需要按下Enter才能生效。带缓冲（Buffered）：用户输入的内容会先存入缓冲区，只有按下Enter之后，getchar()才会从缓冲区读取数据。回显（Echo）：输入的字符会显示在屏幕上。代码
Pytorch使用手册-DCGAN 指南（专题十四） AI专题精讲 Pytorch入门到精通 pytorch 人工智能 python
1.Introduction本教程将通过一个示例介绍DCGANs（深度卷积生成对抗网络）。我们将训练一个生成对抗网络（GAN），在给它展示大量真实名人照片后，它能够生成新的“名人”图片。这里的大部分代码来源于PyTorch官方示例中的DCGAN实现，而本文档将对该实现进行详细解释，并阐明这种模型的运行机制及其背后的原因。无需担心，你不需要事先了解GAN的知识，但初次接触的读者可能需要花一些时间来理
不搞花里胡哨！CMU最新开源：极简风格的LiDAR全景分割+跟踪！ 3Ｄ视觉工坊 3D视觉从入门到精通 3D视觉
来源：3D视觉工坊在公众号「3D视觉工坊」后台，回复「原论文」可获取论文pdf、代码链接添加微信：dddvisiona，备注：三维点云，拉你入群。文末附行业细分群1.笔者个人体会激光雷达全景分割（LPS）一般遵循自下而上的以分割为中心的范式，利用聚类获得对象实例来建立语义分割网络。但是最近CMU&Meta等大佬们重新思考了这种方法，并提出了一个简单而有效的检测中心网络，用于LPS和跟踪。这项工作也
【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT s1ckrain 计算机视觉论文阅读计算机视觉人工智能
PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题：SAM是一个基于大规模数据预训练的强大提示框架，推动了分割领域的发展。尽管SAM具有通用性，但在无需人工提示的情况下，针对特定视觉概念（如自动分割用户宠物狗）的定制化研究尚不充分。方法提出：提出了一种无需训练的SAM个性化方法，称为PerSAM。仅需单次数据（一张带参考掩码的图像），即可在新
【Java学习日记6】：字面量的分类与使用小蛋6g Java学习日记 java 开发语言
一、字面量的定义与作用字面量是程序中直接书写的数据值，无需通过变量或计算获取。它用于表示固定的值，如数字、字符、布尔值等，例如：数字100、字符串"Hello"、字符'A'等。字面量告诉编译器数据的类型和值。字面量就是告诉程序员:数据在程序中的书写格式.---二、字面量的分类Java中的字面量按数据类型可分为以下六类：类型说明示例整数类型不带小数点的数字123,-456小数类型带小数点的数字3.1
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
HarmonyOS5开发：Ark-TS 深度解析：从状态管理到性能优化，揭秘鸿蒙开发的底层逻辑 harmonyos-next
Ark-TS作为鸿蒙生态的核心开发语言，其设计哲学和技术细节值得让我们一起深入挖掘以下下。这篇文章将会带您和我们一起聚焦Ark-TS的状态管理机制、类型系统优化及声明式UI的底层实现，通过代码示例和原理分析，带您揭开Ark-TS高效开发的神秘面纱。一、状态管理：Ark-TS的“神经中枢”在Ark-TS中，状态管理是驱动UI更新的核心机制。不同的状态装饰器（如@State、@Prop、@Link）各
10.2 如何解决从复杂 PDF 文件中提取数据的问题？墨染辉大语言模型 pdf
10.2如何解决从复杂PDF文件中提取数据的问题？解决方案：嵌入式表格检索解释：嵌入式表格检索是一种专门针对从复杂PDF文件中的表格提取数据的技术。它结合了表格识别、解析和语义理解，使得从复杂结构的表格中检索信息成为可能。具体步骤：表格检测和识别：目标：在PDF页面中准确地定位和识别表格区域。方法：使用计算机视觉和深度学习技术，如卷积神经网络（CNN）或其他先进的图像处理算法。效果：能够检测出页面
机器学习是怎么一步一步由神经网络发展到今天的Transformer架构的？ yuanpan 机器学习神经网络 transformer
机器学习和神经网络的发展经历了一系列重要的架构和技术阶段。以下是更全面的总结，涵盖了从早期神经网络到卷积神经网络之前的架构演变：1.早期神经网络：感知机（Perceptron）时间：1950年代末至1960年代。背景：感知机由FrankRosenblatt提出，是第一个具有学习能力的神经网络模型。它由单层神经元组成，可以用于简单的二分类任务。特点：输入层和输出层之间直接连接，没有隐藏层。使用简单的
常见经典目标检测算法 109702008 人工智能 #深度学习目标检测人工智能
ChatGPT目标检测（ObjectDetection）是计算机视觉领域的一个重要分支，其目的是识别数字图像中的不同对象，并给出它们的位置和类别。近年来，许多经典的目标检测算法被提出并广泛应用。以下是一些常见的经典目标检测算法：1.R-CNN（RegionswithCNNfeatures）:R-CNN通过使用区域提议方法（如选择性搜索）首先生成潜在的边界框，然后使用卷积神经网络(CNN)提取特征，
python+flask计算机毕业设计基于Android平台的景区移动端旅游软件系统（程序+开题+论文） Node.js彤彤程序 python flask 课程设计
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容研究背景随着移动互联网技术的飞速发展，智能手机已成为人们日常生活中不可或缺的一部分，特别是在旅游领域，移动端应用以其便捷性、实时性和个性化服务的特点，极大地改变了人们的旅游体验方式。当前，旅游市场日益繁荣，游客对于旅游信息获取、行程规划、景点导航、票务预订及个性化服务的需
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc

deeplab v3论文翻译 Rethinking Atrous Convolution for Semantic Image Segmentation

摘要

引言

相关工作

方法

带孔卷积提取精细特征

深入了解带孔卷积

多网格方法

带孔空间金字塔池化

实验验证

训练规定

深入带孔卷积

带孔空间金字塔池化

总结

你可能感兴趣的:(deeplab,aspp,带孔卷积,语义分割,atrousconv)