陈建驱

UPSNet论文笔记

个人博客：http://www.chenjianqu.com/

原文链接：http://www.chenjianqu.com/show-115.html

论文：Yuwen Xiong, Renjie Liao, Hengshuang Zhao, Rui Hu, Min Bai, Ersin Yumer, Raquel Urtasun.UPSNet: A Unified Panoptic Segmentation Network.2019-1-12 .CVPR2019 oral.from Uber自动驾驶部门,多伦多大学,香港中文大学

摘要

提出一个统一的全景分割网络：UPSNet，在backbone的顶端，链接基于可变形卷积的语义分割头和一个Mask R-CNN式的实例分割头，来同时进行语义分割和实例分割。本文还设计了一个无参数的全景分割头，通过逐像素分类实现全景分割。全景分割头利用语义分割头和实例分割头的输出，以及额外的未知类别的预测，实现全景分割输出。此外，UPSNet还处理由不同数量的实例产生的问题，可以端到端的方式反向传播到底部模块。最后在Cityscapes，COCO和作者自己内部的数据集进行实验，结果显示UPSNet获得SOTA精度，而且运行速度很快。代码开源：https://github.com/uber-research/UPSNet .

引言

本文提出一个统一的全景分割网络：UPSNet。与论文[Panoptic Segmentation]里使用独立的实例和语义分割不同，本文用单个网络作为backbone，然后在其顶端设计两个网络头同时进行语义和实例分割。语义分割头基于可变形卷积，同时利用FPN的多尺度信息。实例分割头类似Mask R-CNN，输出mask、包围框和实例的类别。如后面的实验所示，这里单个backbone+两个轻量网络头部可以获得很好的语义和实例分割，可以比得上独立的语义和分割模型产生的结果。最重要的是，本文还设计了用于输出最终结果的全景分割头，利用前两个头部的输出结果，并增加了一个新的张量通道，对应到额外的未知类别。通过这种方式，UPSNet可以更好的解决语义分割和实例分割之间的冲突。此外，全景分割头非常轻量级，可以基于各种各样的backbone网络。

由此，UPSNet可以实现一个端到端模型。为了验证UPSNet的性能，本文在两个公开数据集：Cityscapes、COCO上进行实验，此外还在作者的内部数据集(类似于Cityscapes，但是分辨率更高)上进行实验。结果表明UPSNet达到或SOTA表现和更高的推断速度。

相关工作

语义分割

语义分割是CV的基础任务之一。该领域的早期工作主要是引入数据集和展示了全局context的重要性。近几年利用深度卷积神经网络，主要从两个角度：多尺度特征聚合和端到端的结构化预测。对于语义分割来说，context信息是至关重要的，多数先进的模型都使用了膨胀卷积(空洞卷积)来在不增加参数的情况下获取更大的感受野。PSPNet在backbone中使用了膨胀卷积，它的快速版本[Icnet for real-time semantic segmentation on high-resolution images]更加广泛应用膨胀卷积。基于FPN和PSPNet，旷世科技的[Unified perceptual parsing for scene understanding]提出了一个多任务框架能分割各种目标。

实例分割

实例分割开始与R-CNN的提出，早期的方法将实例分割通过两个阶段实现：先生成一些分割，然后从这些分割中选择最佳的分割。需要先分割，然后再分类，因此这种思路的方法比较慢。MSRA的Li Yi等人提出了Instance-aware图像语义分割，通过FCN产生mask。最近FAIR的凯明大佬提出的Mask R-CNN在Faster R-CNN的基础上增加一个mask预测分枝同时预测实例的分割和类别。

全景分割

全景分割任务首先由来自FAIR的Kirillov、何凯明等人的论文[Panoptic Segmentation]提出。他们将PSPNet的语义分割结果和Mask R-CNN的实例分割结果，通过启发式方法简单对每个像素标记为void、stuff或thing实例标签，得到全景分割的baseline。

最近，牛津大学的Qizhu Li等人的[Weakly-and semi-supervised panoptic segmentation]提出了一种弱监督和半监督的全景分割方法，该方法通过使用包围框来监督thing类别，通过图像级tags来监督stuff类别，从而消除了一些ground truth约束。

来自Eindhoven University of Technology的De Gaus等人的JSIS-Net使用单一backbone用于特征提取，后接金字塔语义分割头[PSPNet]和一个实例分割头[Mask R-CNN]。通过启发式算法将两个头的结果逐像素融合，实现了一个端对端全景分割模型。

Yanwei Li等人提出了注意力引导的(Attention-guided)的统一全景分割网络：AU-Net，该网络利用proposal和mask级的attention去更好的分割背景。

来自丰田研究院的Jie Li等人提出了things和stuff一致性网络(TASCNet)。该网络对每个像素构造一个预测things和stuff的二进制掩码。为了加强things和stuff预测之间的一致性，增加额外的损失。

与上面这些方法不同，本文使用单个backbone网络提供语义分割和实例分割的结果，开发出一种简单、高效的全景分割头，有助于提高预测实例和类别标签的精度。

统一全景分割网络(UPSNet)

跟论文[Panoptic Segmentation]一样，UPSNet将语义类别划分为stuff和thing。Nstuff表示stuff类别数，Nthing表示thing类别数。

UPSNet架构

UPSNet由一个共享特征抽取的backbone和几个网络头组成。整体架构如下：

Backbone

这里使用Mask R-CNN里的backbone，该backbone结合了深度残差网络ResNet和特征金字塔网络(FPN)，backbone的架构图如下：

实例分割头

这里的实例分割头与Mask R-CNN的差不多，输出包围框、分类、mask分割，生成的是thing类别的分割。下图是Mask R-CNN使用的基于FPN的网络头：

输出的mask的shape是28x28xNthing。

语义分割头

语义分割只分割类别，不分割实例，利用语义分割的结果可以改进实例分割头对thing类的分割结果。语义分割头由基于可变形卷积的子网络组成，该子网络以FPN的多尺度特征作为输入。具体地说，使用FPN的P2, P3, P4, P5特征图作为输入，这些特征图的通道数为256，尺度分别是输入图片的1/4,1/8,1/16,1/32。

FPN输出的这些特征图是首先经过可变形卷积，然后每个特征图各自上采样到原图的1/4尺度。拼接这些大小相同的特征图，然后使用1x1卷积和softmax预测语义类别。这个FPN+可变形卷积得到结果和独立的PSPNet语义分割模型能达到同样的精度。语义分割头的架构如下：

全景分割头

全景分割头联合实例分割头和语义分割头的结果。记语义分割头的输出为X，X的高、宽为H、W，通道数为Nstuff+Nthing。将X按通道分为两个张量：Xstuff和Xthing，对应预测的stuff类别和thing类别的语义分割。

训练时对任意输入图片根据gt确定实例的数量，记作Ninst。推断时依赖mask pruning过程(后面有介绍)确定Ninst。而Nstuff是固定的，因为所有图片中的stuff类别是相同的。而每个图片中的实例类别和数量，即Ninst不一定相同。

全景分割张量Z：全景分割头的首先处理全景分割张量 Z，Z的shape为(Nstuff+Ninst)*H*W，然后确定每个像素的类别和实例ID。首先将Xstuff赋给Z的前Nstuff个通道，用来提供stuff的分类结果。

下面介绍Z的后Ninst个通道的赋值过程。对于任意实例 i，从实例分割头中获得该实例的28x28的预测分割Yi，包围框Bi，类别Ci 。注意，训练时，Bi和Ci设置gt包围框和gt类别(即class ID)，而推断时才使用实例分割头预测的包围框和类别。根据Bi和Ci，可以从语义分割头的输出中获得第i个实例的另一个表示Xmask_i，这是Xthing中Ci通道的包围框Bi里面的值。Xmask_i的形状为H*W*1，注意在Xmask_i中包围框Bi外面的值为0。注意Xthing的Ci通道是语义分割头对该类的分割，包含了输入图片中该类的所有实例，通过使用包围框Bi将同类别其它实例的的预测值设置为0，由此得到每个实例的语义分割的分割，即Xmask_i。

然后通过双线性插值将实例分割输出的Yi缩放到与Xmask_i相同尺度(也就是实例在图片中的大小，不是和图片一样大)，并在包围框外填充0，以获得与Xmask_i相同的大小，称之为Ymask_i。则最终第i个实例的全景分割表示是Zi+Nstuff = Xmask_i + Ymask_i。

使用所有实例的全景分割表示填充完Z张量之后，逐像素沿着通道维度执行一个softmax。具体地说，如果Z的某个像素沿着通道轴的最大值落在前Nstuff通道，则该像素属于对应的stuff类别。否则，最大值对应的通道表示实例ID。在训练过程中，按照构建张量Z的gt包围框的顺序来生成gt实例ID。

实例类别的判定：在推断时，对于每个实例i，需要确定类别。可以使用实例分割头预测的类别：Cinst，也可以语义分割头预测的Csem，这里采用的是启发式规则。具体地说，对于任意实例，可以知道它包含哪些像素，这通过对Z张量按通道轴执行argmax得到该像素对应的实例ID。对于该实例的像素，首先检查Cinst和Csem是否一致。如果一致，Cinst就是它的类别。否则，计算Csem的mode，记作^Csem。如果该mode的频率大于0.5而且^Csem属于stuff，则该像素的类别为^Csem，否则，该像素类别为Cinst。(这里没看懂，mode是啥？)总之，当语义分割头和实例分割头对该像素预测的类别不一致时，若语义分割头认为该点是stuff，则我们更愿意相信它。这么做的理由是语义分割通常在stuff类别上取得非常好的分割结果。

Unknown Prediction：Unknown Prediction机制使得UPSNet判别未知类别的像素。通过一个例子解释该机制：一个行人被预测为自行车，因此行人类别的FN值被加1，而自行车类别的FP也被加1了。由于PQ的计算公式如下：

因为增加了FN或FP，导致了PQ的下降。其它类别同理。因此，如果预测出错无法避免，那么预测这些像素为unknown是一个更好的方案，因为它虽然增加了该类的FN但是不影响其它类别的FP。

计算该额外的unknown类的为Zunknown = max(Xthing)-max(Xmask)。其中Xmask是所有Xmask_i按通道轴进行串联的张量，Xmask的shape为Ninst*H*W。最大值是沿着通道轴取的，max(Xthing)获得该像素的语义分割头预测的类别，max(Xmask)是该像素所属的实例ID。原理是对于任意像素，如果Xthing的最大值大于Xmask的最大值，那很可能遗漏了某些实例(FN)。在训练时，随机采样30%的gt mask设置为unknown来为unknown class生成ground truth。计算损失函数时，无视属于unknown的像素，比如设置为void。

全景分割头的架构：

Mask pruning过程

推断时，在获得实例分割头输出的包围框、mask和预测的类别之后，需要确定Ninst才能构造全景分割张量Z，这里通过mask pruning过程确定Ninst。具体地说，首先执行class-agnositic NMS，使用的IoU阈值为0.5，用于过滤掉重叠的包围框。

然后将剩下的包围框按照类别置信度排序，保留类别置信度大于0.6的包围框。对于每个类别，创建一个与输入图片同样大小的canvas，然后将该类的mask插值缩放到图像的尺度(不是一样大，是同一个尺度)，并按照概率的递减顺序将这些mask逐个粘贴到相应的canvas上。每次粘贴一个mask，如果该mask和已经粘贴的mask的IoU大于阈值，则放弃该mask。否则，粘贴该mask中与已存在mask不相交的部分。这里设置阈值为0.3。

实现细节

这里使用的超参数很多都跟Mask R-CNN差不多。在PyTorch上实现，使用分布式框架Horovod在16个GPUs上训练。图像预处理跟Mask R-CNN一样。Mini-batch：每个GPU一张图片。如前面所述，使用了gt box、mask和class id构造全景分割头的Z张量。不同于Mask R-CNN，本文的RPN是和backbone一起端到端训练的。对于高分辨率的输入图片，比如Cityscapes的1024x2048，语义分割头和全景分割头构造的输出分割是原图的1/4。尽管在backbone内不fine-tune BN层，最终精度仍然比得上SOTA的语义分割模型：PSPNet。未来可以通过fine-tune BN来改进结果。

损失函数

UPSNet包含8个损失函数：语义分割头（整张图片逐像素分类损失和RoI的逐像素分类损失），全景分割头（整张图片的逐像素损失），RPN（包围框分类损失，包围框回归损失），实例分割头（包围框分类损失，包围框回归损失，mask逐像素损失）。在这种多任务损失函数中，使用不同的权重方案会导致非常不同的结果。本文发现损失平衡策略(比如：确保所有损失的尺度大致相同)表现较好。

RoI损失:语义分割头除了使用逐像素交叉熵损失外，为了强调像“行人”这样的前景目标，作者还加入了RoI损失：训练时，使用实例的gt包围框在semantic logits中裁剪得到RoI特征图，然后将其缩放到28x28(跟实例分割头一致)。RoI损失是在该28x28 RoI特征图上计算的交叉熵，这相当于对实例中的像素施加更多的惩罚，以防止错误分类。RoI损失在不损害语义分割的情况下提高了全景分割的精度。

实验

数据集

本节在COCO，Cityscapes和作者内部数据集上进行实验。

COCO：使用80种thing和52种stuff。使用train2017和val2017进行训练和测试，分别包含118k训练图片和5k测试图片。

Cityscapes：该数据集包含5000张在城市中的ego-centric driving scenarios图像。划分的训练集、验证集和测试集分别有2975、500、1525张，包含8类thing和11类stuff。

作者内部的数据集：该内部数据集跟Cityscapes类似，都是ego-centric driving scenarios的图片，包含10235张训练图片，1139张验证图片，1186张测试图片。包含10类thing和17类stuff。

实验配置

使用验证集结果作为展示。采用PQ、RQ、SQ作为评估指标。另外，还采用AP评估mask精度，mean IoU评估语义分割精度。同时会计算推断时间。

对于所有的数据集，使用学习率0.05，权重衰减为0.0001。

对于COCO数据集，总共训练90k，在60k时学习率除以10，在80k时学习率再除以10。

对于Cityscapes，总共训练12k，在9k时学习率除以10。

对于内部数据集，总共训练36k，在24k和32k时学习率除以10。

在COCO、Cityscapes、内部数据集上，语义分割头的损失函数权重分别：0.2、1.0、1.0。RoI损失函数权重是语义分割头的1/5。全景分割头的损失函数权重分别是：0.1、0.5、0.3。其它损失函数权重设置为1.0。

比较对象

这里将全景分割的开山之作[Panoptic Segmentation]论文里使用的全景分割方法称之为联合模型，联合模型的实例分割模型使用基于ResNet-50-FPN的Mask R-CNN，它的语义分割模型是以ResNet-50为backbone的PSPNet，然后像原论文那样通过启发式算法计算得到全景分割。称这种全景分割方法为“MR-CNN-PSP”，它的多尺度测试版本为“MR-CNN-PSP-M”。

对于PSPNet，在COCO，Cityscapes，内部数据集上分别训练220k，18k，76k，使用[Deeplab: Semantic image segmentation with deep convolutional nets, atrous convolution, and fully connected crfs.]中的’poly’学习率方案，batch size为16。

在评估时，由于PQ对RQ很敏感，因此将所有stuff分割面积小于阈值的分割设置为unknown。COCO、Cityscapes、内部数据集分别设置该阈值为4096、2048、2048。

超参数设置

对于所有的实验，都使用1500次迭代的预热阶段，其间学习率从0.002逐渐增加到0.02。所有模型都在ImageNet上预训练权重。

COCO：缩放图片至短边为800，其长边截断只1333以内。训练模型时不使用多尺度图片，测试时使用。具体地，缩放图片的短边至{480,544,608,672,736,800,864,928,992,1056,1120}。使用随机水平翻转。最后，平均不同尺度的语义分割输出。对于PSPNet，使用513x513滑动窗口测试。

Cityscapes：进行多尺度训练，缩放图片使它的短边从[800,1024]中随机采样。多尺度测试与COCO数据集一样。对于PSPNet，使用滑动窗口713x713进行测试。

内部数据集：进行多尺度训练，缩放图片使它的短边从[800,1200]中随机采样。不进行多尺度测试。

COCO

这里将UPSNet和JSIS-Net，RN50-MR-CNN [https://competitions.codalab.org/competitions/19507#results]、联合模型都进行了比较。因为联合模型没有给出COCO的基线结果，因此这里采用上面介绍的MR-CNN-PSP作为替代。JSIS-Net基于ResNet-50，RN50-MR-CNN基于两个分离的ResNet-50-FPNs，而UPSNet基于ResNet-50-FPN。为了更好的利用context信息，作者在ResNet的第5阶段的最后一个特征图使用了GAP，把它的维度减少到256，然后在生成P5特征图之前加回到FPN中。下表是各模型在COCO207 val数据集的比较结果：

从表格中可以看到，UPSNet除了SQ外，其它指标都是最好的。RQ增加导致了SQ的轻微下降，因为包含了更好的TP分割，更可能有更低的IoU。下表是各模型在COCO 2018 test-dev的结果：

尽管UPSNet使用的是ResNet-101，但是结果仍然优于使用ResNeXt-152的AUNet。上表还列出了Top3的模型，这些模型使用集成模型或其它trick。可以发现，在没有使用任何trick的情况下，UPSNet仍然与第二好的模型不相上下。在模型大小方面，RN50-MR-CNN、MR-CNN-PSP、UPSNet的参数量分别为71.2M、91.6M和46.1M。UPSNet是一个相对轻量级的模型。

下图是该数据集的可视化，1-4分别是原图、GT、联合模型、UPSNet：

Cityscapes

对于该数据集，比较了UPSNet与联合模型、弱半监督PS[ Weakly-and semi-supervised panoptic segmentation]、TASCNet。弱半监督PS使用ResNet-101作为backbone，而其它模型使用ResNet-50。UPSNet在语义分割头中使用了两个可变形卷积层。结果如下：

从上表可知UPSNet和MR-CNN-PSP比弱半监督PS的结果要好的多，尤其在PQth上面。这可能是弱半监督PS使用的基于CRF的实例子网在实例分割上的性能比Mask R-CNN要差。同样可以看到UPSNet在单尺度和多尺度测试的情况下都优于MR-CNN-PSP。这里给出的结果与PS论文给出的结果略不同，原因是：

1)原论文中使用了ResNet-101作为PSPNet的backbone，

2)原论文在将Mask R-CNN在COCO中预训练了，而PSPNet在额外的数据集上也进行了预训练。

为了公平对比，UPSNet有一个使用ResNet-101作为backbone的版本，该backbone在COCO上进行了预训练。结果见如上表，优于联合模型。下图是该数据集的可视化，1-4分别是原图、GT、联合模型、UPSNet：

从上图可以看到，联合模型的存在一大块黑色区域，这是语义分割和实例分割冲突的区域，这方面UPSNet处理的更好。此外，UPSNet预测的某些unknown区域的边界是垂直或水平的，这是因为实例分割头没有预测到东西，但是语义分割头在这些out-of-box区域预测到了某些东西。

内部数据集

这里仅对比UPSNet和联合模型，模型都使用ResNet-50作为backbone。UPSNet的语义分割头使用两个可变形卷积层。结果如下：

下图是该数据集的可视化，1-4分别是原图、GT、联合模型、UPSNet：

运行时间比较

对联合模型和UPSNet在3个数据集上的运行时间的对比结果如下：

这里使用的是NVIDIA GeForce GTX 1080 Ti GPU和Intel Xeon E5-2687W GPU。两个模型都是运行100次的平均结果。从上表可以发现，随着图片大小的增加，UPSNet的相对速度越快。

消融研究

下表是消融研究的结果：

Panoptic Head：只要语义分割头和实例分割头有输出，全景分割头就可以产生输出。因此可以先训练前两个头部，然后直接评估全景分割头。将结果与训练3个头部获得的结果进行比较，这样可以验证全景分割头的收益。Table 6前两行的结果表明全景分割头提高了PQ。

Instance Class Assignment：这里关注分配实例类的不同选择，将前面描述的启发式方法和只信任实例分割头给出的预测类的方法进行比较，结果如Table 6的第2、3行所示。

Loss Balance：作者研究了损失函数的加权方案。前面说过，在不包含RoI loss的情况下，UPSNet有7个损失函数。各损失函数之间的加权遵循以下原则：确保它们的值处于相同的数量级。本文将语义分割损失和全景分割损失的权重设置为0.2和0.1,其它损失损失函数的权重设置为1.0。若不考虑损失函数平衡，设置语义分割损失和全景分割损失的权重为0.1，其它损失函数的权重设置为1.0。Table 6的第3和第4行就是有无损失平衡的对比，结果显示损失平衡可以提高性能。

RoI Loss & Unknown Prediction：这里研究了RoI损失函数对语义头部和unknown预测的有效性。从Table 6的第4、5行可知增加该损失函数，可以轻微提升PQst。从Table 6的第5、6行可知预测unknown类别可以提高精度。

ORACLE Result：本文还探索了现有系统的改进空间，将一些推断结果替换为gt。具体地说，尝试将包围框、实例类别和语义分割结果替换为gt包围框、gt实例类别赋值(ICA)、gt语义分割。从Table 6中很明显可以看到，使用gt包围框和预测的类别概率提高了PQ，这表明模型需要更好的region proposals来实现更高的召回率。在使用gt包围框的基础上，使用gt实例类别赋值可以大大提高PQ，但是PQth提升不大，表明mask分割没有足够好。此外，使用gt语义分割可以极大的提升PQ，这显示了提高语义分割的重要性，但是PQst提升相对较小，这是因为我们在推断时缩放了图像，产生标签的misalignment的问题。值得注意的是，在仅使用gt语义分割的情况下，PQth也增加了10百分点，这是因为模型在生成实例分割时利用到了语义分割。

更多可视化结果

AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
Python计算机视觉编程第三章图像到图像的映射一只小小程序猿计算机视觉 python opencv
目录单应性变换直接线性变换算法仿射变换图像扭曲图像中的图像分段仿射扭曲创建全景图RANSAC拼接图像单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。单应性变换本质上是一种二维到二维的映射，可以将一个平面内的点映射到另一个平面上的对应点。代码如下：impo
DIODE：超高分辨率室内室外数据集（猫脸码客第186期）猫脸码客: catCode2024 开源数据集猫脸码客开源数据集超高分辨率室内室外数据集
亲爱的读者们，您是否在寻找某个特定的数据集，用于研究或项目实践？欢迎您在评论区留言，或者通过公众号私信告诉我，您想要的数据集的类型主题。小编会竭尽全力为您寻找，并在找到后第一时间与您分享。在计算机视觉和深度学习领域，深度信息作为三维空间感知的重要组成部分，对于实现高级视觉任务如场景理解、机器人导航、增强现实等具有至关重要的作用。然而，获取准确且密集的深度数据一直是一个挑战，尤其是在同时涵盖室内和室
深度学习入门篇：PyTorch实现手写数字识别 AI_Guru人工智能深度学习 pytorch 人工智能
深度学习作为机器学习的一个分支，近年来在图像识别、自然语言处理等领域取得了显著的成就。在众多的深度学习框架中，PyTorch以其动态计算图、易用性强和灵活度高等特点，受到了广泛的喜爱。本篇文章将带领大家使用PyTorch框架，实现一个手写数字识别的基础模型。手写数字识别简介手写数字识别是计算机视觉领域的一个经典问题，目的是让计算机能够识别并理解手写数字图像。这个问题通常作为深度学习入门的练习，因为
OpenCV高阶操作富士达幸运星 opencv 人工智能计算机视觉
在图像处理与计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）无疑是最为强大且广泛使用的工具之一。从基础的图像读取、1.图片的上下，采样下采样（Downsampling）下采样通常用于减小图像的尺寸，从而减少图像中的像素数。这个过程可以通过多种方法实现，但最常见的是通过图像金字塔中的pyrDown函数（在OpenCV中）或其他类似的滤波器（如平均池化、最
深入掌握大模型精髓：《实战AI大模型》带你全面理解大模型开发！努力的光头强人工智能 langchain prompt transformer 深度学习
今天，人工智能技术的快速发展和广泛应用已经引起了大众的关注和兴趣，它不仅成为技术发展的核心驱动力，更是推动着社会生活的全方位变革。特别是作为AI重要分支的深度学习，通过不断刷新的表现力已引领并定义了一场科技革命。大型深度学习模型（简称AI大模型）以其强大的表征能力和卓越的性能，在自然语言处理、计算机视觉、推荐系统等领域均取得了突破性的进展。尤其随着AI大模型的广泛应用，无数领域因此受益。AI大模型
计算机视觉—照相机（下） zidea
封面焦距(FieldofView)同一位置相机用不同焦距，28mmFieldofView就变小，85mm时候的Fieldofview也就是只有28度视野，每一个物体在通常尺寸的胶片上像素也就是越多，chromaticAberration焦距和是波长相关，不同颜色光聚焦在不同位置。这种现象在物体边缘尤为明显。颜色颜色说简单也简单，说复杂也复杂，我们在高中物理已经知道可见光是电磁波，不同颜色对应不同波
Python OpenCV精讲系列 - 高级图像处理技术（五）极客代码 Python OpenCV精讲 python opencv 图像处理开发语言人工智能计算机视觉
⚡️⚡️专栏：PythonOpenCV精讲⚡️⚡️本专栏聚焦于Python结合OpenCV库进行计算机视觉开发的专业教程。通过系统化的课程设计，从基础概念入手，逐步深入到图像处理、特征检测、物体识别等多个领域。适合希望在计算机视觉方向上建立坚实基础的技术人员及研究者。每一课不仅包含理论讲解，更有实战代码示例，助力读者快速将所学应用于实际项目中，提升解决复杂视觉问题的能力。无论是入门者还是寻求技能进
计算机视觉中的数据增强方法总结 CV技术指南(公众号) CV技术总结计算机视觉深度学习卷积神经网络
前言：在计算机视觉方向，数据增强的本质是人为地引入人视觉上的先验知识，可以很好地提升模型的性能，目前基本成为模型的标配。最近几年逐渐出了很多新的数据增强方法，在本文将对数据增强做一个总结。本文介绍了数据增强的作用，数据增强的分类，数据增强的常用方法，一些特殊的方法，如Cutout，RandomErasing，Mixup，Hide-and-Seek，CutMix，GridMask，FenceMask
计算机视觉中，什么是Hide-and-Seek？ Wils0nEdwards 计算机视觉人工智能
是的，Hide-and-Seek技术主要是在弱监督学习领域中使用的，它的核心思想是通过随机遮掩输入图像的一部分，强迫模型学习更全面的特征，而不是仅仅依赖显著的局部信息。由于弱监督场景下的监督信号有限，例如只有少量的点标注、粗略标注或没有任何标注，模型容易过度依赖于图像中最显著的部分，而忽略其他信息。这种现象会导致模型只关注容易识别的局部特征，而无法理解物体的整体结构或捕捉更多的背景信息。1.Hid
计算机视觉——第三章图像拼接 JMU15980999055 python 计算机视觉人工智能
计算机视觉——第三章图像拼接1.图像全景拼接的原理和过程的简要介绍1.1特征点提取和匹配1.2图像配准1.3图像拼接2.实现多图像拼接2.1图片集说明2.2实验代码2.3实验结果及其分析3.两张不同角度的图像拼接3.1图片集说明3.2实验代码3.3实验结果及其分析总结1.图像全景拼接的原理和过程的简要介绍在同一位置拍摄的两幅或者多幅图片是单应性相关的，我们经常使用该约束将很多图像缝补起来，拼成一个
计算机视觉学习路线不会代码的小林计算机视觉
计算机视觉学习路线是一个系统而全面的过程，涵盖了从基础知识到高级应用的多个方面。以下是一个详细的计算机视觉学习路线，供您参考：一、基础知识学习编程语言与基础库学习Python语言，掌握基础语法、函数、面向对象编程等概念。Python是计算机视觉领域广泛使用的编程语言，因其简洁易读和丰富的库支持而受到青睐。学习Numpy库，用于科学计算和多维数组操作，这是计算机视觉中数据处理的基础。学习OpenCV
【Python第三方库】OpenCV库实用指南墨辰JC Python opencv python 人工智能学习
文章目录前言安装OpenCV读取图像图像基本操作获取图像信息裁剪图像图像缩放图像转换为灰度图图像模糊处理边缘检测图像翻转图像保存视频相关操作方法讲解读取视频从摄像头读取视频前言OpenCV（OpenSourceComputerVisionLibrary）作为一个强大的计算机视觉库，提供了丰富的图像处理和计算机视觉功能，尤其在图像识别、对象检测、视频分析等领域有着广泛的应用。本文将带领读者使用Pyt
ESRGAN——老旧照片、视频帧的修复和增强，提高图像的分辨率爱研究的小牛 AIGC——图像 AIGC—视频 AIGC 人工智能深度学习音视频自动化
ESRGAN（EnhancedSuper-ResolutionGAN）：用于提高图像的分辨率，将低质量图像升级为高分辨率版本，常用于老旧照片、视频帧的修复和增强。一、ESRGAN介绍1.1背景超分辨率问题是计算机视觉中的一个重要研究领域，其目标是通过增加像素数量来提高图像的分辨率，恢复出更加细腻的图像。传统的算法（如双三次插值）通常导致放大后的图像模糊、不自然。而深度学习特别是**生成对抗网络（G
计算机视觉之旅-进阶-图像滤波处理撸码猿计算机视觉图像处理人工智能
1.基本概念1.1.数字图像图像处理的对象是数字图像,它是由像素点阵列表示的图像。需要了解像素、图像分辨率、灰度级、RBG等图像表示方法。用numpy数组表示,每个元素为像素值。例如RGB图像 importnumpyasnp img=np.array([[[255,0,0],[0,255,0]],[[0,0,255],[255,255,255]]]) 1.2.采样和量化数字图像是通过采样和量化得到
探秘3D UNet-PyTorch：高效三维图像分割利器鲍凯印Fox
探秘3DUNet-PyTorch：高效三维图像分割利器在医学影像处理、计算机视觉和自动驾驶等领域，三维图像的理解与分析至关重要。而是一个基于PyTorch实现的深度学习模型，专为三维图像分割任务设计。本文将深入剖析该项目的技术细节，应用场景及特性，以期吸引更多的开发者和研究人员参与其中。项目简介3DUNet是2DUNet的三维扩展，其结构保持了卷积神经网络的对称性，采用跳跃连接的方式保留了不同尺度
论文学习笔记 VMamba: Visual State Space Model Wils0nEdwards 学习笔记
概览这篇论文的动机源于在计算机视觉领域设计计算高效的网络架构的持续需求。当前的视觉模型如卷积神经网络（CNNs）和视觉Transformer（ViTs）在处理大规模视觉任务时展现出良好的表现，但都存在各自的局限性。特别是，ViTs尽管在处理大规模数据上具有优势，但其自注意力机制的二次复杂度对高分辨率图像处理时的计算成本极高。因此，研究者希望通过引入新的架构来降低这种复杂度，并提高视觉任务的效率。现
深度学习计算机视觉中 feature modulation 操作是什么？ Wils0nEdwards 深度学习计算机视觉人工智能
什么是特征调制（FeatureModulation）？在深度学习与计算机视觉领域，特征调制（FeatureModulation）是一种用于增强模型灵活性和表达能力的技术，尤其是最近几年，它在许多任务中变得越来越重要。特征调制通过动态调整神经网络中间层的特征，使模型能够根据不同的上下文、输入或任务自适应地调整自身的行为。特征调制的核心概念特征调制的基本思想是通过某种形式的参数调节来改变特征表示的性质
计算机视觉中，如何理解自适应和注意力机制的关系？ Wils0nEdwards 计算机视觉人工智能
自适应和注意力机制之间的关系密切相关，注意力机制本质上是一种自适应的计算方法，它能够根据输入数据的不同特点，自主选择和聚焦于输入的某些部分或特征。以下是两者之间的具体关系和如何理解它们：1.注意力机制的自适应特性注意力机制的核心功能是为不同输入元素（如特征、位置、通道等）分配不同的权重。这些权重是通过学习动态生成的，表示模型对不同输入元素的关注程度。由于这些权重是根据具体的输入数据动态计算的，因此
解锁Python中的人脸识别：Face Recognition库详解与应用码上飞扬 Recognition 人脸识别
在当今的人工智能时代，人脸识别技术已经成为了计算机视觉领域的一项重要应用。无论是在安全监控、社交媒体还是智能设备中，人脸识别都扮演着不可或缺的角色。在众多的人脸识别工具和库中，Python的FaceRecognition库以其简单易用和高效性而备受青睐。本文将深入探讨FaceRecognition库的使用方法、工作原理及其应用场景，帮助你快速掌握这一强大的工具。一、什么是FaceRecogniti
OpenCV3最常用的基本操作 HeoLis
OpenCV介绍OpenCV的全称是OpenSourceComputerVisionLibrary，是一个跨平台的计算机视觉库。OpenCV是由英特尔公司发起并参与开发，以BSD许可证授权发行，可以在商业和研究领域中免费使用。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序。该程序库也可以使用英特尔公司的IPP进行加速处理。以上是维基百科关于OpenCV的介绍，简单来说它就是处理图
论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision 小夏refresh 论文计算机视觉深度学习论文阅读笔记深度学习计算机视觉人工智能
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破，为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
Sora文本生成影像模型背后的创新原理与挑战 noVonN c语言深度学习算法区块链人工智能
引言随着人工智能技术的飞速发展，OpenAI作为行业领导者，在文本生成领域取得重大突破之后，近日又推出了其在影像生成领域的最新力作——Sora。这款模型将自然语言处理与计算机视觉技术相结合，旨在通过输入文本描述来快速创作出逼真的电影场景，为内容创作者提供了前所未有的艺术表达工具。然而，正如OpenAI所指出的那样，尽管Sora展现出了令人惊叹的创造力，但它在仿真复杂物理现象和理解具体事例因果关系方
深度学习驱动下的字符识别：挑战与创新逼子歌神经网络深度学习字符识别卷积神经网络图像处理特征提取
一、引言1.1研究背景深度学习在字符识别领域具有至关重要的地位。随着信息技术的飞速发展，对字符识别的准确性和效率要求越来越高。字符识别作为计算机视觉领域的一个重要研究方向，其主要目的是将各种形式的字符转换成计算机可识别的文本信息。近年来，深度学习技术在字符识别领域取得了显著的进展。国内研究者主要使用基于模板匹配的方法、基于统计模型的方法、基于神经网络的方法等各种方法进行字符识别研究。目前，国内各大
【深度学习实战】行人检测追踪与双向流量计数系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、双向计数、行人检测追踪、过线计数阿_旭 AI应用软件开发实战深度学习实战深度学习 python 行人检测行人追踪过线计数
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
【激活函数总结】Pytorch中的激活函数详解： ReLU、Leaky ReLU、Sigmoid、Tanh 以及 Softmax 阿_旭深度学习知识点 pytorch 人工智能 python 激活函数深度学习
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体检测系统开发】5.【图片风格快速迁移软件开发】6.【人脸表表情识别系统】7.
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&

UPSNet论文笔记

你可能感兴趣的:(计算机视觉)