行走江湖要用艺名

语义分割方法总结与综述

语义分割论文

Dilated convolution
low-level & high-level information fusion
- 2019 CVPR DFANet：Deep Feature Aggregation for Real-Time Semantic Segmentation
- 2020 PAMI Deep High-Resolution Representation Learning for Visual Recognition
- Encoder-Decoder/U-Net
Multi-Scale Context Feature
- PPM & ASPP
- - ECCV 2020 A Single Stream Network for Robust and Real-time RGB-D Salient Object Detection （Self-Attention+ASPP）
  - ECCV 2020 Suppress and Balance: A Simple Gated Network for Salient Object Detection （Fold+ASPP）
  - Gated Path Selection Network for Semantic Segmentation （Gate+ASPP）
Relation Context Feature
- Non-local
- - CVPR 2019 Dual Attention Network for Scene Segmentation
  - ICCV 2019 Asymmetric Non-local Neural Networks for Semantic Segmentation
  - Object Context Network for Scene Parsing（OCNet）
  - Interlaced Sparse Self-Attention for Semantic Segmentation
  - ICCV 2019 CCNet: Criss-Cross Attention for Semantic Segmentation
  - TPAMI 2019 Smoothed Dilated Convolutions for Improved Dense Prediction
  - ICCV 2019 ACFNet: Attentional Class Feature Network for Semantic Segmentation
  - ECCV 2020 Object-Contextual Representations for Semantic Segmentation（OCRNet）
  - Hybrid Multiple Attention Network for Semantic Segmentation in Aerial Images
  - ECCV 2020 Disentangled Non-Local Neural Networks （DNLNet）
  - ECCV 2020 Tensor Low-Rank Reconstruction for Semantic Segmentation
  - TIP 2020 ORDNet: Capturing Omni-Range Dependencies for Scene Parsing
  - CVPR 2021 Learning Statistical Texture for Semantic Segmentation
  - ICCV 2021 ISNet: Integrate Image-Level and Semantic-Level Context for Semantic Segmentation
- Long-range & Short-range
- - BMVC 2019 Global aggregation then local distribution in fully convolutional networks
Graph Convolution Net
- BMVC 2019 Dual Graph Convolutional Network for Semantic Segmentation
Real-Time
- ECCV 2018 BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation
- ECCV 2018 ICNet for Real-Time Semantic Segmentation on High-Resolution Images
- BMVC 2018 Guided Upsampling Network for Real-Time Semantic Segmentation
- CVPR 2019 DFANet: Deep Feature Aggregation for Real-Time Semantic Segmentation
- CVPR 2019 Partial Order Pruning: for Best Speed/Accuracy Trade-off in Neural Architecture Search
- 2020 Bisenet v2: Bilateral network with guided aggregation for real-time semantic segmentation
- WACV 2021 RGPNet: A Real-Time General Purpose Semantic Segmentation
- CVPR 2021 Rethinking BiSeNet For Real-time Semantic Segmentation
- CVPR 2021 HyperSeg: Patch-wise Hypernetwork for Real-time Semantic Segmentation
Patch/Local
- Focal Self-attention for Local-Global Interactions in Vision Transformers
- Local-to-Global Self-Attention in Vision Transformers
新范式-从数据集中建立更好的分隔嵌入空间
- ICCV 2021 Specialize and Fuse: Pyramidal Output Representation for Semantic Segmentation（oral）
基于Patch的一些操作

一个position的上下文/语境，典型地依赖于一系列的positions，例如周围的像素点、全局的像素点。

最早的研究主要集中在空间尺度上下文（spatial scale of contexts），例如ASPP和PPM，提取多尺度上下文（multi-scale contexts）

之后考虑一个位置与其上下文位置之间的关系，并为相似的表示产生更高权重，加权聚合上下文位置表示，self-attention/Non-local，例如DANet、CFNet、OCNet。

分配给一个像素的类标签是该像素所属的对象或者Patch的主要类别，例如ACFNet、OCRNet、ORDNet。（类别/区域）

FCN作为现代语义分割方法的基础，在之后出现了全局上下文、注意力以及高级低级特征融合等方法的改进。

Fully convolutional networks for semantic segmentation. CVPR 2015
FCN论文

Dilated convolution

典型特点：由于扩张卷积的特性，可以在提取特征的过程中保留模型的分辨率，在通过处理之后，直接上采样得到最终结果。这种方法显着增加计算和存储器，从而限制了可以使用的骨干网络的类型。

1、PSPNet

Pyramid scene parsing network. PSPNet Paper

2、PSANet

PSANet: Point-wise spatial attention network for scene parsing. PSANet Paper

3、Deeplab系列

Deeplabv3+: Encoder-decoder with atrous separable convolution for semantic image segmentation. Deeplab Paper

low-level & high-level information fusion

2019 CVPR DFANet：Deep Feature Aggregation for Real-Time Semantic Segmentation

重复使用高级语义特征来结合低级细节特征，通过编码器编码，以获得融合了低级细节特征和高级语义特征的编码特征，直接用来产生语义分割结果。

2020 PAMI Deep High-Resolution Representation Learning for Visual Recognition

高分辨率对于Position-sensitive 任务至关重要，HRNet提出了产生高分辨率特征的Backbone：

并行地连接从高到地的分辨率卷积流

在不同尺度分辨率间反复交换信息

首先通过stem（2 stride=2 3*3 conv），来将分辨率降为输入图像尺寸的1/4，在主体部分包含了：

Parallel Multi-Resolution Convolution

从一个高分辨率的卷积流作为第一个stage，逐步地添加由高分辨率到低分辨率的卷积流，组成next stage；并行地连接不同尺度的卷积流，每个stage的并行的卷积流包括前一个stage并行的卷积流以及额外的低分辨率的卷积流。

Repeated Multi-Resolution Fusions

目标是交互多尺度分辨率特征表示的信息，以为low-level high-resolution特征添加高级语义，为high-level low-resolution的特征添加细节特征，通过反复融合来自多分辨率流的表示来增强位置敏感性。

对于生成低分辨率特征，使用stride=2 3*3 conv来降维度

对于生成低分辨率特征，通过双线性上采样，并通过1*1卷积来对齐通道数

对于分辨率对齐的特征，直接为其本身

Representation Head

HRNet V1: 仅使用高分辨率特征，舍弃其他特征

HRNet V2: 对低分辨率特征进行双线性插值上采样，并Concat之后通过1*1卷积来融合四种分辨率特征表示

HRNet V2p：将HRNet V2的输出下采样到不同尺度

Instantiation

residual units； 2 3*3 ConvModule

modularized block： 4 residual units

1st stage：4 residual units + 3*3 Conv

2nd stage：1 modularized block

3rd stage：4 modularized block

4th stage: 3 modularized block

Encoder-Decoder/U-Net

典型特点：编码器通常下采样到32x，在恢复尺寸的过程中，编码器解码器逐步上采样并将来自前馈网络的高级特征与低级特征相结合，最终生成具有语义意义的高分辨率特征。

1、Panoptic Feature Pyramid Networks CVPR 2019
paper

Feature Pyramid Networks for Object Detection
Paper

在之前的全景分割任务中使用了基于联合任务的独立且不相似的网络，分别用于实例分割和语义分割。Panopific FPN在架构层次统一方法，通过在实例分割方法Mask R-CNN中使用共享的FPN骨干的语义分割分支，来进行全景分割，同时这种方法成为一种轻量级、表现极佳的语义分割方法。。其使用的语义分割模型策略使用backbone+FPN-neck+FPN-head，这种语义分割方法比基于扩展卷积-8轻量，效率高于U-Net，大致相当于扩张卷积-16，并产生4x更高分辨率的输出：

Multi-Scale Context Feature

PPM & ASPP

与SOD任务相比，典型地语义分割网络使用的策略包括提高感受野，利用上下文等，而ASPP（Deeplab v3）和PPM（PSPNet）作为最经典的提高感受野、捕获全局信息的模块。

两者的区别主要在于PPM使用多尺度池化来有效的融合全局上下文信息，ASPP使用扩张率+卷积以提高感受野。

SOD更关注于细节的恢复，所以多用FPN结构以结合高分辨率的低级特征来恢复细节；语义分割在于对成片的区域进行类别分类，所以对图像下采样倍数较低。

在SOD任务中使用的ASPP多使用[1,2,4,6]的扩张率，以适应小分辨率（224 256 384等）、高倍下采样（16x、32x）的high-level feature map。

在语义分割任务中使用的ASPP多使用[1,12,24,36]扩张率，以适应大分辨率（5121024、769769等）、低倍下采样率（8x）的feature map，以获得更大的感受野

ECCV 2020 A Single Stream Network for Robust and Real-time RGB-D Salient Object Detection （Self-Attention+ASPP）

在ECCV2020：A Single Stream Network for Robust and Real-time RGB-D Salient Object Detection 提出了PAFEM

本质上相当于在ASPP中添加了Non-Local，在不同尺度上直接聚集特征会由于非显著区域的分散而削弱显著区域的表示能力，相较于平等地对待所有的空间位置，论文中对不同尺度的特征进行Non-Local增强了空间注意力，以便更关注视觉上重要的区域。通过融合注意增强的多尺度特征，构建了金字塔型特征提取模块（PAFEM）。在SOD任务中使用的扩张率为[1,2,4,6]，调整为[1,12,24,36]以适应语义分割任务，并在mmseg中建立PAFEMHead.

ECCV 2020 Suppress and Balance: A Simple Gated Network for Salient Object Detection （Fold+ASPP）

在ECCV2020 Suppress and Balance: A Simple Gated Network for Salient Object Detection中提出了FoldConv_aspp

在Deeplabv3中提出了ASPP使用多个不同尺度扩张率的atrous convolutional layers。由于扩展卷积核的稀疏性，特别是在使用大膨胀率时，导致采样点之间的关联关系太弱，无法提取稳定的特征。在GateNet中使用了简单的折叠操作，进一步扩大了感受野，而且将每个有效采样位置从一个孤立点扩展到了一个2×2连通区域。通过这种fold、unfold方式，融合了更多的上下文信息，并保持了一定的局部相关性，为后续操作提供了容错能力。调整在SOD任务中的扩张率为[1,2,4,6]，使用fold unfold的方法，并且使用[1,12,24,36]的扩张率，以融合更多的上下文信息，建立foldaspp_head.

Gated Path Selection Network for Semantic Segmentation （Gate+ASPP）

Relation Context Feature

Non-local

资料

CVPR 2019 Dual Attention Network for Scene Segmentation

论文地址：https://arxiv.org/pdf/1809.02983.pdf

同时计算channel和spatial方向上的attention map

ICCV 2019 Asymmetric Non-local Neural Networks for Semantic Segmentation

论文地址：https://arxiv.org/pdf/1908.07678.pdf

Github地址：https://github.com/MendelXu/ANN

在Non-local中主要探究了点与点之间的相似度关系，生成2D Attention map，有效地捕捉了对语义分割至关重要的远程依赖关系；对每个position的特征通过对所有postion点的特征加权进行更新，其需要较高的计算需求和GPU内存。相比于计算N*N个点间的相似性矩阵，ANN设计了非对称的Non-Local方法来计算N(点)*S(块)之间的相似性关系，在减少了计算量的同时，保留了局部信息的相关性。对于特征key和value，通过sampler(Pyramid Pooling)进行特征抽取，基于SPP的特征抽取有效地聚合了全局信息及上下文。

（在Pyramid Pooling之后，直接view之后concat，如果按照pspnet的方式，在中间添加1*1的卷积会怎么样？但是论文的出发点是减少模型的计算量和参数数量，所以放弃了这种卷积方式。）

Object Context Network for Scene Parsing（OCNet）

论文地址：https://arxiv.org/pdf/1909.11065v5.pdf https://arxiv.org/pdf/1809.00916.pdf

Github地址：https://github.com/openseg-group/OCNet.pytorch

"HRNet + OCR + SegFix"曾实现cityscapes rank-1

Interlaced Sparse Self-Attention for Semantic Segmentation

Arxiv

提出了Interlaced Sparse Self-Attention来提高语义分割中Self- Attention的效率。主要思想是：将dense affinity matrix分解为两个sparse affinity matrices的乘积。第一个注意力模块用于估计具有长空间间隔距离的位置子集中的亲和力，第二个注意力模块用于估计具有短空间间隔距离的位置子集内的亲和力。这两个注意力模块的设计使得每个位置都能够接收来自所有其他位置的信息。与原始的 self-attention 模块相比，我们的方法大大降低了计算和内存的复杂性，尤其是在处理高分辨率特征图时。我们凭经验验证了我们的方法在六个具有挑战性的语义分割基准上的有效性。

ISNet将dense affinity matrix A (下图中a) 分解为两个sparse affinity matrices Al和As，其乘积为dense affinity matrix.

首先，我们将所有的输入位置像素划分为相同尺寸的Q个子集，每个子集都包含了P个像素位置：

对于long-range attention，我们从每个子集中采样一个像素位置来重建具有Q个像素位置的子集，这样可以得到P个子集。（代码：直接将P个像素位置按照通道排列）在每个重建的子集里的像素位置具有长空间空间距离。我们对每个子集执行Self-Attention，来计算稀疏的相似性矩阵，通过合并得到Al。对于short-range attention，我们对初始的Q个子集进行Self-Attention，来计算稀疏相似性矩阵，对自己内的局部像素位置计算获取了短程的注意力。

其次，通过将这两种attention合并，对于特征图中的每个像素位置，都能捕捉长短程的信息。

在（a）中每个输出像素位置的信息都从输入的每个像素位置中捕捉，建立了fully dense connections；在（b）中通过第一个/第二个置换操作用于将原本具有长/短空间间隔距离的位置组合在一起，建立了稀疏的链接。

ICCV 2019 CCNet: Criss-Cross Attention for Semantic Segmentation

TPAMI 2019 Smoothed Dilated Convolutions for Improved Dense Prediction

Arxiv

ICCV 2019 ACFNet: Attentional Class Feature Network for Semantic Segmentation

整个ACF模块包括CCB和CAB模块，整个类似于Self-Attention原理，其中Coarse Mask Prior作为Key和Value，由Backbone计算的F作为Query，由Key和Query计算相似性矩阵（实现了相同class region区域内的特征聚合，得到的N*C特征相当于为每个类别产生了C通道的特征，作为attention），用来加权Value（用每个类别的C通道特征加权Coarse Mask Prior），从而得到了由Pixel-Level Feature增强的Region-Feature。

ECCV 2020 Object-Contextual Representations for Semantic Segmentation（OCRNet）

Code is available at: https://git.io/openseg and https://git.io/HRNet.OCR .

类似于ACFNet + ANN的结合体，Coarse segmentation引导的区域聚合 + 像素-patches的特征聚合。

Paper Result：OCRNet在Cityscapes val上使用single-scale text，结果为79.6.

相比于ACF，除了细节上的小差异之外，最大的不同是，region formation和pixel-region formation，OCRNet中考虑了pixel-region表示的关联性，以此实现计算region中像素相关性，而生成最终的Object Contexture Representation；而ACF仅仅考虑了region特征。

We compare our approach with other two mechanisms that do not use the region representation for estimating the pixel-region relations:

(i) Double-Attention uses the pixel representation to predict the relation;

(ii) ACFNet directly uses one intermediate segmentation map to indicate the relations.

动机：分配给一个像素的类标签是该像素所属的对象的类别，通过利用相应类的对象区域的表示来增强一个像素的表示，将同类上下文像素和不同类上下文像素区分开。

像素的标签是像素所属对象的类别，OCRNet使用周围对象类来表征一个像素的object-contextual representations：

首先将上下文像素划分为一组Soft Object Regions，每个Object Regions对应一个类别，即使用Backbone+FCN得到的Coarse soft segmentation，基于 ground-truth segmentation作为监督来计算对象区域(object regions)

通过聚合相应object regions中的像素表示，估计每个对象区域的表示（object regions representation）。

计算each pixel和each regions之间的相似性矩阵（Pixel-Region Relation），加权object region representation得到object contextual representation（OCR）

最后使用OCR来增强每个像素的表示，并与pixel representation聚合得到最终特征。

（个人理解本质上是Region和Pixel的self-attention，相比于Non-Local为每个position计算所有position的加权特征和，OCR模型计算了每个position与所有区域的加权特征和。）

Hybrid Multiple Attention Network for Semantic Segmentation in Aerial Images

Arxiv

对于高分辨率的图像，具有局部感受野的卷积无法从整张图片来建模全局依赖（现有一些模型都是用更大的感受野/self-attention，例如PPM、ASPP、Non-Local等），基于注意力的方法可以捕获远程依赖关系并进一步重建特征图以获得更好的表示。受限于单纯的空间和通道注意力的角度以及自注意力机制的巨大计算复杂性，不太可能对复杂光谱遥感图像的每个像素对之间的有效语义相互依赖性进行建模。Hybrid Multiple Attention Network（HMANet）可以自适应从空间、通道和类别的角度以更有效和高效的方式自适应捕获全局相关性。

Attention-based model：信息冗余不利于特征表示；基于注意力的方法受限于空间和通道的维度，忽略了基于类别的信息，而基于类别的信息与模型的最后一次卷积直接相关。缺乏基于类别的信息和高昂的计算代价是基于注意力的方法面临的两个严峻挑战。

类别级注意力：类似于OCRNet。

区域级注意力：在复杂场景中，同一类别对象特征存在较大差异。Self-Attention为类别相同、特征表示差异较大的像素计算产生错误的相似度矩阵，造成性能衰减。而无效的冗余信息不利于特征表示。提出了区域注意力表示，按区域表示可以更有效的方式捕获像素之间的远程上下文信息。RSA模块是将密集的逐点相似性矩阵分解为两个稀疏的区域级别的对应物，其中任何一个都可以通过平均池化方法以更稀疏的方式有效地捕获全局上下文。结合两个相似度矩阵，RSA可以捕获局部特征的丰富空间上下文信息。

RSA将密集的特征表示，在重组后以稀疏和有效的方式获取区域级（region-wise）依赖和特征表示。首先我们通过Permute（置换）操作将输入特征图划分为区域，每个区域都被送入自适应池化层以获取区域特征表示。我们将每个区域的point-wise特征表示合并来获得整个图像的稀疏特征表示。对稀疏特征表示执行Self-Attention来建立区域级长程关系。这种对区域特征进行Self-Attention，能够凭经验捕捉所有区域的长程上下文特征，但是依旧缺乏Pixel-Level的像素级链接关系。为了从区域的角度利用更明确的上下文依赖关系，我们使用shuffle attention来交替池化相应的子区域并分别计算其自注意力表示，实现空间信息的互补表示。进一步的实验表明，两个子区域的注意力加权表示的级联可以有效地增强上下文依赖性，优于像素级Non-Local算子。

ECCV 2020 Disentangled Non-Local Neural Networks （DNLNet）

论文中提出了Non-Local模块的self-attention可以被分解为两个部分，一个 whitened pairwise term用来计算嵌入向量空间里两个像素间的关系，一个 unary term用来表示单个像素对全局像素的影响，用来表示显著性边界。如左图前三行所示，通过对Non-Local进行实验，独立的pairwise和unary获得特征表现强于在NL中联合训练，且独立训练的unary性能就优于NL，这表明耦合紧密的两部分不利于视觉线索的学习，从而影响判别特征的学习。DNL通过使用独立的Softmax和embedding Matrices，将基于点乘的attention分离为两个模块，pairwise(specifically) 和 unary(generally)，解决在NL中联合训练的性能衰减问题，且优于NL中独立训练的pairwise和unary。（在MMseg中集成了，但是与论文结果存在些许出入，分析：训练记录）

看完源码之后的感受，与其说从Non-local中分离出unary的特征attention，其实相当于求一个global spatial attention（N1HW，通过简单地卷积、Softmax，相当于为当前特征的每个像素生成了一个全局的注意力），与Value加权计算得到1*C，来为每个channel通道计算一个全局的权重。

ECCV 2020 Tensor Low-Rank Reconstruction for Semantic Segmentation

论文地址：https://arxiv.org/pdf/2008.00490.pdfGithub地址：https://github.com/CWanli/RecoNet

依赖于2D similarity Matrix的Non-Local，在执行矩阵计算时牺牲了通道间的上下文关系，以增强空间上下文关系。根据张量规范多态分解理论，RecoNet中将3D的high-rank矩阵化归到1D的low-rank张量，由张量生成模块（TGM）从中抽取对应每个维度的一阶张量来表示上下文信息；在之后通过张量重建模块（TRM）从一阶张量中重建高阶3D特征。

论文中提出的方法，在TGM的每个模块中使用了sigmoid作为激活函数，理由如下：1) 每个被激活函数缩放的元素都可以视为attention，表征了某种上下文特征的权重。 2) 所有表征上下文信息的rank-1 tensors应该都是非线性相关的，以保证每个tensors都具有不同的上下文信息，其目的是生成一个3D的attention map。问题：当使用了sigmoid对所有的rank-1 tensors以模拟attention时，在TRM中将三个上下文权重相乘，弱化了每个方向上的特征的独特性，我们可以尝试将生成rank-1 tensors attention的过程转化为key-value的过程或者简单的attention(x)x；并且在这个过程中忽略了三个特征间的相互关系，我们可以将C11、1H1、11W经过reshape和concat，变成(C+H+W)11经过卷积处理生成了31*1的attention，用来加权3个rank-1 tensors。

TIP 2020 ORDNet: Capturing Omni-Range Dependencies for Scene Parsing

论文地址：https://arxiv.org/pdf/2101.03929.pdf 与DNL相似的思路之一是，从Non-Local中提取全局的unary特征/增强attention map中响应较大位置特征，以提取元素对于空间的global attention。

核心思想：在计算self-attention的过程中，距离当前像素较远处的通常关联度较低，其产生的响应会产生噪声，影响特征聚合。可以通过self-attention捕捉long-range dependencies，可以通过卷积捕捉short-range dependencies，long-range和short-range之间仍然存在很大gap，这在很大程度上降低了模型在复杂自然场景图像中应用于不同空间尺度和关系的灵活性。ORDNet通过在局部补丁里应用self-attention，建立middle-range dependencies，并通过加权long-range dependences来强调与其他区域具有较大相关性的空间区域以更准确地利用远程依赖。对在self-attention中生成的相似性矩阵，每个position为其他positions贡献不同的注意力权重以进行上下文聚合。对于每个position，它与其他位置加权权重的总值表明了其与其他position的相关性以及对全局上下文的重要性。其表征了该位置与其他位置的相关性程度强弱。The features of positions contributing higher attention weights to others encode the common patterns of the whole image, including main elements appearing in the scene, large-area continuous background, etc.

在middle-range dependences中，输入特征被分离成了2*2的patches，并且分别对每个patch执行self-attention，从而将自注意力范围从整个feature map缩减为补丁级别，以从相关性更高的局部位置提取有效地相关性特征。

CVPR 2021 Learning Statistical Texture for Semantic Segmentation

论文地址：https://arxiv.org/pdf/2103.04133.pdf

现有的语义分割工作主要专注于学习高级语义的上下文，一些网络为了捕捉精确的边界和低级纹理特征使用了skip-connection来填充细节。然而低级纹理特征不仅包含了Local Structure，同时也包括了Global Statistical knowledge。STL-Net充分利用低级纹理特征，提出了统计纹理特征，分析低级信息的分布并有效地利用它们。

定义了Quantization and Counting Operator (QCO)以统计的方式描述纹理特征。具体地，输入图像的统计纹理通常种类繁多，并且在谱域中是连续分布的，这在深度神经网络中难以提取和优化。在 QCO 中，我们首先将输入特征量化为多个levels。每个level都代表一种纹理统计，通过它可以很好地对连续的纹理进行采样，以便于描述。量化后，计算每个级别的强度以进行纹理特征编码。

基于QCO，STL-Net提出了两个模块，1、Texture Enhance Module (TEM)，来捕捉纹理相关特征并增强纹理细节；2、Pyramid Texture Feature Extraction Module (PTFEM)，来有效提取不同尺度下的统计纹理特征。

1、 Local structural property：用来关注局部模式，包括边界、平滑度、粗糙度等，可以看作spectral domain analysis。

2、Global statistical property：基于低级信息（像素值/局部区域属性）的统计属性，关注于图像的分布分析，例如histogram of intensity。对于图像，经过直方图均衡增强之后，会包含更丰富的细节特征，有益于分割。在传统方法中已经出现了一些利用统计信息的方法，但没有机制在CNN架构下显式地提取和利用纹理统计特征用于语义分割。

ICCV 2021 ISNet: Integrate Image-Level and Semantic-Level Context for Semantic Segmentation

论文地址

Co-occurrent visual pattern使得上下文特征聚合成为增强语义分割中像素表示的通用范例，现有的方法基本从整个图像的角度来建模上下文，即聚合图像级别的上下文特征。现有方法弱化了相同类别的像素表示的重要性，即语义级别的上下文特征；

ISNet提出了聚合图像级和语义级上下文信息。首先一个Imgae-level context module（ILCM）用来捕捉整个图像的每个像素的上下文信息（全局平均池化和Feature-x Concat，再与x使用self-attention计算相似度矩阵）；其次使用一个semantic-level context module（SLCM）来聚合同类的每个像素的表示（对每个类别像素点进行了特征的加权，再对特征进行聚合，和x计算相似度矩阵），类别区域受到分割真值监督；最终，分别计算每个像素表示特征与image-level上下文信息、semantic-level上下文信息的相似度矩阵；最后通过加权聚合图像级上下文信息和语义级上下文信息以相似性作为权重来增强像素表示。

在Self-attention中，每个像素的上下文信息被不平衡的从所属类别区域和其他类别区域中捕获，例如，边界或小尺度对象区域中的像素倾向于从其他对象的区域捕获更多的上下文信息。由于一个像素的标签是该像素所属对象的类别，来自其他对象的过多上下文信息可能会导致网络将这些像素错误地标记为其他类别。在OCR中，即使使用了代表区域特征的R和像素级特征的P计算相似性矩阵，对于P中的每个像素特征进行上下文信息聚合，依旧是从所有的Region（category）中获取相关的上下文信息。

ISNet通过聚合图像级上下文信息和语义级上下文信息来增强像素表示。

Github源码：

通过Backbone获得的特征为x，通过Decoder得到粗糙的初始分割结果preds，其被真值监督。对于preds每个像素位置选择对应的最大权重的类别标签，得到了一通道的类别图；

对于每一个类别，我们可以计算得到对应的二值图，则可以按当前类别得到所有相关归属于该类别的像素点位置；

根据preds[:, class_id]中得到对应类别的得分图，根据二值图像，可以得到实际归属于该类别的每个像素点得分，并使用Softmax，从而实现了在每个类别中独立进行加权。

def forward(self, x, preds):
        inputs = x
        batch_size, num_channels, h, w = x.size()
        num_classes = preds.size(1)
        feats_sl = torch.zeros(batch_size, h*w, num_channels).type_as(x)
        for batch_idx in range(batch_size):
            # (C, H, W), (num_classes, H, W) --> (H*W, C), (H*W, num_classes)
            feats_iter, preds_iter = x[batch_idx], preds[batch_idx]  # 得到当前图像的特征和预测map
            feats_iter, preds_iter = feats_iter.reshape(num_channels, -1), preds_iter.reshape(num_classes, -1)
            feats_iter, preds_iter = feats_iter.permute(1, 0), preds_iter.permute(1, 0)
            # (H*W, )
            argmax = preds_iter.argmax(1)  # 得到一通道图像，每个像素点对应的类别序号
            for clsid in range(num_classes):
                mask = (argmax == clsid)  # 根据类别序号，确定每个类别对应的二值图像
                if mask.sum() == 0: continue
                feats_iter_cls = feats_iter[mask]  # 在特征图中取出对应当前类别的像素点特征，例如有N个像素点，则特征图为[N, C]；在粗糙预测中对应类别A的相关像素点特征
                preds_iter_cls = preds_iter[:, clsid][mask]  #  尽管当前类别为A，但是在argmax的时候，置信度不同，可以作为加权权重，取出属于类别A的像素对应类别A的得分
                weight = F.softmax(preds_iter_cls, dim=0)  # 使用Softmax归一化，对feats进行加权
                feats_iter_cls = feats_iter_cls * weight.unsqueeze(-1)
                feats_iter_cls = feats_iter_cls.sum(0)
                feats_sl[batch_idx][mask] = feats_iter_cls
                # 此时得到的是在对应类别mask内，进行了加权的像素级特征，在之后的类别里，这些像素点不会被重复处理了；对同一类别的像素点分配相同的值。
        feats_sl = feats_sl.reshape(batch_size, h, w, num_channels)
        feats_sl = feats_sl.permute(0, 3, 1, 2).contiguous()
        feats_sl = self.correlate_net(inputs, feats_sl)
        
        return feats_sl

Long-range & Short-range

BMVC 2019 Global aggregation then local distribution in fully convolutional networks

论文地址：https://arxiv.org/pdf/1909.07229.pdf

代码地址：https://github.com/lxtGH/GALD-DGCNet

全局聚合（Global Aggregation）通常依赖于large patterns特征，趋向于平滑small patterns features，例如边界和小的物体。GA可以显著地聚焦到显著对象上，改善模型在大物体上的性能表现，但是平滑了小物体对应的区域，。为了解决这个问题，GALD设计了Global Aggregation和Local Distribution，在维护了GA全局结构的同时，恢复了细节。

对于Backbone计算特征，首先通过Global Aggregation，由于没有额外的监督，在生成特征中，C通道潜在地描述了特征的patterns。对于每个c通道的特征，学习空间算子以基于图片的激活切片来重新计算图像中patterns的空间范围。

对于每个channel/patterns的空间算子被建模为一系列的深度卷积层，通过stride为d的卷积层进行下采样，再进行上采样和激活函数sigmoid，得到了0-1的HWC的特征图，其中包含了每个pattern的mask map，描述了每个pattern重新计算的空间范围。

根据重新计算的each position (HW) each pattern © 的空间范围来为经过全局聚合的特征进行加权。

Local distribution M 在全局信息和局部细节特征（from backbone）之间添加了对全局特征的逐点权衡；

在Coarse Data上的训练方法：

使用Batch size=16、固定的BN层以及更大的crop尺寸在2w Coarse Data上进行预训练 50k iterations

使用Batch size=8、更小的学习率在fine-data上进行fine-tune 10k iterations

MS/Flip 82.9%

Graph Convolution Net

BMVC 2019 Dual Graph Convolutional Network for Semantic Segmentation

Real-Time

Speed-Accuracy performance comparison on the Cityscapes test set.

解决实时语义分割的主流思路：

轻量级 Backbone：DFANet、DANet

Multi-branch：ICNet、BiSeNetV1、BiSeNetV2

低级细节特征与高级语义特征的融合

对于减少主分支的计算量：

1）可以使用原始分辨率，但不使用扩张卷积来维护空间分辨率

2）使用4x图像分辨率，可以使用扩展卷积来维护空间分辨率

ECCV 2018 BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation

在(a)中通过crop或者resize图像尺寸来减少计算量，丢失的空间信息弱化了对于边界、细节的预测；通过Network Pruning，弱化了特征向量空间的表征能力；ENet Drop Stage，放弃了最好stage的下采样，无法获得足够的感受野来捕获大物体的相关信息。

在(b)中使用U-Net结构，通过依次聚合编码器特征来逐渐提高分辨率并补充细节特征；在高分辨率特征图上的操作降低了推理的速度，U型结构依旧没办法从NetWork Pruning中有效地恢复空间特征。

BiseNet具有Spatial Path和Context Path，旨在分别处理空间细节信息和具有高感受野的上下文特征。对于SP，堆叠了三个卷积层将图像下采样到8x，保留了丰富的细节特征并维持空间尺寸大小；对于CP，在Xception的尾部添加了全局平均池化以获得最大的感受野。论文中同时提出了Feature Fusion Module（FFM）和Attention Refinement Module（ARM）来聚合特征。

语义分割任务需要丰富的空间信息和较大的感受野，模型通常牺牲空间分辨率来实现实时的推理速度和较低的性能表现。

BiseNet引入来一个小步长的Spatial Path来维护空间信息和生成高分辨率的空间细节特征；同时使用Context Path来获得有效感受野和上下文特征；解耦空间细节信息维持和高感受野。

提出了Feature Fusion Module来有效地聚合特征和Attention Refinement Module来细化特征。

在使用Res-101作为baseline的情况下，结果高于PSPNet、Deeplab v2；当使用轻量级Backbone时，模型能够实现实时速度和高精度。（结果比同为ECCV的工作ICNet高很多）

在消融实验中证明，Global average Pooling以及ARM的联合使用提供了高额的性能提升（～+3%），而基于FFM的SP分支相比于baseline仅提升1.4%。

ECCV 2018 ICNet for Real-Time Semantic Segmentation on High-Resolution Images

ICNet基于PSPNet（PSPNet作者）进行了修改，认为图像分辨率是影响实时语义分割网络速度的重要原因。ICNet利用了低分辨率图片的高推理速度和高分辨率图像的高推理性能，从低分辨率图像中经过语义分割网络来得到粗糙的低分辨率预测，使用高分辨率图像来提取低级细节特征，通过不断地为Cascade Fusion Unit和Cascade Label Guidence引入高分辨率特征，从而逐渐提高精度。

ICNet使用了图像级联的策略，从大分辨率图像（1x）中抽取浅层低级特征来维护空间特征（类似于BiseNet 的Spatial Path）；为了减少计算量，对于小分辨率图像（4x）提取高级语义特征，使用Dilated Conv来维护空间分辨率和高感受野的语义特征。

在top分支中尽管由于低分辨率缺失了相关的边界信息和空间细节，但是已经可以捕捉到大量有效的高级语义细节；基于可信的粗糙预测结果，所以使用对参数进行限制的middle分支和bottom分支；对于middle分支和top分支的前几层共享参数，在bottom分支使用轻量级的多层卷积，所以不会造成较大的计算负担。在top分支和middle分支的输出进行了监督，并分配了0.4的对应权重。

类似的思路和结构，为什么ICNet的性能相比于BiseNet差距极大？

ICNet同时利用了低分辨率的高级语义特征和高分辨率的低级细节特征，相比于BiseNet基于FFM的CP和SP方法的性能基本持平；
ICNet中对16x、8x、4x的预测结果进行了监督，BiseNet对CP的最后两个stage的特征进行额外的监督；
BiseNet中的GP和AFM提供了大量的性能提升，证明了Attention的有效性。
ICNet因为复用了部分编码器，并且使用了2048*1024分辨率图像作为输入；BiseNet使用1536x768分辨率作为输入；所以在推理速度上也存在比较大的gap；
U-Net结构对于恢复空间特征的重要作用。

BMVC 2018 Guided Upsampling Network for Real-Time Semantic Segmentation

共享参数在减少参数量的同时可能隐式地带来正则化效果，所以两分支编码器（1/2，1/4）共享参数能过带来更高的性能；

当使用三分支共享参数编码器（1，1/2，1/4）在显著地提升性能的同时，也损失了速度上表现，慢于实时速度。

CVPR 2019 DFANet: Deep Feature Aggregation for Real-Time Semantic Segmentation

高级语义特征通过连续地结合低级细节特征来抽象出有效的特征，同时具有大感受野和细节空间特征；

CVPR 2019 Partial Order Pruning: for Best Speed/Accuracy Trade-off in Neural Architecture Search

2020 Bisenet v2: Bilateral network with guided aggregation for real-time semantic segmentation

WACV 2021 RGPNet: A Real-Time General Purpose Semantic Segmentation

CVPR 2021 Rethinking BiSeNet For Real-time Semantic Segmentation

在BiSeNet中增添了额外的Spatial Path来编码空间信息是耗时的，并且由于任务特定设计的缺陷，从预训练任务（例如图像分类）借用的主干可能对图像分割效率低下。

设计了一个Short-Term Dense Concatenate module（STDC），其中使用了short-term的多尺度/感受野特征级联，引导多尺度特征表示。MobileNet、ResNet等为分类设计的模型在应用于分割领域时需要进行调整。在图像分类任务模型中倾向于在更高的层使用更大的通道数。但是在语义分割任务中，我们关注于可扩展的感受野和多尺度信息（scalable receptive field and multi-scale informations）。低级特征需要足够的通道数来编码具有较小感受野的更细粒度的信息，而具有更大感受野的高层更关注于高级特征的归纳，使用和低层相同的通道数，可能会造成信息的冗余。STDC以几何级数的方式逐渐减少来精心调整block中滤波器的数目；最终的输出来自于所以blocks的聚合，能保留可扩展的感受野和多尺度信息。
在编码器中没有使用BiSeNet中耗时的附加分支，而是使用Detail Guidance 模块来引导low-level layers来进行空间细节的学习。首先使用Detail Aggregation Module来生成细节真值，接着使用binary cross-entropy loss和dice loss来优化细节信息的学习任务，可以被认为边信息学习。而边信息仅在训练阶段中被使用，帮助编码器low-level layer学习空间细节，并且不会为推理过程造成额外负担。
将来自low-level layers的空间细节和high-level layers的语义信息融合得到最终的语义分割结果。

CVPR 2021 HyperSeg: Patch-wise Hypernetwork for Real-time Semantic Segmentation

论文地址: CVF-HyperSeg

引入元学习技术，为网络提供附加的适应性，在编码器中编码和生成解码器的权重。对于语义分割任务，通常使用由粗到细的金字塔结构，自适应操作可以在每个级别的过程中受益，因为过程中的影响被累计到下一个过程；并且由于图像的每个部分可能包含不同的对象，所以自适应被应用在局部。

Context head使用nested U-Net来提取更高维度的语义上下文信息。在特征图中每个像素位置编码了输入图像的一个patch，这些patch间几乎没有重叠；对于跨越多patches的大物体由于有限的感受野通常结果较差。在Context head中通过nested U-Net的结构，使用2*2卷积（stride=2）来聚合patch特征，能够结合多patches的信息来提取有效的上下文信息。
设计Meta Block根据Context head提取的上下文信息生成每个block的权重，并使用新颖的dynamic patch-wise convolution，从而实现了元学习的技术，
论文提供了一种新颖的编码器-解码器方法，其中编码器的主干基于该领域的最新进展。编码信号使用Context head 映射到动态网络权重，而解码器由具有动态空间权重的Meta Block组成。

Patch/Local

Focal Self-attention for Local-Global Interactions in Vision Transformers

通过Self-Attention 捕捉short-/long-range 视觉依赖是成功的关键，但是自注意力机制会带来高昂的算力消耗；很多最近的工作都尝试应用粗粒度的全局注意力和细粒度的局部注意力来减少计算/内存的消耗并提高性能。

Focal Self-attention旨在提出一种结合细粒度局部和粗粒度全局相互作用的新机制。在这种机制下，每个token以细粒度关注其最近的标记并且以粗粒度关注较远的像素位置，从而高效和有效地捕捉short-/long-range视觉依赖。

在Transformer中，Transformer layers能够对不同图像区域的全局上下文深度交互，来建模short/long-range依赖。根据Self-Attention的可视化，其能够同时学习局部周围信息和全局上下文信息。考虑到邻近区域之间的视觉依赖通常比远处的强，我们只在局部区域执行细粒度的自注意力，而全局执行粗粒度的注意力。如图所示，一个Query token以最细粒度关注其特征图中最近邻的位置像素。当建立其与更远处的区域之间的联系时，趋向于聚合token来建立粗粒度的视觉依赖。区域离query token越远，粒度越粗，因此它可以有效地覆盖整个高分辨率特征图，同时在执行self-attention时引入了更少了tokens。每个token都以焦点的形式聚合其他tokens（类似于heatmap），同时 1）利用多尺度体系结构为高分辨率图像保持合理的计算成本，2）将特征图分成多个窗口，其中tokens共享相同的环境，而不是对每个token执行focal self-attention。

Local-to-Global Self-Attention in Vision Transformers

通过对图片特征下采样，来实现局部、全局特征的交互，对于图像特征图，以22、44尺度进行双线性下采样，并通过window-based multi-head self attention (W-MSA)来建模局部信息和全局信息的交互过程。

新范式-从数据集中建立更好的分隔嵌入空间

ICCV-2021出现了几篇大致类似的思路，包括王文冠、周天飞设计的建立图像间的像素语义关系的新范式、对数据集内图像编码特征、跨图像的区域匹配。

ICCV 2021 Specialize and Fuse: Pyramidal Output Representation for Semantic Segmentation（oral）

论文地址：CVF-ICCV

Motivation：FCN作为分割任务的基石，以端到端的方式学习像素级特征表示。但是FCN的空间不变性（spatial invariance）阻碍了在图像内像素之间对有用上下文进行建模的能力。因此后续工作的主流是深入研究有效上下文聚合的网络设计，包括dilation convolution/spatial pyramid pooling/multi-layer feature fusion/neural attention。另外由于广泛使用的像素级交叉熵损失根本上缺乏空间辨别能力，Iou-loss等代替优化标准被提出以在分割网络训练期间明确解决对象结构。现有的分割方法利用深层架构将图像像素投影到高阶非线性嵌入空间。这些方法典型地学习嵌入向量，仅仅使用图像采样（单个图像的像素依赖性）的‘local’上下文，而忽略整个数据集的‘global’上下文（即图像间的像素语义关系）。（现有的语义分割任务关注于挖掘图像“local”上下文信息，即通过上下文聚合模块（扩张卷积、神经注意力等）或者结构感知优化标准（Iou Loss等）来挖掘单个图像内的像素之间的依赖关系。这些方法忽略了训练数据间的“global”上下文信息，即不同图像中像素之间的丰富语义特征。）好的特征嵌入空间应该具有两种属性：1）解决单个像素嵌入的分类能力，2）空间结构良好以解决类内紧凑和类间分散的问题。在表征学习中被证明，对训练数据的内在结构（即2）进行编码有助于提高特征辨别力（即1）。

无监督表示学习的进展可以归因于对比学习的复兴，其是一个深度度量学习的一个重要分支。核心思想为：给定一个锚点，在投影的嵌入空间中将相似（正）样本和不同（负）样本区分开。特别是在计算机视觉领域，对比度是基于图像特征向量来评估的；锚图像的增强版本被视为正面图像，而数据集中的所有其他图像都被视为负面图像。无监督对比学习的力量源于structured comparison loss（结构化比较损失），其利用了训练数据的上下文。

受到无监督对比表示学习的启发，提出了在全监督模式（fully supervised setting）下的像素级对比算法（pixel-wise contrastive algorithm）用于语义分割。具体来说，除了使用逐像素交叉熵损失来进行类别辨别（即1），同时使用逐像素的对比损失通过探索labeled pixel samples的结构信息进一步塑造像素嵌入空间（即2）。核心思想是强制属于同一语义类的像素嵌入向量相似，而来自不同语义类的像素嵌入向量更具有差异性。（对于训练中给出的像素级分类信息，属于同类的像素为正样本，属于不同类的像素为父样本）它通过明确探索标记像素的结构，提出了一种用于语义分割的像素级度量新范式，可以捕获嵌入空间的全局属性。该方法易于嵌入合并到现有的分割框架中，而不会在测试期间产生任何额外的开销。在知名的分割模型上（DeeplabV3、HRNet和OCR）和backbones（ResNet和HRNet），该方法在多个数据集上实现了性能改进。

首先，论文中提出了一个region memory bank来更好地处理语义分割任务的本质。面对海量高度结构化的像素训练样本，Memory不仅存储像素级嵌入特征，还存储语义区域（即来自同一图像的具有相同语义标签的像素）的池化特征。这引导了像素到区域对比度，作为像素到像素对比度策略的补充。

其次，提出了不同的采样策略，以更好地利用信息样本，让分割模型更加关注那些难以分割的像素。

Contribution：

我们提出了一种用于语义分割的监督式像素对比学习方法。它将当前的图像训练策略提升到图像间、像素到像素的范式。它通过充分利用标记像素之间的“全局”语义相似性来学习结构良好的像素语义嵌入空间。
我们提出了区域存储来更好地探索大规模数据空间并且支持进一步计算像素到区域的对比度。与像素到像素的对比度计算相结合，我们的方法利用了像素之间以及像素和语义区域之间的语义相关性。
我们证明可以提供具有更好示例和锚点采样策略的更强大的分割模型，而不是选择随机像素样本。

无监督对比学习：无监督视觉表征学习旨在学习CNN编码器来讲图像I转换成向量v，使向量v能给更好地描述图像I。对比方法主要基于样本之间的相似性原则，通过从一些负样本中分辨出正样本来进行训练。

监督对比分割：其包含了Pixel-Wise Cross-Entropy Loss、Pixel-to-Pixel Contrast以及Pixel-to-Region Contrast。

Pixel-Wise Cross-Entropy Loss即CE Loss，这种训练目标设计主要受两个限制。1），其独立地惩罚每个像素预测，忽略了像素间的联系；2），由于使用了Softmax，损失仅仅依赖于logits的对数关系，而不能直接监督学习到的特征表示。
Pixel-to-Pixel Contrast：像素级的对比学习方法正规化嵌入空间，并探索训练数据的全局架构。对于锚点anchor i，与其具有相同语义类别的像素为正样本，其他像素属于负样本。按照无监督对比学习的损失InfoNCE对单正样本计算损失，我们对正样本集计算损失。最关键的信息是，正负样本以及锚点像素不被限制在同一个图像中。
Pixel-to-Region Contrast. 保存密集预测下的所有像素采样点，会存储大量的冗余信息并且带来高昂的计算负担。对latest batch保存图像，则限制了图像的多样性。为每个像素类别维护一个Memory queue，即对于每个类别，我们从最近的batch中的每个图像中随机选择V个像素点（一个小数值），并放进队列中。（队列长度为T, T>>V）.这种下采样像素嵌入过于稀疏而无法完全捕获图像内容。因此继续建立了一个region memory bank来存储从图像分割（语义区域）中吸取的更多代表性嵌入。Region Memory存储的特征为CND，C为语义分割任务类别，N为分割数据集的全部训练图片，D为像素潜入的维度；(c,n)对应的元素为D维的特征向量，通过从第n张图片中对应c类别的所有像素潜入执行平均池化，可以以低内存消耗来存储更多的像素特征表示。按照NCE Loss来计算一个anchor pixel，其中对应类别的Region Memory中的嵌入作为正样本，其余类别的Region Memory中的嵌入作为负样本。对于Pixel Memory，存储的特征图size为CTD，其中T为队列长度；故整个Memory M的Size为C*(T+N)*D。
Hard Example Sampling. 除了损失设计和训练样本的数量之外，训练样本的判别能力对于度量学习也至关重要。

本质上而言，施加了额外损失，帮助网络学习更有效的更有辨别力的特征表示，即优化backbone的特征提取能力。

对于整体的结构而言：

FCN用于将图像编码到密集嵌入，ResNet/HRNet
SEG用于将密集潜入映射到预测图，使用主流方法的分割head，DeeplabV3/HRNet/OCR
PROJ用于将高维度像素潜入映射到256唯独的l2正则化的特征向量，来计算对比损失。
Memory Bank

基于Patch的一些操作

t = torch.tensor([[[[1,2,3,4,5,6,7,8],
                    [9,10,11,12,13,14,15,16],
                    [17,18,19,20,21,22,23,24],
                    [25,26,27,28,29,30,31,32],
                    [33,34,35,36,37,38,39,40],
                    [41,42,43,44,45,46,47,48],
                    [49,50,51,52,53,54,55,56],
                    [57,58,59,60,61,62,63,64]]]]).float()
t_total = torch.cat([t,t,t,t], dim=1)
bacth, C, H, W = t_total.size()

t = rearrange(t_total, 'b c (p1 h) (p2 w) -> b (p1 p2 c) h w', h=2, w=2)  # h、w表示切分的
print(t)
t_avg = Avg(t)
print(t_avg)
t = rearrange(t_avg, 'b (p1 p2 c) h w -> b c (p1 h) (p2 w)', p1=H//2, p2=W//2)  # 按区域的通道堆叠
# print(t.shape)
print(t)

你可能感兴趣的:(语义分割,计算机视觉)

OpenCV中添加高斯噪声到彩色图像和点云 LpmShell opencv 人工智能计算机视觉点云
在计算机视觉和图像处理中，噪声是一种常见的现象，可以对图像和点云数据产生不良影响。高斯噪声是一种常见的噪声类型，它具有正态分布的特点。在本文中，我们将使用OpenCV库来添加高斯噪声到彩色图像和点云数据，并提供相应的源代码示例。添加高斯噪声到彩色图像首先，我们将介绍如何使用OpenCV库向彩色图像添加高斯噪声。以下是添加高斯噪声的步骤：步骤1:导入必要的库importnumpyasnpimport
激光线扫标定和相机标定：中高级C++程序员与计算机视觉工程师的指南 m0_57781768 数码相机 c++计算机视觉
激光线扫标定和相机标定：中高级C++程序员与计算机视觉工程师的指南简介在计算机视觉和机器人领域，激光标定和相机标定是实现高精度测量和检测的关键技术。激光线扫标定和相机标定在许多应用中都是必不可少的，如自动驾驶、工业检测、三维重建等。本文将详细介绍激光线扫标定和相机标定的基本概念、实现细节以及常见问题的解决方案。目标读者为中高级C++程序员和计算机视觉工程师，文章将提供详细的技术细节和代码示例，确保
QT 笔记繁缕怀夕 QT 笔记
本文详述了QT的基础应用，其中包括基础控件应用、多线程等工具类使用、以及显示2D、3D图像等功能，适用于C++和计算机视觉领域的开发者。1、基础控件QLineEditQComboBoxQMenuQToolBar2、基础功能2.1、多线程线程QThread2.2、多语言静态显示动态切换3、QChart4、QGraphicsView5、PCL之VTK
python机器学习方安乐 python python 机器学习人工智能
Python机器学习是当前最为热门的机器学习领域之一，其简洁、易用、高效的特点，让越来越多的开发者开始探索其应用。本文将从以下几个方面介绍Python机器学习的基础知识和实践案例，帮助读者更好地理解和应用机器学习技术。前提Python机器学习的应用领域A.图像识别和计算机视觉B.自然语言处理和文本分析C.数据挖掘和推荐系统深度学习A.神经网络的基本原理B.常用的深度学习框架和算法C.深度学习在图像
计算机视觉：卷积核每天五分钟玩转人工智能计算机视觉计算机视觉深度学习人工智能机器学习卷积神经网络
本文重点卷积神经网络（ConvolutionalNeuralNetwork，CNN）是一种深度学习模型，广泛应用于图像识别、自然语言处理、语音识别等领域。在卷积神经网络中，卷积核是网络的核心组件之一。通过不断堆叠卷积层和池化层，可以逐渐提取出更高级别的特征，从而实现更复杂的任务。卷积神经网络中的卷积核可以通过反向传播算法进行训练和优化，使其能够自适应地学习输入数据中的特征。因此，卷积神经网络在图像
4-2 计算机视觉-卷积神经网络-基本网络组件沉睡的小卡比兽 AI基础知识 cnn 卷积核端到端训练计算机视觉卷积神经网络
1、为什么卷积核一般都是奇数？2、由哪些层组成了基本的卷积神经网络，作用分别是什么？3、卷积层和池化层有什么区别？4、什么是端到端学习end-to-end？1、为什么卷积核一般都是奇数？（1）保护位置信息：保证锚点刚好在中间，方便以模块中心为标准进行滑动卷积，避免了位置信息发生偏移（2）padding时的对称性：保证padding时图像的两边依然对齐（3）一些历史尝试的经验，如边缘检测等，还有pa
国内的AI大模型有可能超过ChatGPT吗？ AIWritePaper官方账号 Prompt ChatGPT AIWritePaper chatgpt 人工智能深度学习 AI写作 AIGC
这是一个非常有前瞻性和现实意义的问题。要回答国内AI是否有可能超过ChatGPT，我们需要从多个方面来分析，包括技术基础、数据资源、应用场景、政策支持以及人才储备等。以下是对这一问题的详细探讨：1.技术基础（1）现状国内AI技术：国内的AI技术发展迅速，尤其在深度学习、自然语言处理（NLP）和计算机视觉等领域已经取得了显著进展。例如，百度的文心一言、阿里的通义千问等大语言模型（LLM）已经在技术上
NCNN推理呆呆珝推理框架 c++人工智能
1.前言ncnn是一个高性能的神经网络前向计算框架，专门针对移动设备和嵌入式设备设计。它由腾讯优图实验室开发，旨在提供高效的神经网络推理能力，特别是在资源受限的环境中，如智能手机和嵌入式系统。ncnn被广泛应用于移动端和嵌入式设备上的各种深度学习应用，包括但不限于：图像分类/目标检测/语义分割/人脸识别/图像生成与处理2.NCNN的CMakeLists.txt编写ncnn的头文件，链接文件，静态链
基于深度学习的鸟类识别系统详解（UI界面 + YOLOv10 + 数据集） 2025年数学建模美赛深度学习 ui YOLO 人工智能 python 计算机视觉
引言鸟类识别是计算机视觉领域中一个独具挑战性的任务，尤其是在复杂的自然环境中，识别不同种类的鸟类需要非常强大的模型和丰富的数据集。随着深度学习技术的发展，基于YOLO（YouOnlyLookOnce）系列模型的目标检测系统展现了卓越的性能，特别是在速度和精度上的平衡方面。本博客将详细讲解如何利用YOLOv10模型来构建一个基于深度学习的鸟类识别系统。该系统会结合自定义鸟类数据集，设计一个简洁直观的
想转行到人工智能领域，我该学什么，怎么学？张登杰踩人工智能 python
转行到人工智能（AI）领域需要系统的学习和实践，以下是详细的路径建议，涵盖基础知识、技能学习、项目实践和求职准备：一、明确目标和领域方向人工智能领域广泛，建议先了解细分方向（如机器学习、深度学习、计算机视觉、自然语言处理、强化学习等），结合兴趣和职业规划选择切入点。二、构建基础知识1.数学基础线性代数：矩阵运算、特征值、向量空间。微积分：导数、梯度、优化理论。概率与统计：贝叶斯定理、分布、假设检验
李开复：苹果发布AI应用的未来 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
苹果,AI,应用,未来,深度学习,自然语言处理,计算机视觉1.背景介绍近年来，人工智能（AI）技术取得了飞速发展，并开始渗透到人们生活的方方面面。从智能手机的语音助手到自动驾驶汽车，AI正在改变着我们的世界。作为科技巨头，苹果也积极布局AI领域，并将其融入到其产品和服务中。2017年，苹果发布了其首款AI芯片A11Bionic，并将其应用于iPhoneX等产品。该芯片拥有强大的神经网络处理能力，为
【CV】25.1.7 arxiv更新速递 hinmer arxiv CV每日更新 python 人工智能计算机视觉 chatgpt 目标检测 ai AIGC
—第1篇----关键词:手势识别,计算机视觉,低光照条件,机器学习,RaspberryPi,OpenCV论文链接-摘要:手势识别是一种基于计算机视觉技术的感知用户界面，允许计算机将人类动作解释为命令，使用户无需使用手与计算机交流，从而使鼠标和键盘变得多余。手势识别的主要弱点是光线条件，因为手势控制依赖于摄像头。摄像头用于在2D和3D中解释手势，因此提取的信息可能因光源而异。系统的限制是无法在黑暗环
基于Hough变换与分数阶变分PDE的图像去雨算法实现（附带Matlab源码）心之飞翼算法 matlab 计算机视觉 Matlab
基于Hough变换与分数阶变分PDE的图像去雨算法实现（附带Matlab源码）图像去雨是计算机视觉领域的一个重要问题，它的目标是从雨滴造成的图像中恢复出原始的清晰图像。本文将介绍一种基于Hough变换和分数阶变分PDE（PartialDifferentialEquation）的图像去雨算法，并提供相应的Matlab源代码。算法步骤如下：导入图像首先，我们需要导入包含雨滴的图像。可以使用Matlab
PyTorch深度学习实战（43）——手写文本识别盼小辉丶深度学习 pytorch 人工智能
PyTorch深度学习实战（43）——手写文本识别0.前言1.手写文本识别1.1基本概念1.2输入和输出格式1.3CTC损失值2.模型与数据集分析2.1数据集分析2.2模型分析3.实现手写文本识别模型小结系列链接0.前言手写文本识别，也称为手写文本的光学字符识别(OpticalCharacterRecognition,OCR)，是计算机视觉和自然语言处理中的一项具有挑战性的任务。与印刷文本不同，手
【揭秘】图像算法工程师岗位如何进入？认识祂人工智能算法图像算法工程师
“图像算法工程师，主要专注于开发图像处理和计算机视觉算法，广泛应用于各行业。本文，我们来揭秘一下他们的日常工作，以及如何成为这一领域的专业人才。”01图像算法工程师的日常工作算法设计与开发图像算法工程师的核心任务是设计和开发算法，以解决特定的图像处理或计算机视觉问题。常见的任务包括：图像分类：使用卷积神经网络（CNN）对图像进行分类，常见算法如ResNet、VGG。目标检测：在图像中定位并标注物体
双足机器人开源项目广州深情Yangy_Jiaojiao 机器人
双足机器人（也称为人形机器人或仿人机器人）是一个复杂的领域，涉及机械设计、电子工程、控制理论、计算机视觉等多个学科。对于想要探索或开发双足机器人的开发者来说，有许多开源项目可以提供帮助。这些项目通常包括硬件设计文件、固件代码以及高级软件框架，以实现运动控制、导航、感知等功能。双足机器人开源项目推荐1.OpenHumanoids简介：由GeorgiaTech的AMBER实验室开发的开源双足机器人平台
【机器学习实战入门】使用OpenCV进行性别和年龄检测精通代码大仙数据挖掘深度学习 python 机器学习 python opencv 数据挖掘人工智能
GenderandAgeDetectionPython项目首先，向您介绍用于此高级Python项目的性别和年龄检测中的术语：什么是计算机视觉？计算机视觉是一门让计算机能够像人类一样观察和识别数字图像和视频的学科。它面临的挑战大多源于对生物视觉有限的了解。计算机视觉涉及获取、处理、分析和理解数字图像，旨在从现实世界中提取高维数据，从而生成可用来做决策的符号或数值信息。该过程通常包括物体识别、视频跟踪
机器学习笔记 - 机器学习/深度学习实战案例合集坐望云起深度学习从入门到精通机器学习深度学习人工智能案例应用神经网络
一、简述如何学习机器学习/深度学习，理论和实践都很重要，理论上的内容需要看课程、读教材。但是实践需要自己动手，实践之后自然会对理论有更深入的理解。怎么实践？借用欧阳修《卖油翁》的话”无他，但手熟尔“。就是多看多写多跑。下面创建这个github的目的是为了存放一些图像处理/计算机视觉/机器学习/深度学习的示例代码集合，不定期会添加新的示例，可供参考。GitHub-bashendixie/ml_too
Python自动化运维：一键掌控服务器的高效之道蒙娜丽宁 Python杂谈运维 python 自动化
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在互联网和云计算高速发展的今天，服务器数量的指数增长使得手动运维和管理变得异常繁琐。Python凭借其强大的可读性和丰富的生态系统，成为实现自动化运维的理想语言。本文以“Python自动化运维：编写自动化脚本进行服务器管理”为主题，深入探讨了如何利用Py
基于C++和ONNX Runtime的YOLOv5目标检测实战浪浪山小白兔 c++YOLO 目标检测
1.前言在计算机视觉领域，目标检测是一项关键任务，其应用广泛，涵盖了安防监控、自动驾驶、工业检测等众多领域。YOLOv5作为一种先进的目标检测算法，以其速度快、精度高的特点备受关注。本文将详细介绍如何使用C++结合ONNXRuntime推理引擎来部署YOLOv5模型，实现高效的目标检测。2.ONNX与YOLOv52.1ONNX简介ONNX（OpenNeuralNetworkExchange）是一种
【深度学习基础】线性神经网络 | softmax回归的简洁实现 Francek Chen PyTorch深度学习深度学习神经网络回归 softmax 人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈PyTorch深度学习⌋⌋⌋深度学习(DL,DeepLearning)特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上，结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据
卷积调制空间自注意力SPATIALatt模型详解及代码复现清风AI 深度学习人工智能 python 神经网络 conda
背景与意义SPATIALaTT模型的提出源于对自注意力机制和卷积神经网络（CNN）的深入研究。在计算机视觉领域，CNN长期占据主导地位，而自注意力机制的引入为视觉任务带来了新的思路。SPATIALaTT模型的意义在于融合了这两种强大的特征提取方法，充分发挥了它们的优势。这种融合不仅提高了模型的性能，还为设计更高效的视觉模型提供了新的思路，推动了计算机视觉技术的发展。通过结合自注意力机制和卷积神经网
基于YOLOv5、YOLOv8和YOLOv10的机场安检行李检测：深度学习应用与实现 2025年数学建模美赛 YOLO 深度学习人工智能目标跟踪目标检测
引言随着全球航空运输业的持续增长，机场的安全性变得越来越重要。机场安检作为航空安全的重要组成部分，主要负责对乘客和行李进行检查，防止危险物品进入机场或飞行器。传统的安检方式多依赖人工检查，效率低下且容易出错。因此，基于深度学习的自动化行李检测系统应运而生，通过计算机视觉技术，自动识别和分类行李中的物品，大大提高了安检的效率与准确性。YOLO（YouOnlyLookOnce）系列算法，由于其高效的目
【Python】深入探讨Python中的单例模式：元类与装饰器实现方式分析与代码示例蒙娜丽宁 Python杂谈 python 单例模式开发语言
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界单例模式（SingletonPattern）是一种常见的设计模式，它确保一个类只有一个实例，并提供一个全局访问点。在Python中，实现单例模式的方式多种多样，包括基于装饰器、元类和模块级别的单例实现。本文将详细探讨这些实现方式，并通过大量代码示例进行演
Python从0到100（八十三）：神经网络-使用残差网络RESNET识别手写数字是Dream呀 python 神经网络网络
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
【人工智能】Python实战：构建高效的多任务学习模型蒙娜丽宁 Python杂谈 AI 人工智能 python 学习
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界多任务学习（Multi-taskLearning,MTL）作为机器学习领域中的一种重要方法，通过在单一模型中同时学习多个相关任务，不仅能够提高模型的泛化能力，还能有效利用任务间的共享信息。本文深入探讨了多任务学习的基本概念、优势及其在实际应用中的重要性。
机器视觉在医疗影像分析中的应用：助力放射科医生精准诊断人工智能专属驿站大数据人工智能计算机视觉
在现代医疗领域，影像学检查如X光、CT扫描和MRI等是诊断疾病的重要手段。随着技术的不断发展，机器视觉算法在医疗影像分析中的应用日益广泛，为放射科医生提供了强大的辅助工具，极大地提高了诊断的准确性和效率。本文将探讨机器视觉在医疗影像分析中的具体应用及其对医疗诊断带来的变革。一、机器视觉算法简介机器视觉是一种模拟人类视觉的科学技术，通过图像处理、模式识别和计算机视觉等技术，使计算机能够“看”懂图像中
【计算机视觉】人脸识别油泼辣子多加计算机视觉计算机视觉 opencv 人工智能
一、简介人脸识别是将图像或者视频帧中的人脸与数据库中的人脸进行对比，判断输入人脸是否与数据库中的某一张人脸匹配，即判断输入人脸是谁或者判断输入人脸是否是数据库中的某个人。人脸识别属于1：N的比对，输入人脸身份是1，数据库人脸身份数量为N，一般应用在办公室门禁，疑犯追踪；人脸验证属于1:1的比对，输入人脸身份为1，数据库中为同一人的数据，在安全领域应用比较多。一个完整的人脸识别流程主要包括人脸检测、
Python从0到100（七十三）：Python OpenCV-OpenCV实现手势虚拟拖拽是Dream呀 python opencv 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
ACNet：深度学习中的自适应卷积网络新星郎轶诺
ACNet：深度学习中的自适应卷积网络新星项目地址:https://gitcode.com/gh_mirrors/ac/ACNet在深度学习领域，卷积神经网络（CNN）一直是图像处理和计算机视觉任务的核心技术。然而，传统的固定大小的卷积核无法灵活适应不同区域的信息密度。针对这一问题，ACNet（AdaptiveConvolutionNetwork）项目应运而生，它引入了一种新型的自适应卷积层，旨在
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f