Le0v1n

[语义分割] [PaddlePaddle] PP-LiteSeg（Encoder、Head、Decoder、STDCNet、SPPM、FLD、UAFM、Cityscapes、CamVid）

论文地址：PP-LiteSeg: A Superior Real-Time Semantic Segmentation Model
论文提出时间：2022 年 4 月 6 日
PaddlePaddle官方代码：https://github.com/PaddlePaddle/PaddleSeg
Pytorch 复现实现代码：Coming soon…

1. PP-LiteSeg 概况

PP-LiteSeg 是一种用于实时语义分割任务的轻量级模型，旨在平衡准确性和速度之间的权衡。PP-LiteSeg 提出了一种灵活轻量的解码器（FLD）来减少以前解码器的计算开销。为了加强特征表示，作者提出了一种统一的注意力融合模块（UAFM），它利用空间和通道注意力产生权重，然后将输入特征与权重融合。此外，作者还提出了一个简单的金字塔池化模块（SPPM），以低计算成本聚合全局上下文。以下是 PP-LiteSeg 模型的主要特点和组成部分：

轻量级模型设计： PP-LiteSeg 专注于在保持高准确性的同时降低计算开销。这对于实时应用非常重要，因为实时性要求模型能够在短时间内进行推断。
灵活轻量级解码器（FLD，Flexible and Lightweight Decoder，灵活轻量的解码器）： FLD 是 PP-LiteSeg 的一部分，它被设计用于减少之前解码器的计算负担。通过灵活的结构，FLD 能够在不损失太多性能的情况下减少计算成本。
统一注意力融合模块（UAFM，Unified Attention Fusion Module，统一的注意力融合模块）： UAFM 是用于增强特征表示的关键组件。它利用空间和通道注意力机制，生成权重，并将输入特征与权重融合。这有助于模型更好地捕获关键的语义信息。
简单金字塔池化模块（SPPM，Simple Pyramid Pooling Module，简单的金字塔池化模块）： SPPM 的目标是以较低的计算成本汇集全局上下文信息。这有助于提高模型对于环境背景的感知能力，从而增强分割性能。

通过以上设计，PP-LiteSeg 在准确性和速度方面取得了出色的平衡。在 Cityscapes 数据集的测试中，PP-LiteSeg 在 NVIDIA GTX 1080Ti 上实现了 $72.0\%$ 的 mIoU（ $\ \rm FPS$ ）和 $77.5\%$ mIoU（ $102.6\ \rm FPS$ ）的优越表现。

2. Abstract

Real-world applications have high demands for semantic segmentation methods. Although semantic segmentation has made remarkable leap-forwards with deep learning, the performance of real-time methods is not satisfactory. In this work, we propose PP-LiteSeg, a novel lightweight model for the real-time semantic segmentation task. Specifically, we present a Flexible and Lightweight Decoder (FLD) to reduce computation overhead of previous decoder. To strengthen feature representations, we propose a Unified Attention Fusion Module (UAFM), which takes advantage of spatial and channel attention to produce a weight and then fuses the input features with the weight. Moreover, a Simple Pyramid Pooling Module (SPPM) is proposed to aggregate global context with low computation cost. Extensive evaluations demonstrate that PP-LiteSeg achieves a superior trade-off between accuracy and speed compared to other methods. On the Cityscapes test set, PP-LiteSeg achieves 72.0% mIoU/273.6 FPS and 77.5% mIoU/102.6 FPS on NVIDIA GTX 1080Ti. Source code and models are available at PaddleSeg: this https URL.

实际世界（Real-world）的应用对于语义分割方法有着较高的要求。尽管深度学习在语义分割方面取得了显著的进展，但实时方法的性能仍然不尽如人意。在这项工作中，我们提出了一种新颖的轻量级模型，名为 PP-LiteSeg，用于实时语义分割任务。具体而言，我们提出了一种灵活轻量级解码器（Flexible and Lightweight Decoder，FLD），以减少先前解码器的计算开销。为了加强特征表示，我们提出了一种统一的注意力融合模块（Unified Attention Fusion Module，UAFM），它利用空间和通道注意力（Spatial and Channel Attention）产生权重，然后将输入特征与权重进行融合。此外，我们还提出了一种简单的金字塔池化模块（Simple Pyramid Pooling Module，SPPM），以较低的计算成本聚合全局上下文。广泛的评估表明，PP-LiteSeg 在准确性和速度之间实现了卓越的权衡。在 Cityscapes 测试集上，PP-LiteSeg 实现了 72.0% 的 mIoU（273.6 FPS）和 77.5% 的 mIoU（102.6 FPS）在 NVIDIA GTX 1080Ti 上。源代码和模型可在 PaddleSeg 上获得。

PP-LiteSeg 解决的痛点问题就是：目前语义分割模型在 mIoU 和推理速度很难达到一个 tradeoff，于是提出 PP-LiteSeg 以达到在良好 mIoU 下模型可以有优秀的速度表现 —— 整体思想和 Mobilenet v3 很像。

3. 网络架构

在语义分割领域，通常采用的是基于深度学习的神经网络模型来实现。这些模型包括了 Encoder、Decoder 以及 Segmentation Head 这些组件，它们各自有着不同的作用，用于将输入图像转换为像素级的语义分割结果。

图2：架构概述
PP-LiteSeg 包括三个模块：编码器（Encoder）、聚合（Aggregation）和解码器（Decoder）

一般而言，Encoder → Decoder 没有聚合的，所以这里我们不进行详细介绍。

Encoder（编码器）：编码器是一个 CNN 的 Backbone，用于从输入图像中提取高级语义特征。它通过一系列卷积层、池化层和激活函数来逐渐减小图像的空间维度 $[H, W]$ ，并且增强图像中的语义信息（直观体现就是特征图通道数上升）。编码器的任务是将原始图像转换为具有丰富语义信息的低分辨率特征图，这些特征图包含了图像中的物体、纹理和结构等信息。
Decoder（解码器）：解码器是与编码器相对应的部分，它负责将编码器产生的低分辨率特征图恢复到原始图像的分辨率，并进行像素级的分类。解码器通常包括上采样层（如反卷积或插值操作）和卷积层，用于逐步恢复特征图的细节，并生成与输入图像大小相同的特征图。解码器的任务是将编码器提取的语义特征映射到像素级别，以便对每个像素进行分类（Decoder 本身不会对像素进行分类，而是通过一个分割头来实现）。
Segmentation Head（分割头）：是一个全连接层或卷积层，用于将 Decoder 输出的特征图转换为最终的分割结果（将对每一个像素进行分类）。Segmentation Head 的作用是将 Decoder 输出的特征图转换为像素级别的预测结果。

综上所述，在语义分割领域中：

编码器（Encoder）用于提取输入图像的语义信息
解码器（Decoder）用于将语义信息映射回像素级别
分割头（Segmentation）用于最终的像素级别语义分割预测（对每个像素进行最后的分类）

这些组件的协同工作使得深度学习模型能够在像素级别准确地分割出图像中的不同语义区域。接下来我们就对 Encoder 和 Decoder 进行介绍。

3.1 【Encoder】STDCNet：更强大的 Backbone

PP-LiteSeg 使用 STDCNet 作为 Backbone。STDCNet 主要有以下优点：

STDCNet 网络是一种轻量级的卷积神经网络，具有较低的参数量和计算量。它采用了一种名为STDC（Spatial-Temporal Depthwise Convolution）的新型卷积操作，可以有效地提取空间和时间信息，从而提高特征表示能力。
STDCNet 网络在编码器中使用了多尺度特征融合技术，可以增强编码器对于图像中不同尺度的语义信息的感知能力，提高分割精度。

STDCNet 共有 5 个阶段，每个阶段的步长为 2，因此最终的特征大小是输入图像的 1/32（进行了 32 倍下采样）。基于 STDCNet，作者提出了两种规格的 PP-LiteSeg 网络，如下表所示。

表1：不同规格 PP-LiteSeg 的详细信息

正如表 1 所示，PP-LiteSeg-T 和 PP-LiteSeg-B 的编码器分别是 STDC1 和 STDC2。PP-LiteSeg-B 实现了更高的分割准确性，而 PP-LiteSeg-T 的推断速度更快。

3.2 【Aggregation】SPPM（简单金字塔池化模块，Simple Pyramid Pooling Module）

3.2.1 SPP 和 PPM 的作用

Encoder 使用 STDCNet 作为 Backbone，对输入图片进行一系列的特征和高级语义提取，之后需要将 Encoder 的输出特征图送入 Decoder 中，在这个过程中，一般会经过一个 MMP 模块（和我们之前讲的 ASPP 作用类似），PPM 主要用于捕获不同尺度上的语义信息，并增强模型对物体在不同尺度下的感知能力，具体作用如下：

多尺度特征融合：在语义分割任务中，不同尺度上的语义信息都是重要的，因为物体的大小和形状可能在图像中有所变化。PPM 通过金字塔池化操作，在不同尺度上对特征图进行池化，然后将池化后的特征进行拼接或融合，从而获得了多尺度的语义信息。这有助于模型更好地理解和分割图像中的不同尺度物体。
增强感受野：PPM 的金字塔池化操作能够有效地扩大神经网络的感受野，使模型能够更好地捕捉图像中的全局和局部信息。通过在不同层级上应用不同大小的池化核，PPM 能够在不丧失分辨率的情况下捕获更广泛的语义信息。
提升分割性能：PPM 可以在解码器的输出特征图上应用，从而为分割任务提供更多的上下文信息。这有助于模型更准确地将像素分类为不同的语义类别，从而提高分割的精度和泛化能力。

Q：SPP 和 PPM 是一样的吗？
A：SPP（Spatial Pyramid Pooling）和 PPM（Pyramid Pooling Module）在一定程度上是类似的概念，它们都涉及到对特征图进行金字塔状的池化操作，以捕捉不同尺度上的语义信息。然而，它们在具体实现和应用上存在一些差异。
SPP 是最早提出的概念，主要应用于图像分类和物体检测任务。它通过对特征图在不同尺度上进行池化，生成固定长度的特征向量，以适应不同尺寸的输入图像。
PPM 则是在语义分割任务中被引入的，它也采用了类似的金字塔池化策略，但通常更加注重不同尺度的语义信息的融合。PPM 在解码器部分对特征图进行金字塔池化，然后将池化后的特征进行拼接或融合，以获得更全面的语义信息。
因此，虽然 SPP 和 PPM 在某种程度上具有相似的思想，但它们的具体设计和应用上存在差异，SPP 更早用于图像分类和物体检测，而 PPM 则更加针对语义分割任务中的特定需求。

作者基于 PPM（Pyramid Pooling Module）提出了一个更加简单的 PPM，即 SPPM（Simple Pyramid Pooling Module，SPPM）。如下图所示。

3.2.2 SPPM 运行流程

利用金字塔池化模块来融合输入特征：金字塔池化模块包含三个全局平均池化（AvgPool）操作，对应的池化核大小分别为 $1\times 1$ 、 $2\times 2$ 和 $4\times 4$ 。
输出特征经过 $\times 1$ 卷积和上采样操作：卷积操作使用 $1\times 1$ 的卷积核，输出通道数少于输入通道数（输出特征图的通道减少）。
将这些上采样特征相加，并应用 $\times 3$ 卷积操作生成精细特征。

相对于原始的金字塔池化模块（PPM），SPPM 减少了中间和输出通道，去除了原有的拼接操作 concat，而是使用了逐元素相加 $\oplus$ 的操作。这个改变旨在降低模型的计算复杂性，使得 SPPM 更加高效，并且适用于实时模型。

3.2.3 SPPM 相比原始 SPP 的优点

SPPM相比原始的SPP（Spatial Pyramid Pooling，空间金字塔池化）有以下优点：

SPPM 只使用了两种不同尺度的池化操作，分别是平均池化（Average Pooling）和最大池化（Max Pooling），而 SPP 使用了多种不同尺度的池化操作（和之前学习的 ASPP模块是一样的），例如 $1\times 1$ 、 $2\times 2$ 、 $3\times 3$ 、 $6\times 6$ 等。这样可以减少池化操作的数量和复杂度，降低计算开销。
SPPM 将两种不同尺度的池化结果拼接在一起，形成一个多尺度的特征图，而 SPP 将多种不同尺度的池化结果连接在一起，形成一个长向量。这样可以保留更多的空间信息，提高特征表示能力。
SPPM 在拼接后的特征图上使用了一个 $1\times 1$ 卷积层和一个激活函数，以减少特征图的通道数，并增加非线性变换。这样可以进一步降低计算量，并提高特征表达能力。而 SPP 有使用这样的操作，直接将长向量作为输出。

3.3 【Decoder】FLD（Flexible and Lightweight Decoder，灵活轻量级解码器）

3.3.1 FLD 设计思想

在语义分割模型中，编码器（Encoder）提取层次化特征，而解码器（Decoder）则融合和上采样特征。对于编码器中从低层到高层的特征，通道数 $[C]$ 增加，空间大小 $[H, W]$ 减小，这是一种高效的设计。

网络一般也都是这么设计的，目的是为了减少运算量，提高模型的高级语义信息的提取能力

在一般的语义分割网络中，Decoder 中从高层到低层的特征，空间大小 $[H, W]$ 增加，而通道数 $[C]$ 在最近的模型中保持不变，但是这样会导致一个问题。特征图在 Decoder 中的 $[H, W]$ 在增加，而 $[C]$ 不变，网络的计算开销太大了。

于是，作者提出了 FLD（Flexible and Lightweight Decoder，灵活轻量级解码器），主要作用是在 Decoder 运行过程中，在逐渐增加特征图的空间大小 $[H, W]$ 的同时，逐渐减少特征的通道数。这种设计平衡了 Encoder 和 Decoder 的计算复杂性，使整体模型更加高效。FLD 架构如下图所示。

3.3.2 FLD 的优缺点

FLD（Flexible and Lightweight Decoder）相比传统的 Encoder-Decoder 结构的优缺点如下：

【优点】FLD 可以逐渐减少解码器中的通道数量，增加特征图的空间大小，从而减少解码器的冗余性，并平衡编码器和解码器的计算成本。
【缺点】这种结构可能会降低分割精度，因为解码器中的特征图通道数较低，可能会丢失一些高级语义信息。此外，FLD 需要更多的超参数调整和实验验证，以找到最佳的结构和参数组合。

3.4 【Decoder】UAFM（统一注意力融合模块，Unified Attention Fusion Module）

之前不管是学习 FCN 还是 DeepLab 系列模型，我们都知道一个道理 —— 融合多级特征对于实现高分割准确性是至关重要的。

作者基于此提出了一个统一注意力融合模块 (UAFM)，它利用空间和通道注意力机制（两种注意力机制），生成一个权重矩阵 $\alpha$ ，并将输入特征与权重矩阵相乘，得到融合后的特征。这样可以使模型更好地捕获图像中的关键语义信息，提高分割精度。UAFM 如下图所示。

如上图所示，UAFM 利用注意力模块生成权重 $\alpha$ ，并通过 Mul 和 Add 操作将输入特征与 $\alpha$ 融合。具体而言，输入特征被表示为 $F_{high}$ 和 $F_{low}$ 。 $F_{high}$ 是深层模块的输出， $F_{low}$ 是来自编码器的对应部分。需要注意的是，它们具有相同的通道数。

注意：

注意力模块可以是空间注意力或者是通道注意力，看具体任务要求定（作者在实验的时候使用的是空间注意力，说是为了提高模型运行速度）。

之前的低级语义信息的特征图和高级语义信息的特征图融合可能就是直接 $\oplus$ ，这样非常粗暴，作者就想改善这个过程，因此就在 $\oplus$ 之前添加了一个注意力模块，让注意力模块可以计算出两个特征图的权重，之后再相加后就比直接 $\oplus$ 效果好了。

UAFM 首先使用双线性插值操作将 $F_{high}$ 上采样到与 $F_{low}$ 相同的大小，上采样后的特征表示为 $F_{up}$ 。然后，注意力模块将 $F_{up}$ 和 $F_{low}$ 作为输入，生成权重 $\alpha$ 。之后，为了获得注意力加权特征，我们分别对 $F_{up}$ 和 $F_{low}$ 进行逐元素乘法操作 $\otimes$ 。最后，UAFM 对注意力加权特征进行逐元素加法操作 $\oplus$ ，输出融合特征。我们可以将上述过程表示为公式 1。

$\begin{aligned} F_{up} & = \mathrm{Upsample}(F_{high})\\ & \alpha=\mathrm{Attention}(F_{up}, F_{high})\\ F_{out} & = \alpha \cdot F_{up} + (1 - \alpha) \cdot F_{low} \tag{1} \end{aligned}$

3.4.1 空间注意力模块

空间注意力模块的动机是利用像素之间的空间关系产生一个权重，该权重表示输入特征中每个像素的重要性，如图4 (a) 所示。

图 4：(a) 空间注意力模块

给定输入特征，即 $F_{up} \in \mathbb{R}^{C\times H\times W}$ 和 $F_{low} \in \mathbb{R}^{C\times H\times W}$ ，我们首先沿着通道轴执行均值（Mean）和最大（Max）操作，生成四个特征，其维度为 $\mathbb{R}^{1\times H\times W}$ 。然后，这四个特征被连接成一个特征 $F_{cat} \in \mathbb{R}^{4\times H\times W}$ 。对于连接的特征，我们应用卷积（Conv）和 Sigmoid 操作，输出 $\alpha \in \mathbb{R}^{1\times H\times W}$ 。空间注意力模块的公式表示如公式 2 所示。

$\begin{aligned} F_{cat} & = \mathrm{Concat}[\mathrm{Mean}(F_{up}), \mathrm{Max}(F_{up}), \mathrm{Mean}(F_{low}), \mathrm{Max}(F_{low})]\\ & \alpha=\mathrm{Sigmoid}(\mathrm{Conv}(F_{cat})) \tag{2} \end{aligned}$

3.4.2 通道注意力模块

通道注意力模块的关键是利用通道之间的关系生成权重，该权重指示了输入特征中每个通道的重要性，如图 4 (b) 所示。

图 4：(b) 通道注意力模块

通道注意力模块首先利用平均池化（AvgPool）和最大池化（MaxPool）操作来压缩输入特征的空间维度。这个过程生成了维度为 $\mathbb{R}^{C\times 1\times 1}$ 的四个特征。然后，将这四个特征沿着通道轴进行连接，然后执行卷积（Conv）和 Sigmoid 操作来产生一个权重 $\alpha \in \mathbb{R}^{C\times 1\times 1}$ 。简而言之，通道注意力模块的过程可以表示为公式 3。

$\begin{aligned} F_{cat} & = \mathrm{Concat}[\mathrm{AvgPool}(F_{up}), \mathrm{MaxPool}(F_{up}), \mathrm{AvgPool}(F_{low}), \mathrm{MaxPool}(F_{low})]\\ & \alpha=\mathrm{Sigmoid}(\mathrm{Conv}(F_{cat})) \tag{3} \end{aligned}$

3.5 PP-LiteSeg 整体框架

前 4 小节中对 PP-LiteSeg 中的核心组件进行了介绍，那么 PP-LiteSeg 的基本原理我们已经明白了，下面看一下 PP-LiteSeg 的整体框架。

主要注意的点：

因为 PP-LiteSeg 使用了 STDCNet 作为 Backbone，因此作者在训练的时候使用了该模型的预训练权重，从而实现加速训练的效果（预训练模型非常重要，我们一般都是会用的，使用前后准确率相差很大，可以参考我之前做的实验 → FCN代码及效果展示）。
FLD 包含两个 UAFM 和一个分割头。为了提高运行效率，UAFM 中只采用了空间注意力模块。最后一个 UAFM 会对输入进行 8 倍下采样。
Segmentation Head 会先执行 Conv-BN-ReLU 操作将进行了 8 倍通道（Channel）下采样的特征的通道数减少到类别数（num_classes）。接下来进行上采样操作，将特征大小扩展到输入图像大小，并进行 argmax 操作预测每个像素的标签。
采用了带有在线难例挖掘的交叉熵（The cross entropy loss with Online Hard Example Mining）作为损失函数来进行模型参数优化

在线难例挖掘的交叉熵损失（The cross entropy loss with Online Hard Example Mining）是一种训练深度学习模型的损失函数，在处理具有类别不平衡或者难以分类的样本时特别有效。它结合了交叉熵损失和难例挖掘的思想。
交叉熵损失通常用于分类问题中，用于衡量模型预测的类别分布与真实标签的分布之间的差异。然而，当存在类别不平衡或一些样本难以分类时，普通的交叉熵损失可能会导致模型过于关注容易分类的样本，而忽略了那些难以分类的样本。
在线难例挖掘的交叉熵损失通过选择一些难以分类的样本，将它们的损失权重增加，从而强制模型更多地关注这些难例。具体做法是在每个训练批次中，计算损失后对样本进行排序，然后选择一定数量的难例样本（如前一部分或一定百分比的样本），并为它们分配更高的损失权重。这样可以促使模型更好地适应那些难以分类的情况，提高整体性能。
总之，在线难例挖掘的交叉熵损失是一种用于处理难例和类别不平衡的训练策略，有助于提升模型在困难样本上的表现。

4. 实验部分

因为 PP-LiteSeg 主打的就是一个速度和 meanIoU 的 trade-off，因此作者在实验部分在准确性和推断速度方面与其他 SOTA 的实时（Real-Time）方法进行实验结果的比较。

4.1 数据集介绍

论文使用了两个数据集，分别是 Cityscapes 和 CamVid 数据集，下面我们对这两者数据集进行简单地介绍。

当然，我很乐意为您介绍Cityscapes和CamVid数据集。

4.1.1 Cityscapes 数据集

Cityscapes 数据集是一个用于计算机视觉任务的大规模城市场景分割数据集。它主要用于分割任务，即将图像中的每个像素分配到特定的语义类别，如道路、建筑物、行人等。以下是有关 Cityscapes 数据集的一些关键信息：

图像数量： 数据集包含来自德国和其他欧洲城市的大约 5000 张高分辨率图像。
类别数量： 数据集中共有30个不同的语义类别，包括道路、建筑物、车辆、行人等。
图像分辨率： 图像分辨率较高，通常为 $1024\times 2048$ 像素。
标签信息： 每个像素都被标记为特定的语义类别，用于训练和评估分割模型。

4.1.2 CamVid 数据集

CamVid 数据集是另一个常用于语义分割任务的数据集，它也包含城市场景图像及其像素级标签。以下是关于CamVid数据集的一些要点：

图像数量： CamVid 数据集包含 701 张图像，这些图像也来自城市环境。
类别数量： 数据集涵盖了 11 个不同的语义类别，包括道路、行人、车辆等。
图像分辨率： 图像分辨率通常为 $960 \times 720$ 像素。
标签信息： 同样地，每个像素都被标记为其对应的语义类别。

虽然 CamVid 数据集规模较小，但它仍然在语义分割算法的开发和评估中具有一定的价值。由于其规模较小，它常常被用作一种小型的基准数据集，用于快速验证分割模型的性能。

4.2 训练设置

Item	通用配置 1	通用配置 2	Cityscapes	CamVid
SGD 优化器	`momentum=0.9`	`lr=poly(lr)`	`weight_decay=5e-4`	`weight_decay=1e-4`
预测策略	warm-up
Batch size			`16`	`24`
Iterations			`160,000`	`1,000`
初始学习率			`0.005`	`0.01`

随机缩放			$[0.125, 1.5]$	$[0.5, 2.5]$
Crop size			$1024 \times 512$	$960 \times 720$
服务器	NVIDIA Tesla V100
平台	PaddlePaddle v1
模型代码	PaddleSeg2

Q：为什么 PaddleSeg 不采用设置 epoch 的方式？
A：设置 epoch 的方式会受数据集大小的影响。因此PaddleSeg 按照 iters 进行设置。

数据集大小： $N$
批量大小： $\mathrm{batch_size}$
GPU数量： $\rm num_gpus$
总迭代次数： $\rm iters$

则有： $\rm epoch = \frac{iters * batch\_size \times num\_gpus}{N}$

4.3 推理设置

Item	通用配置 1	通用配置 2	Cityscapes	CamVid
推理模型格式	ONNX	TensorRT
推理时间			Crop( $1024 \times 512$ & $1536 \times 768$ ) → Infer → Resize(原图大小)	Crop( $960 \times 720$ ) → Infer
推理 GPU	NVIDIA 1080Ti
环境配置	CUDA 10.2 + CUDNN 7.6	TensorRT 7.1.3
推理耗时单位	FPS
准确性单位	mean IoU

为了进行公平比较，将 PP-LiteSeg 导出为 ONNX 格式，并利用 TensorRT 执行模型。与其他方法类似，首先将 Cityscapes 数据集中的图像缩放到 $1024 \times 512$ 和 $1536 \times 768$ ，然后推断模型将缩放后的图像作为输入，生成预测图像，最后将预测图像重新调整到原始输入图像的大小。这三个步骤的耗时被计算为推断时间。对于 CamVid 数据集，推断模型以原始图像作为输入，分辨率为 $960 \times 720$ 。在 NVIDIA 1080Ti GPU 上使用 CUDA 10.2、CUDNN 7.6 和 TensorRT 7.1.3 进行所有推断实验。使用标准的平均交并比（mIoU）进行分割准确性比较，使用帧率（FPS）进行推断速度比较。

4.4 Cityscapes 数据集的结果

4.4.1 与 SOTA 方法对比

在上述的训练和推断设置下，我们在 Cityscapes 数据集上将提出的 PP-LiteSeg 与之前的 SOTA 实时模型进行了比较。为了公平比较，我们在两个不同分辨率下评估了 PP-LiteSeg-T 和 PP-LiteSeg-B，即 $512 \times 1024$ 和 $768 \times 1536$ 。表 2 展示了各种方法的模型信息、输入分辨率、mIoU 和 FPS。图 1 提供了分割准确性和推断速度的直观比较。

表 2：在 Cityscapes 数据集上与 SOTA 实时方法的比较

从表 2 中可以看到， PP-LiteSeg-B2 在 Cityscapes 验证集和测试集有最高的 mIoU，且速度处于中等位置，因为 B2 模型本身比较大，所以取得了良好的准确率，但在速度上没有达到一个非常好的 tradeoff；PP-LiteSeg-T1 是最小的模型，有最快的速度，且 mIoU 相对处于中等的位置，因此整体表现不错。

说实话，从一堆数据中找到规律其实是不直观的，我们可以看一下下面这个图，可以直观地感受到 PP-LiteSeg 在 mIoU 和速度上的优势。

图1：在 Cityscapes 测试集上分割准确性（mIoU）和推理速度（FPS）的比较

结合两张图我们可以看到，PP-LiteSeg 在准确性和速度之间达到了 SOTA 的平衡。具体来说，我们可以看到 PP-LiteSeg-T1 实现了 273.6 FPS 和 72.0% 的 mIoU，这意味着最快的推断速度和具有竞争力的准确性。在分辨率为 $768 \times 1536$ 的情况下，PP-LiteSeg-B2 在验证集上获得了最佳准确性，即 78.2% 的 mIoU，测试集上为 77.5% 的 mIoU。此外，与 STDC-Seg 使用相同的编码器和输入分辨率相比，PP-LiteSeg 表现得更好。

4.4.2 消融实验

作者也进行了消融实验来证明提出的模块的有效性。实验选择了 PP-LiteSeg-B2 模型（mIoU 最高的模型），并采用了相同的训练和推断设置。Baseline Model 是没有使用提出的模块的 PP-LiteSeg-B2，其中解码器中的特征通道数为 96，并且融合方法是逐元素相加 $\oplus$ 。表格 3 展示了消融实验的定量结果。

表 3：在 Cityscapes 验证集上对我们提出的模块进行的消融实验
Baseline Model 是没有使用提出的模块的 PP-LiteSeg-B2

可以看到，在 PP-LiteSeg-B2 模型中，引入 FLD 模块将 mIoU 提升了 0.17%。引入 SPPM 和 UAFM 也提高了分割准确性，尽管推断速度稍微降低。基于三个提出的模块，PP-LiteSeg-B2 在 102.6 FPS 的情况下实现了 78.21 的 mIoU。与 Baseline 模型相比，mIoU 提高了 0.71%。图 6 提供了定性比较。

图 6：在 Cityscapes 验证集上的定性比较
(a)-(e) 分别代表Baseline、Baseline + FLD、Baseline + FLD + SPPM、Baseline + FLD + UAFM 和
Baseline + FLD + SPPM + UAFM 的预测图像，(f) 代表真实标签

从上图可以观察到，随着逐个添加 FLD、SPPM 和 UAFM，预测图像与真实标签之间的一致性更加明显。总之，我们提出的模块对于语义分割是有效的。

4.5 CamVid 数据集的结果

为了进一步展示 PP-LiteSeg 的能力，作者还在 CamVid 数据集上进行了实验。与其他工作类似，训练和推断的输入分辨率为 $960 \times 720$ 。

表 4：在 CamVid 测试集上与最先进的实时方法的比较
所有方法的输入分辨率为 960×720

如表 4 所示，PP-LiteSeg-T 实现了 222.3 FPS 的速度，比其他方法快了 12.5% 以上。PP-LiteSeg-B 实现了最佳的准确率，即 75.0% 的 mIoU，速度为 154.8 FPS。总体来说，比较结果显示 PP-LiteSeg 在 CamVid 数据集上在准确率和速度之间达到了最佳平衡。

5. 总结

作者针对实时语义分割（Real-Time Semantic Segmentation）设计了一种新颖的网络 PP-LiteSeg，并提出一系列 tricks：

提出了 FLD（灵活轻量级解码器）：提高以前解码器的效率。
提出了 UAFM （统一的注意力融合模块）：使用注意力模块增强浅层和深层特征图的融合效果
提出了 SPPM（简单的金字塔池化模块）：相比 PPM，以较低计算成本聚合全局上下文。

基于上面这些新颖的模块，作者提出了 PP-LiteSeg 语义分割模型。在 Cityscapes 和 CamVid 数据集上大量的实验结果表明，PP-LiteSeg 在分割准确性和推理速度之间取得了最先进的平衡（trade-off）。

你可能感兴趣的:(语义分割（Semantic,Segmentation）,PaddlePaddle,深度学习（Deep,Learning）,paddlepaddle,人工智能)

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
不同行业的 AI 数据安全与合规实践：7 大核心要点全解析观熵人工智能 DeepSeek 私有化部署
不同行业的AI数据安全与合规实践：7大核心要点全解析关键词AI数据安全、行业合规、私有化部署、数据分类分级、国产大模型、隐私保护、DeepSeek部署摘要随着国产大模型在金融、医疗、政务、教育等关键领域的深入部署，AI系统对数据安全与行业合规提出了更高要求。本文结合DeepSeek私有化部署实战，系统梳理当前各行业主流的数据安全合规标准与落地策略，从数据分类分级、访问控制、审计追踪到敏感信息识别与
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
AI MCP教程之什么是 MCP？利用本地 LLM 、MCP、DeepSeek 集成构建您自己的 AI 驱动工具知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 mcp deepseek
介绍利用模型上下文协议(MCP)的工具吸引了我们的注意力—将AI变成触手可及的生产力引擎。它们巧妙、高效，让人难以抗拒。但如果您可以将这样的功能添加到自己的工具中，会怎么样呢？在本指南中，我将引导您构建一个具有本地运行的大型语言模型(LLM)和MCP集成的AI工具-让您以类似的方式自动执行利用MCP的工具您喜欢的任务。推荐文章《AnythingLLM教程系列之12AnythingLLM上的Olla
使用 Ollama 、 DeepSeek和QWEN的模型上下文协议 (MCP) ，使用本地 LLM 教程的 MCP 服务器知识大胖 NVIDIA GPU和大语言模型开发教程服务器运维人工智能 qwen2vl deepseek
简介模型上下文协议：MCP服务器据称是AI领域的下一个重大改变者，它将使AI代理变得比我们想象的更加先进。MCP或模型上下文协议由Anthropic去年发布，它可以帮助LLM连接软件并对其进行控制。但有一个问题大多数MCP服务器都与ClaudeAI兼容，尤其是ClaudeAI桌面应用程序，但它们有自己的限制。有没有办法我们可以使用本地LLM运行MCP服务器？是的，在这个特定的逐步详细教程中，我们将
12 个强大的 DeepSeek AI 提示将彻底改变您的日常生活知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
内容写作的最佳提示让我们从写作开始吧。无论您是博主、学生还是社交媒体创作者，这些提示都将帮助您创作出精彩的内容。提示1：“扮演专业文案撰稿人，为[产品/服务]撰写引人注目的广告文案。文案应引人入胜、具有说服力，且字数不得超过100个字。”这使得ChatGPT的响应结构就像真实的广告文案一样。提示2：“以更具吸引力和说服力的方式重写此段落，同时保持含义不变：[插入文本]。”推荐文章《Neo4j上使用
使用 Deepseek Zero Coding Experience 创建类似飞扬的小鸟游戏知识大胖 NVIDIA GPU和大语言模型开发教程游戏 deepseek ollama janus pro
简介Flappybird在苹果商店推出后，每天大约能赚5000美元，但后来被苹果故意下架。现在我正尝试使用Deepseek制作这样一款游戏。技术在不断变化，编码知识也在不断变化，只需修改代码即可获得结果。让我们在Deepseek上试试这款游戏：推荐文章《如何在本地电脑上安装和使用DeepSeekR-1》权重1，DeepSeek《Nvidia系列之使用NVIDIAIsaacSim和ROS2的命令行控
24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
使用 DeepSeek R1 和 Ollama 开发 RAG 系统使用 DeepSeek R1 和 Ollama 构建强大的 RAG 系统。了解开发智能 AI 解决方案的设置过程、最佳实践和技巧。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介DeepSeekR1和Ollama提供了用于构建检索增强生成(RAG)系统的强大工具。本指南介绍了使用这些技术开发RAG应用程序的设置、实施和最佳实践。为什么RAG系统会改变游戏规则检索增强生成(RAG)系统结合了搜索和生成AI的优点，可实现精确且准确的情境感知响应。借助DeepSeekR1和Ollama等工具，创建RAG系统不再令人生畏。无论您是构建聊天机器人、知识助手还是AI驱动的搜索引擎
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
【实战AI】macbook M1 本地ollama运行deepseek 东方鲤鱼 chat AI macos ai llama AIGC chatgpt
由于deepseek官网或者Aapi调用会有网络延迟或不响应的情况，故在本地搭建部署；前提条件1.由于需要拉取开源镜像，受网络限制，部分资源在前提中会下载的更快！请自行；2.设备macbookM132G下载ollamaOllama是一款跨平台推理框架客户端（MacOS、Windows、Linux），专为无缝部署大型语言模型（LLM）（如Llama2、Mistral、Llava等）而设计。通过一键式
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
DeepSeek解读道德经第五十九章 cal_ 道德经道德经
一、原文与译文原文：治人事天，莫若啬。夫唯啬，是谓早服；早服谓之重积德；重积德则无不克；无不克则莫知其极；莫知其极，可以有国；有国之母，可以长久。是谓深根固柢，长生久视之道。译文：治理百姓侍奉天道，没有比珍爱能量更重要的。唯有珍惜能量，才叫早作准备；早作准备就是厚积德性；厚积德性则无往不胜；无往不胜则力量无穷；力量无穷便可守护国家；掌握治国根本，方能长久延续。这便是根深柢固、长生久存之道。二、核心
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数