小白学视觉

语义分割大盘点

本篇文章主要是向大家普及下语义分割的一些来龙去脉，同时也是为下篇文章《关于语义分割的亿点思考》做前情铺垫，届时笔者将会对语义分割这个领域进行一个深刻而全面的分析，跟大家唠一唠语义分割这条路还可以怎么走。今天，让我们先重拾初心，看看这些年，语义分割是如何一路走过来的。

什么是图像分割？

首先，考虑下面这张图片：

假设我们有一张图片，我们要解决的问题是图片中出现的是什么？没错，这是一只可爱的小狗狗，我们可以将其表述为图像分类问题。但是，当图像中同时出现两个目标呢？再看下这张图片：

现在我们需要同时在图像中识别多个对象，因此我们的问题会相应地改变，即图像中存在的物体是什么。答案显而易见，是一只狗和一只猫，为此我们可以将其表述为多标签分类问题。

现在，假设我们还关心对象存在的位置，而不仅仅是了解对象是什么应该怎么做？例如下面这张图片：

毫无疑问，这个问题是属于目标检测的范畴。

更进一步的，此时假如我们想了解对象的确切位置信息应该如何解决？换句话说，就是我们不是在对象周围绘制一个粗略的矩形框，而是在对象周围绘制一个多边形，并为该对象的每个像素进行着色，如下图所示：

好了，这便是我们今天要讨论的主角老爸——图像分割。

图像分割是一种根据存在的对象及其语义重要性对图像进行划分的像素级分类预测任务，其致力于为图像中的每一个目标都生成一个像素级别的掩膜，也就是大家耳熟能详的——mask。

本质上来说，图像是人类视觉的基础，是自然景物的客观反映，是人类认识世界和人类本身的重要源泉。“图”是物体反射或透射光的分布，“像“是人的视觉系统所接受的图在人脑中所形成的印象或认识，照片、绘画、剪贴画、地图、书法作品、手写汉字、传真、卫星云图、影视画面、X光片、脑电图、心电图等都是图像。而在计算机中，图像是一个多维矩阵，矩阵中的每一个数字表示画面中的一个像素。换言之，一张图像就是一个包含许多像素的集合。

对于计算机视觉领域来说，图像分割指的是将数字图像细分为多个图像子区域或称为超像素的过程。图像分割的目的是简化或改变图像的表示形式，使得图像更容易理解和分析。图像分割通常用于定位图像中的物体和边界（线，曲线等），是对图像中的每个像素加标签的一个过程，这一过程使得具有相同标签的像素具有某种共同视觉特性。

图像分割有什么用？

或许很多人心中都有一个疑问，那便是我们是否需要如此精心的预测一张图像中的目标？其实，对于绝大数CV应用场景来说，仅依赖目标检测是可以解决的。但是，这并不意味图像分割就没有存在的意义。举个简单的例子，比如癌症，大家都知道这个都是由癌细胞扩散所造成的。通常，癌细胞的形状在确定癌症的严重程度中起着至关重要的作用，这时候图像分割便派上用场了。

除了医学成像任务，图像分割还可以应用在许多领域，例如遥感领域：

借助遥感图像分割技术，我们可以轻松的识别出地面的成分，例如该地区的森林覆盖率或发现采矿甚至森林火灾等活动。再举一个比较使用的应用方向就是人像分割，自疫情爆发以来，钉钉和腾讯会议等线上视频会议软件算是妥妥的积累了一大批用户。而在这些软件中，一个比较常用的功能就是虚拟背景，这背后应用的技术便是人像分割技术：

https://ai.baidu.com/forum/topic/show/892416

最后，我们再介绍一个最近几年比较火的概念——自动驾驶，借此引申出图像分割包含哪些方向：

图像分割在自动驾驶领域中可用于车道线分割或场景解析等。通过精确预测重要物体(例如道路或行人)的位置，自动驾驶系统可以采取适当的步骤来处理下游任务，例如申请休息时间或让汽车减速。

上图展示了图像分割的三种常见任务，即语义分割、实例分割和全景分割。

语义分割

语义分割描述了将每个像素与类标签相关联的过程。很简单，这里我们只关心图像中所有对象的粗略表示。在这里，你可以看到所有以蓝色表示的汽车，以红色表示的行人，以及略带粉红色的街道等。

仔细观察可以发现，属于同一类的所有目标之间并没有明显的区别，这意味着所有的车都是蓝色的。这是定义图像分割问题的最简单方法。不同类的物体产生不同的语义，而语义分割就是要将这些属于不同类别的像素进行归类，把属于同一类的像素归为一起。

实例分割

现在，如果你想更进一步以不同的方式表示类的每个实例，这个问题称为实例分割。

与语义分割不同，在图像分割中，我们独立地屏蔽图像中包含的对象的每个实例。所以这意味着，我们将首先关注重要的对象，然后分别识别对象的每个实例。而对于实例分割任务来说，你可以看到图像中的所有对象汽车和人都被突出显示，并且所有目标都被赋予不同的颜色以示区别。

全景分割

当我们把语义分割和实例分割结合起来看时，便会得到一种新的任务——全景分割。这是近几年挖的一个新坑，全景分割致力于将图像中的每个像素与分类的语义标签相关联，并识别特定类的实例。

好了，简单介绍到这里，本文将重点围绕语义分割进行介绍，接下来让我们看看它是如何一路磕磕绊绊地走过来。

历史演变

传统图像分割

图像分割最初是从数字图像处理加上优化算法开始的。这些原始算法使用区域生长等方法，在这些方法中设置初始区域，然后算法比较像素值以获得分割图的概念。

这些方法起初是对图像中的特征进行局部观察，并关注像素中的局部差异和梯度。对输入图像进行全局扫描的算法出现得晚得多，在经典图像处理方法中提出了自适应阈值化、Otsu 算法和聚类算法等方法。

https://www.v7labs.com/blog/what-is-computer-vision

基于阈值的分割

阈值化是最简单的图像分割方法之一，其中设置阈值以将像素分为两类。值大于阈值的像素设置为 1，而值小于阈值的像素设置为 0。

对应的图像我们称之为二值图，而这个过程便是二值化。图像阈值化在两个目标类之间的像素值差异非常大的情况下非常有用，通常选择平均值作为阈值。

<<< 左右滑动见更多 >>>

阈值分割通常用于图像二值化，可应用于轮廓检测和识别等任务。

基于阈值分割方法的优点是：

计算简单
效率更高

不过，当图像中灰度值差异不明显或者灰度值出现重叠的情况，它将很难被精确的分割。

基于区域的分割

基于区域的分割算法通过寻找相邻像素之间的相似性并将它们分组在一个公共类别下来工作。

通常，分割过程从一些像素设置为种子像素开始，算法通过检测种子像素的直接边界并将它们分类为相似或不相似来工作。

然后将直接邻居视为种子并重复这些步骤直到整个图像被分割。类似算法的一个例子是用于分割的流行分水岭算法，它从欧几里得距离图的局部最大值开始工作，并在没有两个种子可以归类为属于同一区域或分割图的约束下增长。

边缘检测分割

在具有不同灰度值的两个相邻区域之间总是存在边缘。边缘可以被认为是图像的不连续局部特征。我们可以利用这种不连续性来检测边缘，从而定义出对象的边界。

边缘分割，也称为边缘检测，是检测图像中边缘的任务。

从基于分割的角度来看，我们可以说边缘检测对应于将图像中的哪些像素分类为边缘像素，并相应地将这些边缘像素挑出一个单独的类别。

边缘检测通常是通过使用特殊的过滤器来执行的，这些过滤器在卷积时为我们提供图像的边缘。这些滤波器由专门的算法计算得出，这些算法用于估计空间平面的 x 和 y 坐标中的图像梯度。

使用 Canny 边缘检测算法的边缘检测示例，最流行的边缘检测算法之一如下所示。

基于聚类的分割

依赖于图像处理技术的现代分割算法通常是使用聚类算法进行分割。

聚类，其实就是将具有相似性质的数据点给划分为一组，每一组我们称为一簇。聚类算法的性能优于同类算法，并且可以在短时间内提供相当好的分割效果。像 K-means 聚类算法这样的流行算法是无监督算法，它们通过将具有共同属性的像素聚集在一起作为属于特定片段来工作。

特别是，K 均值聚类考虑了所有像素并将它们分成了多个类。与区域增长方法不同，基于聚类的方法不需要种子点来开始分割。其工作流程如下：

随机的选择一个初始化的k值；
随机将每个数据点分配给k个簇中的任何一个；
计算各个簇之间的中心点；
计算每一个数据点离各个簇中心点的距离；
按照它们之间的距离将这些数据点分配给离它们最近的簇；
重新计算这些簇的中心点；
最后，重复步骤4-6，直到各个聚类中心点不再变化或者达到我们设定的迭代次数。

K-means 适用于数据量比较小的情况。当它应用于大型数据集时，该算法会遇到瓶颈，因为它会在每次迭代时查看所有样本，因此所耗费的时间代价很昂贵。此外，由于K-means是基于距离的算法，因此它仅适用于凸数据集，不适合对非凸集群进行聚类。

现代图像分割

现代图像分割主要经历两个阶段，一个是基于传统机器学习的分割，这一块大概是从2009-2015年期间，伴随着Adaboost、SVM、GMM、C-Means等算法的兴起，许多研究人员将这些方法应用到分割任务中。不过，大部分方法仍然属于是启发式的工作，基本都要依赖人工设计的特征。

另一个阶段便是基于深度学习的图像分割。自从全卷机神经网络(Fully Convolution Network, FCN)这个开创性的工作被提出以来，卷积神经网络(Convolution Neural Network, CNN)在图像分割领域的应用算是正式拉开了序幕。几乎同一时期，另一个代表性的经典工作——U-Net，也随之诞生。

FCN

基于深度学习的分割模型通常会输出一个原图分辨率同等大小的掩码图，这些掩码图通常是 n 通道的，n 是模型的输出类别数。对应到 n 通道中的每一个掩码图本质上都是一张二分类图，存在对象的位置会被填充为 1，而其余区域则由 0 组成，类的索引从0到n-1。

Segment map

下面大致分几个派系带大家快速过一遍，那些年我们一起追过的语义分割网络。（多图预警）

医学图像分割

U-Net

Paper: 《U-Net: Convolutional Networks for Biomedical Image Segmentation》

Accepted by MICCAI 2016.

文章解读：https://www.zhihu.com/question/269914775/answer/586501606

U-Net

U-Net最初是在由 MICCAI 举办的细胞分割挑战比赛中大获全胜，紧接着一路开挂，在场景解析、医学图像分割、显著性检测、遥感图像分割等领域遍地开花，逐渐成为了语义分割领域的新标杆，哪怕今天爆火的 AGI 技术 Diffusion 模型中也应用到了此网络结构。

编码器：用于将输入图像编码为多个不同级别的特征表示，通常由一堆卷积和池化组成；
解码器：用于将编码器学习到的判别性特征(lower-resolution)语义逐步投影至与原始空间分辨率一致的像素空间(higher-resolution)以进行密集预测分类，通常由上采样模块和卷积组成；
长跳跃连接：在网络中进行上采样的同时，将来自编码器网络的更高分辨率的特征图与上采样的特征图拼接(Concat)起来，以便更好地学习后续卷积的表征【FCN 中采用 Add 操作】。由于上采样是一种稀疏操作，因此引入早期阶段的良好先验可以更好地帮助网络定位到目标。

R2U-Net

Paper: 《Recurrent Residual Convolutional Neural Network based on U-Net (R2U-Net) for Medical Image Segmentation》

Arxiv.

文章解读：https://zhuanlan.zhihu.com/p/114471013

R2U-Net是早期将循环卷积结构嵌入到 U-Net 的一个工作，在当时比较火，后面作者本人好像没有投稿，一直挂载 arxiv 上。不过这个网络本身精度也是不高，前几年测了下几乎在大部分医学图像分割任务上均比不过 U-Net，也不失为一个完美的对(当)比(我)方(没)法(说)，这里提一下仅留个纪念，不喜勿喷。

DSN

Paper: 《Deeply-Supervised Nets》

Accepted by PMLR 2015

DSN

深监督网络 DSN 是一种同时最小化分类错误并提高隐藏层学习过程的直接性和透明度的方法。

Attention U-Net

Paper: 《Attention U-Net: Learning Where to Look for the Pancreas》

Accepted by MIDL 2018.

文章解读：https://zhuanlan.zhihu.com/p/114471013

Attention U-Net

Attention U-Net 提出了一种应用于医学影像的基于门控注意力 attention gate 的模型，该模型可以抑制背景区域，强调前景区域，自动学习如何区分目标的外形和尺寸。

U-Net++

Paper: 《UNet++: Redesigning Skip Connections to Exploit Multiscale Features in Image Segmentation》

Accepted by TMI 2019.

文章解读：https://zhuanlan.zhihu.com/p/44958351

U-Net++

U-Net++ 的第一个优势就是精度的提升，通过整合不同层次的特征加强信息交互；第二个是灵活的网络结构配合深监督，让参数量巨大的深度网络在可接受的精度范围内大幅度的缩减参数量。

CE-Net

Paper: 《UNet++: Redesigning Skip Connections to Exploit Multiscale Features in Image Segmentation》

Accepted by TMI 2019.

CE-Net

CE-Net 主要包含三个主要组件，即特征编码器模块、上下文提取器和特征解码器模块。

特征编码器模块：使用预训练的 ResNet 块作为固定特征提取器；
上下文提取器模块：由密集空洞卷积(DAC)块和残差多核池(RMP)块组成，旨在来捕获更多高级信息并保留空间信息；
特征解码器模块：主要包括连续的1×1卷积，3×3转置卷积和1×1卷积，利用转置卷积学习自适应映射以恢复具有更多详细信息的特征。

综合结果表明，所提出的方法在视盘分割、血管检测、肺部分割、细胞轮廓分割和视网膜光学相干断层扫描层分割方面均取得了不错的效果。

nnU-Net

Paper: 《nnU-Net: Self-Adapting Framework for U-Net-Based Medical Image Segmentation》

文章解读：https://medium.com/miccai-educational-initiative/nnu-net-the-no-new-unet-for-automatic-segmentation-8d655f3f6d2a

nnU-Net pipeline

nnU-Net 是医学图像十项全能比赛的冠军，目前在医学图像分割领域有着不可撼动的地位，相信目前研究该领域的人员应该无人不知，无人不晓。nnU-Net 本身并不侧重于网络结构的创新，更多的是提出一个统一的框架，包括针对医学影响设设计的一系列丰富的预处理、后处理和训练 tricks 等。

MultiResUNet

Paper: 《MultiResUNet : Rethinking the U-Net architecture for multimodal biomedical image segmentation》

Accepted by Neural Networks 2020.

文章解读：https://zhuanlan.zhihu.com/p/57237535

MultiResUNet

MultiResUNet 主要针对医学图像分割任务普遍存在的两个问题——尺度多样性以及不同层级特征之间融合所存在的语义鸿沟，提出了 MultiRes 模块和 Res Path 进行解决，最终在多模态医学图像分割任务上获得优异的性能。

CPFNet

Paper: 《CPFNet: Context Pyramid Fusion Network for Medical Image Segmentation》

Accepted by TMI 2020.

CPFNet

CPFNet，即上下文金字塔融合网络，基于U-Net架构并结合两个金字塔模块来融合全局的多尺度上下文信息。

全局金字塔引导(GPG)模块：通过重构跳跃连接为解码器提供不同层次的全局上下文信息；
尺度感知金字塔融合(SAPF)模块：实现了多尺度上下文信息的动态高层次融合;

实验结果表明，提出的方法在四个不同的挑战性任务，包括皮肤损伤的分割，视网膜线性损伤的分割，胸部器官的多分类分割和视网膜水肿损伤的分割任务上具有很强的竞争力。

PraNet

Paper: 《PraNet: Parallel Reverse Attention Network for Polyp Segmentation》

Accepted by MICCAI 2020.

文章解读：https://cg.cs.tsinghua.edu.cn/jittor/news/2021-09-17-00-00-PraNet/

PraNet

PraNet 利用并行的部分解码器在高级层中聚合特征作为初始引导区域，再使用反向注意模块挖掘边界线索，其最大贡献点在于统一了多个结直肠息肉分割任务，为后续息肉分割相关的研究铺垫了基础。

FAT-Net

Paper: 《FAT-Net: Feature Adaptive Transformers for Automated Skin Lesion Segmentation》

Accepted by MIA 2021.

FAT-Net

FAT-Net 属于最早期应用 Transformer 架构的经典医学图像图像分割网络，致力于解决皮肤病变分割任务。整个网络基于编解码架构，编码器部分采用 Transformer + CNN 的并行双分支架构进行主要的特征提取，以有效地捕获远程依赖关系和全局上下文信息。随后，基于特征重标定的策略对来自不同架构所提取到的的特征图进行更深层次的融合，通过学习的方式来自动获取到每个特征通道的重要程度，最后再筛选出更加有用的特征图。最后，通过在跳跃连接部分集成了特征自适应模块(FAM)来激活有效通道和抑制不相关的背景噪声，从而增强相邻层特征之间的特征融合。

BA-Net

Paper: 《Boundary-aware context neural network for medical image segmentation》

Accepted by MIA 2022.

BA-Net

BA-Net 是一个针对 2D 医学图像分割并基于编解码结构所设计的边界感知上下文神经网络，可以捕获更丰富的上下文并保留精细的空间信息；其次，通过在编码器子网络的每个阶段，应用金字塔边缘提取模块来获得多粒度边缘信息；最后，一个新设计的迷你多任务学习模块用于联合学习分割对象掩码和检测病变边界，其中引入了一个新的交互式注意层来桥接这两个任务。通过这种方式，实现了不同任务之间的信息互补，有效地利用边界信息为更好的分割预测提供了强有力的线索。最后，交叉特征融合模块用于选择性地聚合来自整个编码器子网络的多级特征。通过级联这三个模块，每个阶段的更丰富的上下文和细粒度特征被编码，然后传递给解码器。

CASTformer

Paper: 《Class-Aware Generative Adversarial Transformers for Medical Image Segmentation》

Accepted by NeuraIPS 2022.

CASTformer

CASTformer 是 CNN + Transformer 组合而成的混合网络结构，通过整合多尺度金字塔结构以捕获丰富的全局空间信息和局部多尺度上下文信息。此外，进一步的应用生成对抗训练的策略用于提高分割性能，使基于 Transformer 的判别器能够捕获低级解剖特征和高级语义。

Others

《Transunet: Transformers make strong encoders for medical image segmentation》

《CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image Segmentation》

《Convolution-Free Medical Image Segmentation using Transformers》

《Transfuse: Fusing transformers and cnns for medical image segmentation》

《Medical Transformer: Gated Axial-Attention for Medical Image Segmentation》

《Medical Image Segmentation Using Squeeze-and-Expansion Transformers》

《Multi-Compound Transformer for Accurate Biomedical Image Segmentation》

《UTNet: A Hybrid Transformer Architecture for Medical Image Segmentation》

《Mixed Transformer U-Net For Medical Image Segmentation》

MT-UNet

《An Effective Medical Image Segmentation Transformer》

MISSFormer

《T-AutoML: Automated Machine Learning for Lesion Segmentation using Transformers in 3D Medical Imaging》

《RTNet: Relation Transformer Network for Diabetic Retinopathy Multi-lesion Segmentation》

Related Repo：https://github.com/junyuchen245/Transformer_for_medical_image_analysis

自然图像分割

DeconvNet

Paper: 《Learning Deconvolution Network for Semantic Segmentation》

Accepted by ICCV 2015.

DeconvNet

DeconvNet 提出了深度反卷积结构，并首次应用到语义分割任务上。同时，结合目标检测技术，将训练好的网络应用到每个提议框上以获得实例级的分割结果；最后，再将这些单个分割的结果拼接起来以完成最终的语义分割推理，有效的解决了 FCN 网络无法有效处理细小目标的局限性。

SegNet

Paper: 《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentationn》

Accepted by TPAMI 2017.

SegNet

SegNet 是伴随着 U-Net 同时发布的，它首先在深度学习中引入跳跃连接作为典型的下采样层中观察到的信息丢失的解决方案编码器-解码器网络。跳跃连接是从编码器直接到解码器而不经过瓶颈层的连接。换句话说，在解码器中捕获并连接到编码表示的各个级别的特征图。这有助于通过积极的池化和下采样来减少信息丢失，帮助恢复更精细的物体定位。

DeepLab

继 SegNet 之后，Facebook 提出的 DeepLab 成为一个新的里程碑，提供了语义分割的最先进结果。

DeepLab 前后共发布过四个版本，分别为 v1 - v3+：

DeepLab-v1

DeepLab-v1 整体沿用了 VGG-16 的架构，其贡献点加入引入了空洞卷积，在保持原有特征分辨率的前提下增大网络的感受野，同时应用了条件随机场 CRF 作为后处理去平滑边缘细节。

DeepLab-v2

DeepLab-v2 提出了多尺度的空洞池化金字塔卷积模块——ASPP，以增强网络识别不同尺寸的同一物体的能力。

DeepLab-v3

DeepLab-v3 引入了 Multi-Grid 策略，同时在 v2 提出的 ASPP 模块内融合了 BN 技术；此外，为了更高效的捕获多尺度信息，v3 将全局池化层集成到了 ASPP 模块内。

DeepLab-v3+

DeepLab-v3+ 整体架构借鉴了 U-Net 和 SegNet 转换为编解码结构，通过引入适当的 Skip Connection 来获取更好的分割边缘；此外，v3+ 进一步参照了 MobileNet，改用深度可分离卷积，同时集成了优化过后的 Xception 模块。

PSPNet

Paper: 《Pyramid Scene Parsing Network》

Accepted by CVPR 2017.

PSPNet

PSPNet 中提出了金字塔池化模块——SPP，主要围绕多尺度信息和全局上下文建模进行设计，同时借鉴了 GoogleNet 的思路引入了辅助 loss，帮助网络更好的收敛。

RefineNet

Paper: 《RefineNet: Multi-Path Refinement Networks with Identity Mappings for High-Resolution Semantic Segmentation》

Accepted by CVPR 2017.

RefineNet

RefineNet 旨在建模多个层级特征之间的信息交互，同时结合残差思想来帮助网络的梯度回传，使模型整体的训练更加容易收敛；此外，应用 Chained Residual Pooling 模块来捕获更多的上下文信息。

GCN

Paper: 《Large Kernel Matters —— Improve Semantic Segmentation by Global Convolutional Network》

Accepted by CVPR 2017.

GCN

语义分割涉及两个任务——分类和定位。分类网络具有平移和旋转不变性，因此不注重位置信息；而定位涉及获取准确的位置细节。因此，这两项任务本质上是矛盾的。大多数分割算法更重视定位，因此忽略了全局上下文。在这项工作中，作者提出了一种在不丢失定位信息的同时也重视分类任务的方法——全局卷积网络，是早期较早验证大卷积核能带性能增益的代表性工作之一。

ExFuse

Paper: 《ExFuse: Enhancing Feature Fusion for Semantic Segmentation》

Accepted by ECCV 2018.

ExFuse

Low-level 的特征具备丰富的细节信息，但缺乏高级语义信息；High-level 的特征则与之相反，具备丰富的高级语义但缺乏空间细节信息。ExFuse 旨在探讨如何更高效的将编码器中的 High-level 特征与解码器中的 Low-level 特征进行深度融合，从而在低层特征中引入更多的语义信息，在高层特征中嵌入更多的空间信息。

DFN

Paper: 《Learning a Discriminative Feature Network for Semantic Segmentation》

Accepted by CVPR 2018.

DFN

DFN 主要针对语义分割任务面临的两大挑战：类内不一致(intra-class inconsistency)和类间无差别(inter-class indistinction)，提出了对应的特征判别性网络——Discriminative Feature Network，其包含Smooth Network和Border Network。

Smooth Network 用于处理类内一致性问题，通过结合通道注意力模块和全局平均池化来选择更有判别性的特征；
Border Network 则用于处理边界不清晰问题，借助多层语义边界监督区分边界两边的特征。

PSANet

Paper: 《PSANet: Point-wise Spatial Attention Network for Scene Parsing》

Accepted by ECCV 2018.

PSANet

PSANet 针对场景解析任务提出了逐点空间注意力机制，通过自适应学习一个注意力掩码，将特征映射上的每个位置与其他位置联系起来，来缓解局部邻域约束。

NonLocal

Paper: 《Non-local Neural Networks》

Accepted by CVPR 2018.

NonLocal

NonLocal 借鉴自注意力机制的思路来完成远距离的上下文建模，整体效果不错，但计算量过大。

DUpsampling

Paper: 《Decoders Matter for Semantic Segmentation:Data-Dependent Decoding Enables Flexible Feature Aggregation》

Accepted by CVPR 2019.

文章解读：https://zhuanlan.zhihu.com/p/62508574

DUpsampling

先前绝大多数基于编解码架构的语义分割网络，解码器的上采样层通常依赖双线性插值操作，这种与数据无关的方法无法学习到有效的特征映射。该论文则提出一种数据相关型的上采样方法 DUpsampling 来替代双线性插值，大幅提升了模型的采样重构能力，在降低计算复杂度的同时提升分割精度。

DMNet

Paper: 《Dynamic Multi-scale Filters for Semantic Segmentation》

Accepted by ICCV 2019.

DMNet

DMNet 从多尺度表示出发，设计了一种动态多尺度网络来自适应捕获多尺度内容以预测像素级语义标，从而解决语义分割中对象和东西的尺度变化。DMNet 主要由多个并行排列的动态卷积模块(DCM)组成，每个模块都利用上下文感知过滤器来估计特定规模的语义表示。最后，多个 DCM 的输出进一步集成以完成分割。

DANet

Paper: 《Dual Attention Network for Scene Segmentation》

Accepted by CVPR 2019.

DANet

DANet 包含了两个注意力模块——通道注意力和空间注意力，旨在捕捉空间和通道维度中的全局特征依赖关系。其中，空间注意力模块用于学习特征的空间相互依赖性，通道注意力模块用于模拟通道相互依赖性，通过在局部特征上建模丰富的上下文依赖关系，显著的改善了最终的分割结果。

CCNet

Paper: 《CCNet: Criss-Cross Attention for Semantic Segmentation》

Accepted by ICCV 2019.

CCNet

CCNet 提出 criss-cross attention module 来捕捉图像周围像素的上下文信息，从而捕获全局信息。CCNet 通过使用两次交叉注意力机制，使较远处的像素点同样可以间接作用于该像素点，相比于 Non-local 模块可以大幅降低计算量。

ANN

Paper: 《Asymmetric Non-local Neural Networks for Semantic Segmentation》

Accepted by ICCV 2019.

ANN

ANN 针对 NonLocal 作出了优化，主要解决前者计算量和显存占用量巨大的问题。ANN 设计了一种非对称非局部的神经网络，主要包含非对称金字塔非局部块(APNB)和非对称融合非局部块(AFNB)两个组件。其中，APNB 在非本地块中利用金字塔采样模块，在不牺牲性能的情况下大大减少了计算和内存消耗。另一方面，AFNB 则由 APNB 改编而来，在充分考虑长程依赖性的情况下融合了不同层次的特征，从而显着提高了性能。

Gated-SCNN

Paper: 《Gated-SCNN: Gated Shape CNNs for Semantic Segmentation》

Accepted by ICCV 2019.

Gated-SCNN

Gated-SCNN 是一种基于双流的卷积神经网络架构，通过在常规流之外引入形状流分支额外处理形状信息，有效去除噪声并帮助形状流仅专注于处理相关的边界相关信息。

EMAU

Paper: 《Dual Super-Resolution Learning for Semantic Segmentation》

Accepted by ICCV 2019 (oral).

EMAU

EMAU 提出了期望最大化注意力机制，摒弃了在全图上计算注意力图的流程，转而通过期望最大化算法迭代出一组紧凑的基，在这组基上运行注意力机制，从而大大降低了复杂度。其中，E步更新注意力图，M步更新这组基。E、M交替执行，收敛之后用来重建特征图。

DSRL

Paper: 《Dual Super-Resolution Learning for Semantic Segmentation》

Accepted by CVPR 2020.

DSRL

DSRL 主要讲超分引入了语义分割框架，以指导语义分割如何更好的恢复至原始的空间分辨率。

OCRNet

Paper: 《Object-Contextual Representations for Semantic Segmentation》

Accepted by ECCV 2020.

OCRNet

OCRNet 从 pixel 出发，作者人为每个像素点的类别应该是它所属目标的类别，因此可以通过用相应的对象区域表示来表征每个像素来加强像素表示。具体地，本文结合每一类的类别语义信息给每个像素加权，再和原始的 pixel 特征 concat 组成最终每个像素的特征表示，以此来求出每个像素点和每个类别的相关性，从而对每个像素点的上下文信息进行建模。

值得一提的是，HRNet 结合 OCRNet 的语义分割网络《High-resolution networks and Segmentation Transformer for Semantic Segmentation》也取得了异常优秀的效果，感兴趣的同学可以参考下官方的 Github —— https://github.com/HRNet/HRNet-Semantic-Segmentation

PointRend

Paper: 《PointRend: Image Segmentation as Rendering》

Accepted by CVPR 2020.

PointRend

PointRend 将图像分割当做一个渲染问题，整体方案遵循 coarse-to-fine 的迭达式算法，可以在自适应选择的位置执行基于点的分段预测，从而在先前方法过度平滑的区域中输出清晰的对象边界。

DynamicRouting

Paper: 《Learning Dynamic Routing for Semantic Segmentation》

Accepted by CVPR 2020 (oral).

DynamicRouting

DynamicRouting 是旷视研究院针对语义分割任务提出一个全新的理念。具体而言，动态路径选择会在推理过程中根据输入图像生成前向传播路径，也就是说随着输入数据的不同，网络也会自适应地生成不同的结构进行特征编码。利用该方法，网络可以将不同尺寸的物体（或背景）分配到对应分辨率的层级上，以实现有针对性的特征变换。

SETR

Paper: 《Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers》

Accepted by CVPR 2021.

文章解读：https://zhuanlan.zhihu.com/p/348418189

SETR

SETR 记得没错的话应该是当时最早将 ViT 引入语义分割框架的代表型工作之一。

MagNet

Paper: 《Progressive Semantic Segmentation》

Accepted by CVPR 2021.

MagNet

MagNet 主要贡献在于解决如何在有限硬件资源条件下训练超高分辨率输入的语义分割问题。

UN-EPT

Paper: 《A Unified Efficient Pyramid Transformer for Semantic Segmentation》

Accepted by ICCV 2021.

文章解读：https://mp.weixin.qq.com/s/mDl9I6kh4uamoM9YWtXoQw

UN-EPT

UN-EPT 网络统一考虑了上下文信息和 boundary artifacts 来分割对象。首先，应用稀疏采样策略来整合基于 Transformer 的注意力机制，以实现高效的上下文建模。最后，引入了一个单独的空间分支来捕获图像细节以进行边界细化，整个模型可以以端到端的方式进行训练。

PVT

Paper: 《Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction Without Convolutions》

Accepted by ICCV 2021.

PVT

PVT 主要的贡献是从多尺度角度出发，将金字塔结构引入到 ViT 中，以更好的完成密集预测任务。

SegFormer

Paper: 《SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers》

Accepted by NeuraIPS 2021.

SegFormer

SegFormer 整体架构上沿用分层特征表示来捕获多尺度特征，同时去掉了原始 ViT 结构中的 position embedding，避免了测试图像与训练图像尺寸不同而导致模型性能下降的问题。最后，在解码器部分则应用了 MLP 结构来聚合来自编码器输出的不同尺度特征图，以同时融合局部注意力和全局注意力。

Segmenter

Paper: 《Segmenter: Transformer for Semantic Segmentation》

Accepted by ICCV 2021.

Segmenter

Segmenter 是一个依赖纯 Transformer 编解码器所构建的网络结构，可建模全局上下文信息，并使用逐点线性解码器或掩码 Transformer 来获取类标签。

SegNeXt

Paper: 《SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation》

Accepted by NeurIPS 2022.

文章解读：https://zhuanlan.zhihu.com/p/570557325

SegNeXt

SegNeXt 是基于 Segmenter 改进的，提倡使用大卷积核来替代 Transformer 中的注意力操作。

实时语义分割

ENet

Paper: 《ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation》

Accepted by ICLR 2017.

ENet

ENet 主要是针对此前 SegNet 等网络参数量大推理时间长以及下采样容易丢失精确边缘空间信息等问题提出了一系列的改进方案。

保留最大池化层的最大元素索引，并将其应用在解码器中以生成稀疏的上采样映射；
采用 BN、PReLu、Dropout等 Tricks；
结合原始卷积、空洞卷积、非对称卷积和全卷积来进一步提升网络的多尺度特征捕捉能力。

ICNet

Paper: 《ICNet for Real-Time Semantic Segmentation on High-Resolution Images》

Accepted by ECCV 2018.

ICNet

ICNet 设计了一种新颖而独特的图像级联网络，充分地建模了低分辨率图的语义信息和高分辨率图的细节信息，实现了图像的实时语义分割所开发的级联特征融合单元与级联标签指导相结合，可以在较低计算量的情况下逐步恢复和细化分割的结果。

CGNet

Paper: 《CGNet: A Light-weight Context Guided Network for Semantic Segmentation》

Accepted by TIP 2020.

CGNet

CGNet 即轻量化语义分割模型，可以满足移动设备的运行需要，主要由 Context Guided Block 构建而成。CG 块可以学习局部特征和周围环境上下文的联合特征，最后再通过引入全局上下文特征进一步改善联合特征的学习。

BiSeNet

Paper: 《BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation》

Accepted by CVPR 2018.

BiSeNet

BiSeNet 系列是实时语义分割网络中的经典工作之一，其围绕丰富的空间信息以及大感受野来设计双分支网络结构，最后再通过特征融合模块FFM进行信息整合。

Paper: 《BiSeNet V2: Bilateral Network with Guided Aggregation for Real-Time Semantic Segmentation》

Accepted by IJCV 2021.

BiSeNet V2

BiSeNet V2 提出了一种用于实时语义分割的具有引导聚合的双边网络，主要围绕低级空间细节和高级语义信息这两个方面进行建模。

Paper: 《BiSeNet V3: Bilateral Segmentation Network with Coordinate Attention for Real-time Semantic Segmentation》

BiSeNet V3

BiSeNet V3 (未正式发表)引入了一个新的特征细化模块来优化特征图和一个特征融合模块来有效地组合特征。此外，借助注意力机制来帮助模型捕获上下文信息，并使用边缘检测来增强边界特征。

Paper: 《Rethinking BiSeNet For Real-time Semantic Segmentation》

Accepted by CVPR 2021.

STDC

STDC 是由美团提出的针对 BiSeNet 网络所改进的实时语义分割网络架构，该方法通过逐步降低特征图的维度，并利用聚合信息来表示图像。在解码器中，通过将空间信息的学习以 single-stream 的方式整合到低层，提出一个 Detail Aggregation 模块。最后，再通过融合浅层特征和深层特征输出最终的分割结果。

SSR

Paper: 《Efficient Joint-Dimensional Search with Solution Space Regularization for Real-Time Semantic Segmentation》

Accepted by IJCV 2022.

SSR 是通过神经架构搜索自动搜索出来的一个最优的网络结构，可以实现实时且准确的语义分割。文中提出了一种新颖的解空间正则化(SSR)损失函数，有效地鼓励超网收敛到其离散网络。随后，通过分层渐进解空间收缩策略，进一步提高搜索的效率并减少计算消耗。此外，作者从理论上证明了 SSR 损失在优化上等效于 L0 范数正则化，这解释了缩小的离散化差距。综合实验表明，所提搜索方案可以高效地找到最优的分割网络结构，在保持精度相当的同时，以极小的模型尺寸(1M)获得极快的分割速度(175 FPS)。

SenFormer

Paper: 《Efficient Self-Ensemble for Semantic Segmentation》

Accepted by BMVC 2022.

SenFormer

SenFormer 提出了一种自集成方法，通过利用特征金字塔网络方法产生的多尺度特征集来提供独立的解码器，从而在单个模型中创建一个集成，有效的提升了语义分割的性能，同时避免传统集成方法所需的昂贵训练成本。

IncepFormer

Paper: 《IncepFormer: Efficient Inception Transformer with Pyramid Pooling for Semantic Segmentation》

Accepted by NeuraIPS 2022.

IncepFormer

IncepFormer 是一种基于金字塔结构的 Transformer 编码器，可同时捕获全局上下文和精细定位特征。此外，借鉴 Inception 模块，该方法为为每个自注意力层嵌入轻量化的前馈模块，更高效的提取到丰富的局部多尺度上下文信息。

统一分割框架

Mask R-CNN

Paper: 《Mask R-CNN》

Accepted by ICCV 2017 (Best paper).

Mask R-CNN

Mask R-CNN 是早期将分类、检测、分割等任务大一统的经典代表性工作，通过在 Faster-RCNN 的基础上添加一个分支网络，在实现目标检测的同时，把目标掩码同时分割出来。

K-Net

Paper: 《K-Net: Towards Unified Image Segmentation》

Accepted by NeurIPS 2021.

文章解读：https://zhuanlan.zhihu.com/p/428280551

K-Net

K-Net 提出了由一组卷积核生成一组 mask 的思想，每一个 mask 至多只分割图片中的一个物体，且不同的 kernel 负责不同物体的 mask 生成。如此一来，便可以不借助任何额外的组件来完成实例分割任务，在提高推理效率的同时实现端到端的训练优化。

K-Net 是近期大一统分割框架的代表性工作之一，突破 Mask-RCNN 的先检测后分割的范式，统一了语义分割、实例分割以及全景分割任务的解决范式。

MaskFormer

Paper: 《Per-Pixel Classification is Not All You Need for Semantic Segmentation》

Accepted by NeurIPS 2021.

文章解读：https://zhuanlan.zhihu.com/p/389457610

MaskFormer

MaskFormer 从语义分割任务本身出发，将语义分割从一个像素级分类问题转换成一个掩码级分割问题，不仅更自然的把语义级分割和实例级分割联系在了一起，并且在语义分割上取得了比像素级分类方法更好的结果。

kMaX-DeepLab

Paper: 《k-means Mask Transformer》

Accepted by ECCV 2022.

kMaX-DeepLab

kMaX-DeepLab 重新思考像素和对象查询之间的关系，并建议将交叉注意力学习重新定义为聚类过程。受传统 k-means 聚类算法的启发，本文开发了一种用于分割任务的 k-means Mask Xformer (kMaX-DeepLab)，其结构简单优雅，但取得了 SOTA 性能。

Mask2Former

Paper: 《Masked-attention Mask Transformer for Universal Image Segmentation》

Accepted by CVPR 2022.

文章解读：https://blog.csdn.net/bikahuli/article/details/121991697

Mask2Former

Mask2Former 旨在构建一个简单的元框架 MaskFormer 和一个新的 Transformer 解码器，其关键组成部分为掩码注意力 Masked-attention，通过将交叉注意力限制在预测的掩码区域内来提取局部特征，最终在有效节省计算资源的情况下，在全景分割、实例分割和语义分割上均实现了 SOTA。

OneFormer

Paper: 《OneFormer: An Universal Image Segmentation Framework That Unifies Segmentation With A Multi-Task Train-Once Design》

Accepted by CVPR 2022.

文章解读：https://blog.csdn.net/bikahuli/article/details/121991697

OneFormer

OneFormer 应该是目前截止至笔者收稿为止最强的通用图像分割网络，其基于 Transformer 架构，骨干网络采用ConvNeXt和DiNAT，真正意义上统一了语义分割、实例分割或全景分割任务，仅通过训练一遍网络，实现了在三个图像分割任务中实现 SOTA 性能。其次，引入了一种任务token，将该模型限定在手头任务上，使模型具有任务动态性，以支持多任务训练和推理。最后，该方法在训练过程中使用了查询-文本对比损失来更好的区分不同任务和类间的关系。

MasK DINO

Paper: 《Mask DINO: Towards A Unified Transformer-based Framework for Object Detection and Segmentation》

Arxiv 2022.

MasK DINO

Mask DINO 是一个简单、高效且可扩展d 统一对象检测和分割框架，通过添加支持所有图像分割任务(实例、全景和语义)的掩码预测分支扩展了 DINO，利用 DINO 中查询嵌入通过点积生成一个高分辨率的像素点嵌入特征以预测一组二分类掩码，并且可以受益于联合大规模检测和分割数据集。

语义分割扩展

零样本语义分割

Paper: 《Decoupling Zero-Shot Semantic Segmentation》

Accepted by CVPR 2022.

ZegFormer

零样本语义分割(Zero-Shot Semantic Segmentation, Z3S)旨在分割出训练中未曾出现的新类别。现有方法将 ZS3 表述为像素级 zeroshot 分类问题，并在仅使用文本进行预训练的语言模型的帮助下，将语义知识从已见类别转移到未见类别。

本文提出将 ZS3 分解为两个子任务：

分类不可知分组任务，将像素分组为段；
完成段上的零样本分类任务。前一个任务不涉及类别信息，可以直接转移到未见类的组像素。后一项任务在分段级别执行，并提供了一种自然的方式来利用为 ZS3 使用图像文本对（例如 CLIP）预训练的大规模视觉语言模型。

弱监督/样本语义分割

Paper: 《Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation》

Accepted by ECCV 2020 (oral).

弱监督语义分割

近年来，基于图像标签信息(image-level label)的弱监督语义分割方法大部分都是基于以下步骤：

训练一个通用的图像分类器；
通过分类器的 CAM 获取每张图像在分类中被激活的区域（物体定位图）;
生成伪标签 mask 作为监督信号训练语义分割模型。

然而，CAM 生成的物体定位图仅关注物体中最具辨识度的区域，而不是物体整体。为了解决这种问题，本方法通过在分类器中引入两种注意力模型来帮助分类器识别更多的物体区域：

协同注意力(co-attention): 用于帮助分类器识别一对图像之间共同的语义信息(common semantics)，而且能够在物体定位图(object localization maps)的推理过程中利用上下文信息；
对比协同注意力(contrastive co-attention): 则用于识别一对图像之间不同的语义信息(unshared semantics)。

Paper: 《Weak-shot Semantic Segmentation via Dual Similarity Transfer》

Accepted by NeuraIPS 2022.

SimFormer

弱样本学习(weak-shot learning)和零样本学习、少样本学习任务相似，均是将所有种类划分成没有交集的基础种类和新种类。不同的是，基础种类有大量强标注的训练样本，而新种类有大量弱标注的训练样本。

对一些基础种类，通常都有完整的像素级别的强标注数据，而针对更为广阔的新种类普遍仅有图片级别的弱标注数据。在该学习模式下，本文提出名为 SimFormer 的方法，旨在从带有强标注数据的基础种类中迁移双重相似度来辅助从弱标注数据中学习新类别。

半监督语义分割

Paper: 《Semi-Supervised Semantic Segmentation Using Unreliable Pseudo-Labels》

Accepted by CVPR 2022.

文章解读：https://zhuanlan.zhihu.com/p/474771549

U2P

本文基于 Every Pixel Matters 的理念，有效利用了包括不可靠样本在内的全部无标签数据，大幅提升了算法精度。

域自适应语义分割

域自适应(Domain Adaption)，顾名思义就是自适应不同的域，即不同的场景分布，包括：

从一个场合迁移到另一个场合
从天气晴朗迁移到雨雪雾
从白天迁移到黑夜

通常来说，不同域之间会存在域间隙和标签偏移问题，同时伪标记目标数据包含混合的封闭集和开放集标签噪声。

Paper: 《DANNet: A One-Stage Domain Adaptation Network for Unsupervised Nighttime Semantic Segmentation 》

Accepted by CVPR 2021.

DANNet

在自动驾驶中，夜间图像的语义分割与白天图像具有同样重要的作用，但由于光照差和费力的人工注释，前者更具挑战性。在本文中，作者提出了一种新的域自适应网络用于夜间语义分割，无需使用标记的夜间图像数据。该方法基于对抗性训练，使用一个标记的白天数据集和一个包含粗对齐的昼夜图像对。具体来说，对于未标记的昼夜图像对，使用日间图像上静态对象类别的像素级预测作为伪监督来分割其对应的夜间图像。通过进一步设计了一种重加权策略，以处理昼夜图像对错位和日间图像预测错误所导致的不准确性，并提高小物体的预测精度。DANNet 是第一个用于夜间语义分割的单阶段自适应框架，它没有训练额外的昼夜图像传输模型作为一个单独的预处理阶段。在 Dark Zurich 和 Nighttime Driving 数据集上的大量实验表明，该法实现了最先进的夜间语义分割性能。

Paper: 《SimT: Handling Open-set Noise for Domain Adaptive Semantic Segmentation》

Accepted by CVPR 2022.

SimT

在本文中，作者提出了一个单纯形噪声转换矩阵(SimT)来模拟 DA 语义分割 中的混合噪声分布，并将问题表述为 SimT 估计。通过利用计算几何分析和分割特性，设计了三个互补的正则化器，即体积正则化、锚引导、凸保证，以逼近真实的 SimT。具体来说，体积正则化最小化由非正方形 SimT 的行形成的单纯形的体积，这确保分割模型的输出适合GT标签分布。此外，为了弥补开放集知识的不足，文中进一步设计了 anchor guidance和convex guarantee，以促进开放集噪声分布的建模，并增强封闭集和开放集类之间的判别特征学习。估计的 SimT 进一步用于纠正伪标签中的噪声问题，并提高分割模型对目标域数据的泛化能力。

点云语义分割

Paper: 《2DPASS: 2D Priors Assisted Semantic Segmentation on LiDAR Point Clouds》

Accepted by ECCV 2022.

2DPASS

2DPASS 是基于二维图像先验辅助的激光雷达点云语义分割，不同于先前的多模态方法，即训练和推理阶段均需要成对的图像和点云数据作为输入，该方法仅在训练阶段利用额外的图像数据，从原始相机数据中获取更丰富的语义和结构信息，并将其提炼蒸馏至三维语义分割网络中。在测试阶段，该方法可实现实时感知，无需图像数据输入，即可实现又快又准的三维语义分割，实现 SemanticKITTI 和 NuScenes 双 SOTA。

扩散语义分割

Paper: 《Label-Efficient Semantic Segmentation with Diffusion Models》

Accepted by ICLR 2022.

DDPM-SS

去噪扩散概率模型最近受到了很多研究人员的关注，其性能由于以往 GAN 为代表的一众生成式模型，在图像修复、超分辨率、语义编辑等 low-level 领域遍地开发。最近，许多研究工作将 DDPM 引入到了 high-level 任务上，例如目标检测和语义分割等。本方法便是 DDPM 在语义分割领域的一个代表性工作，作者向我们证明了扩散模型也可以用作语义分割的工具，尤其是在标记数据稀缺的情况下。

往期回顾

【入门系列】万字长文带你入门计算机视觉

【入门系列】万字长文带你入门Transformer

【总结系列】目标检测20年

【总结系列】CVHub带你回顾GANs发展的8年

【工具系列】OOM？详解PyTorch显存高效利用

【工具系列】为什么你的显卡利用率总是0%？

【工具系列】2120年深度学习入门必备手册

【总结系列】一文看尽深度学习中的20种卷积

【总结系列】一文看尽深度学习中的生成对抗网络

【总结系列】一文看尽深度学习中的各种注意力机制

【总结系列】一文看尽深度学习中的各种池化方法

【总结系列】一文看尽深度学习中的各种损失函数

长按识别二维码

微信号：

『cv_huber』

小程序：

『CVHub』

你可能感兴趣的:(计算机视觉,人工智能,深度学习,图像处理)

【python】Python中常见的KeyError报错分析景天科技苑 python 开发语言 python报错 KeyError
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，linux，shell脚本等实操
金融租赁系统的创新发展与市场竞争力提升探讨红点租赁系统开发其他
内容概要随着经济的快速发展，金融租赁系统逐渐成为金融市场中不可或缺的一环。它不仅提供了灵活的资金解决方案，还促进了企业的资本结构优化与资源配置效率。因此，了解该系统的市场背景与发展现状至关重要。在现今环境下，新兴技术如人工智能、大数据和区块链等正加速推动金融租赁的创新。通过这些技术，不仅可以优化业务流程，提升运营效率，还可以增强风险管理能力。例如，利用数据分析可以实时监测租赁资产的风险，从而采取相
数据集格式转换——json2txt、xml2txt、txt2json【复制就能用】 kay_545 YOLO11改进有效涨点 python 人工智能机器学习
秋招面试专栏推荐：深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转本专栏所有程序均经过测试，可成功执行专栏地址：YOLO11入门+改进涨点——点击即可跳转欢迎订阅目录json2txt脚本xml2txttxt2json
量子计算+AI：未来AI Agent的计算范式 AI天才研究院计算 ChatGPT DeepSeek RL 强化学习 agent agi 推理模型智能驾驶
量子计算+AI：未来AIAgent的计算范式关键词：量子计算，人工智能，AIAgent，量子算法，量子机器学习，量子优化，量子数据处理摘要：量子计算和人工智能（AI）的结合正在改变AIAgent的计算范式。通过量子计算的超强算力和独特性质，AIAgent在数据处理、算法优化和决策能力方面展现出巨大潜力。本文将详细探讨量子计算与AI结合的核心概念、算法原理、系统架构，并通过实际案例展示量子AIAge
AI人工智能深度学习算法：在量子计算中的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着科技的不断发展，人工智能和量子计算成为了当今世界的热门话题。人工智能的深度学习算法在处理大规模数据和复杂任务方面取得了显著的成果，而量子计算则具有强大的并行计算能力和高效的信息处理能力。将人工智能与量子计算相结合，为解决一些具有挑战性的问题提供了新的思路和方法。本文将探讨人工智能深度学习算法在量子计算中的应用，包括其背景、意义和应用场景。2.核心概念与联系在人工智能中，深度学习是一
《量子门与AI神经元：计算世界的奇妙碰撞》程序猿阿伟人工智能量子计算
在当今科技飞速发展的时代，量子计算和人工智能作为前沿领域，正不断颠覆我们对计算和智能的认知。量子门操作和AI中的神经元计算过程，分别作为这两大领域的核心机制，看似处于不同维度，却有着千丝万缕的联系，它们之间的区别与关联，犹如一把钥匙，为我们打开了通往更高级计算与智能世界的大门。量子门操作是量子计算的基础，它利用量子力学的奇妙特性，如叠加和纠缠，对量子比特进行操控。量子比特，作为量子信息的基本单元，
自建智能算力中心 vs 第三方算力租赁：AI企业的算力博弈与最优解
人工智能的爆发式增长正在重塑全球产业格局。从ChatGPT到DeepSeek，从自动驾驶到智能医疗，AI模型的训练和推理需求呈现指数级增长。在这场技术革命中，算力已成为企业竞争的“命脉”。然而，面对动辄数亿元的硬件投入和复杂的运维挑战，AI企业正面临一个关键抉择：自建智能算力中心，还是选择第三方算力租赁？本文将从成本、效率、风险及适用场景等维度展开深度分析，为企业提供决策参考。一、成本对比：重资产
还在为找图发愁？图生生AI以图生图，一键生成专属风格！图生生人工智能 ai AI作画图生生
你是否也遇到过这样的烦恼：想为文章配图，却找不到风格合适的图片？设计海报时，灵感枯竭，不知从何下手？看到喜欢的图片风格，却无法应用到自己的作品中？别担心，图生生AI生图来帮你！只需上传一张图片，AI就能自动生成相似风格的图片，让你轻松拥有专属图库！图生生AI生图是一款基于人工智能技术的图片生成工具，它能够深度学习和理解图片的风格、色彩、构图等元素，并以此为基础生成全新的图片。无论你是设计师、自媒体
深度学习中的Channel，通道数是什么？ %KT% 深度学习深度学习人工智能
参考文章：直观理解深度学习的卷积操作，超赞！-CSDN博客如何理解卷积神经网络中的通道（channel）_神经网络通道数-CSDN博客深度学习-卷积神经网络—卷积操作详细介绍_深度卷积的作用-CSDN博客正文：在跑深度学习代码的过程中，经常遇到的一个报错是：模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是：torch.size([16,3,24,24])。这四个参数的含义如下：16
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
深度学习、模型架构、可拓展性、神经网络、机器学习1.背景介绍深度学习作为人工智能领域最前沿的技术之一，在图像识别、自然语言处理、语音识别等领域取得了突破性的进展。深度学习模型的成功离不开其强大的学习能力和可拓展性。本文将深入探讨深度学习算法的原理、模型架构设计以及可拓展性的关键要素，并通过代码实例和实际应用场景，帮助读者理解如何搭建可拓展的深度学习模型架构。2.核心概念与联系深度学习的核心概念是人
远程调试Python脚本之ptvsd 工头阿乐 PyTorch 深度学习 python 开发语言
深度学习文章目录深度学习前言前言有时候需要远程调试Python脚本，怎么办呢…以下这段代码用于远程调试Python脚本，特别是通过VisualStudioCode（VSCode）的远程调试功能。它会在指定的服务器IP和端口上等待调试器的连接。#检查是否提供了服务器IP和端口ifargs.server_ipandargs.server_port:#远程调试-参见https://code.visual
yolo模型coco数据集详解工头阿乐深度学习 YOLO
深度学习文章目录深度学习前言前言instances_train2017.json和instances_val2017.json文件均分为五大部分，这五部分对应的关键字分别为info、licenses、images、annotations、categories。{"info":info,"licenses":[license1,license2,license3,...],"images":[ima
图像处理之白平衡（附源码） FPGA工程狮-阿水 Python图像处理图像处理人工智能 python isp
图像处理之白平衡（附源码）概要白平衡（WhiteBalance）是图像处理和摄影中的一种技术，旨在消除由于光源色温差异导致的颜色偏差，使得图像中的白色和其他颜色呈现出自然、真实的效果。基本概念白平衡是调整图像中各个颜色通道（红色、绿色和蓝色）的亮度和色彩平衡，以消除由不同光源（如日光、白炽灯、荧光灯等）产生的色偏。其目的是让图像看起来像是在中性白光下拍摄的，从而确保图像中的白色看起来确实是白色，其
机器学习之向量化珠峰日记 AI理论与实践机器学习人工智能
文章目录向量化是什么为什么要向量化提升计算效率简化代码与增强可读性适配模型需求怎么做向量化数据预处理特征提取特征选择向量构建机器学习与深度学习中向量化的区别数据特征提取方式机器学习深度学习模型结构与复杂度机器学习深度学习计算资源需求机器学习深度学习数据规模适应性机器学习深度学习向量化是什么向量化是把数据转化为向量形式进行表示与处理的过程。在机器学习与深度学习的范畴内，现实中的各类数据，像文本、图像
Lec01-什么是安全？蛋蛋deべ忧桑安全
本文使用人工智能协助翻译，内容仅供参考，可能有错误或遗漏。如果你对内容或超链接有疑问，可以查看原文。参考资料地址：https://github.com/PKUFlyingPig/MIT6.16006.1600课程团队：HenryCorrigan-Gibbs,YaelKalai,BenKettle(TA),NickolaiZeldovich2022年秋季[!warning]免责声明本套笔记为正在进行
聊聊Python都能做些什么 ·零落· Python入门到掌握 python 开发语言
文章目录一、Python简介二、Python都能做些什么1.Web开发2.数据分析和人工智能3.自动化运维和测试4.网络爬虫5.金融科技三、Python开源库都有哪些1.Web开发2.数据分析和科学计算3.机器学习和深度学习4.网络爬虫5.自动化和测试6.其他常用库四、相关链接一、Python简介Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。它最初由GuidovanRossu
NLP高频面试题（四）——BN和LN的区别与联系，为什么attention要用LN Chaos_Wang_ NLP常见面试题自然语言处理人工智能
在深度学习模型中，Normalization是一种极为重要的技巧，BatchNormalization（BN）和LayerNormalization（LN）是其中最为常用的两种方法。然而，二者在实际应用中有着明显的区别与联系，尤其在Transformer的Attention机制中，LN有着独特的优势。一、BN与LN的核心区别与联系1.BatchNormalization(BN)BN的思想源于一个叫
Browser Use开启AI辅助网页操作新时代 CodeJourney. python 人工智能算法数据库
在当今数字化时代，人们的工作和生活与互联网紧密相连。每天，我们都要花费大量时间在各类网站之间穿梭，进行诸如填写表单、查询信息、比价等重复性操作。这些工作不仅耗费精力，还容易因疲劳而出错，严重影响了工作效率。而现有的自动化工具，要么需要掌握专业的编程知识才能使用，要么在功能上存在局限性，让普通技术用户望而却步。不过，随着人工智能技术的飞速发展，一款名为BrowserUse的开源项目应运而生，为我们带
征程 6 VP简介与单算子实操自动驾驶算法
1.如何理解VPVP，全称VisionProcess，指UCP中的视觉处理功能模块。Backends，指UCP框架中的可分配处理单元。VP模块主要用于模型的前后处理环节，在地平线统一架构中，多种硬件均已搭载了图像处理的算子，而VP模块将图像处理相关的硬件调用进行了封装，通过设置backend来选择不同的硬件方案（若不指定backend，UCP会自动适配负载更低的处理单元），从而平衡开发板负载。VP
ChatGPT + Vue3：如何打造 AI 智能助手？ Js_x chatgpt 人工智能
引言人工智能（AI）正快速渗透到前端开发领域，越来越多的开发者希望将ChatGPT集成到自己的应用中，为用户提供智能对话、自动回复、辅助决策等功能。本文将介绍如何使用Vue3+OpenAIAPI搭建一个AI智能助手，让你的应用拥有强大的AI交互能力。1.项目准备1.1技术栈选择本项目将使用以下技术：Vue3-现代化的前端框架，响应式强，适合构建交互式应用。Vite-高效的Vue3项目构建工具，提升
用 AI 提高开发效率：自动生成代码、优化 SQL 查询、写测试用例 Js_x 人工智能 sql 测试用例
引言人工智能（AI）正在深刻改变软件开发行业。从代码自动补全到SQL查询优化，再到自动化测试，AI工具已经成为开发者提高生产力的重要助手。本文将介绍ChatGPT、GitHubCopilot、Tabnine等AI编程工具的实际应用，帮助开发者更高效地编写代码、优化数据库查询，并自动生成测试用例。1.AI代码生成：提升开发效率1.1ChatGPT代码生成ChatGPT具备强大的自然语言处理能力，可以
RAG 在多模态数据处理中的应用探索：结合图像与文本生成 hy098543 AIGC
目录引言多模态数据处理的挑战与需求数据异质性与融合难题多样化应用场景的需求RAG在图像与文本生成中的应用架构图像检索与文本生成协同跨模态特征融合与生成关键技术与实现细节图像特征提取与表示文本检索与语义理解跨模态生成模型训练应用案例分析智能设计辅助医疗影像报告生成结论引言随着信息技术的飞速发展，数据呈现出多模态的特性，即包含文本、图像、音频、视频等多种形式。在自然语言处理（NLP）和计算机视觉（CV
理解深度学习1-简介 shangjg3 PyTorch深度学习实战深度学习人工智能
人工智能（AI）旨在打造模仿智能行为的系统。它覆盖了众多方法，涵盖了基于逻辑、搜索和概率推理的技术。机器学习是AI的一个分支，它通过对观测数据进行数学模型拟合来学习决策制定。这个领域近年来迅猛发展，现在几乎（虽不完全准确）与AI同义。深度神经网络是一类机器学习模型，将其应用到数据上的过程称为深度学习。目前，深度网络是最强大和最实用的机器学习模型之一，常见于日常生活中。我们常常用自然语言处理（Nat
人工智能专业毕业设计选题清单：热点课题推荐 HaiLang_IT 人工智能算法 python
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了人工智能专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇
RAG问答系统：检索增强生成框架 ZhangJiQun&MXP 2021 论文教学大模型语言模型
目录RAG（Retrieval-AugmentedGeneration）框架一、RAG框架的定义二、RAG框架的工作原理三、RAG框架的举例说明四、RAG框架的优势RAG问答系统二、工作流程三、优势四、应用场景RAG（Retrieval-AugmentedGeneration）框架即检索增强生成框架，是一种结合了信息检索技术与语言生成模型的人工智能技术。以下是对RAG框架的详细解释及举例说明：一、
【Java】已解决：`java.sql.SQLSyntaxErrorException: SQL` 屿小夏 java sql 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
AIGC带来数据革命：R语言如何成为数据科学家的秘密武器？程序边界 AIGC r语言开发语言
文章目录一、R语言的基础特性1.1R语言的起源与发展1.2R语言的核心优势二、R语言在AIGC中的应用场景2.1数据预处理与清洗2.2文本分析与生成2.3机器学习与模型构建2.4数据可视化与报告生成三、R语言在AIGC中的具体案例3.1金融数据分析与预测3.2医疗数据分析与建模3.3社交媒体数据分析与情感分析四、R语言在AIGC中的未来展望4.1与深度学习框架的集成4.2与云计算平台的集成4.3与
PyTorch 深度学习实战（12）：Actor-Critic 算法与策略优化进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们介绍了强化学习的基本概念，并使用深度Q网络（DQN）解决了CartPole问题。本文将深入探讨Actor-Critic算法，这是一种结合了策略梯度（PolicyGradient）和值函数（ValueFunction）的强化学习方法。我们将使用PyTorch实现Actor-Critic算法，并应用于经典的CartPole问题。一、Actor-Critic算法基础Actor-Cri
PyTorch 深度学习实战（17）：Asynchronous Advantage Actor-Critic (A3C) 算法与并行训练进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们深入探讨了SoftActor-Critic(SAC)算法及其在平衡探索与利用方面的优势。本文将介绍强化学习领域的重要里程碑——AsynchronousAdvantageActor-Critic(A3C)算法，并展示如何利用PyTorch实现并行化训练来加速学习过程。一、A3C算法原理A3C算法由DeepMind于2016年提出，通过异步并行的多个智能体（Worker）与环境交互
OpenCV-Python实战（1）——OpenCV简介与图像处理基础数字化转型2025 AI人工智能方向 opencv python 图像处理
OpenCV介绍Python安装OpenCV：对于Linux和Windows操作系统，首先需要在shell或cmd中运行以下命令安装NumPy：pipinstallnumpy。然后再安装OpenCV，可以选择仅安装主模块包：pipinstallopencv-python，或者安装完整包（包括主模块和附加模块）：pipinstallopencv-contrib-python。OpenCV主要模块：O
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS