秃头小苏

深度学习语义分割篇——FCN原理详解篇

作者简介：秃头小苏，致力于用最通俗的语言描述问题

往期回顾：目标检测系列——开山之作RCNN原理详解目标检测系列——Fast R-CNN原理详解
目标检测系列——Faster R-CNN原理详解

近期目标：写好专栏的每一篇文章

支持小苏：点赞、收藏⭐、留言

没想到今天是创作两周年，必须浅浅更新一篇⛳⛳⛳

深度学习语义分割篇——FCN原理详解篇

写在前面

在过往的博客中，我已经介绍了几种经典神经网络（VGG、GoogleNet、Resnet等等）在图像分类上的应用，这些都是非常基础却重要的内容，大家务必要掌握，不了解的可以进入个人主页搜索了解详情。在目标检测方面，我有讲解过yolo系列的原理，点击☞☞☞了解详情。但是yolo代码部分还没有出过相关教程，看看后面是否有时间吧！！！此外，目标检测方面我也详细的介绍了Rcnn的一系列原理及Faster rcnn的源码解析，链接如下：

目标检测系列——开山之作RCNN原理详解
目标检测系列——Fast R-CNN原理详解
目标检测系列——Faster R-CNN原理详解
还不懂目标检测嘛？一起来看看Faster R-CNN源码解读

对于语义分割自己也一直没有详细了解过，最近也是学习了一下语义分割的开山之作——FCN网络，全称为Fully Convolutional Networks for Semantic Segmentation 。我先来说说我以前对语义分割网络的主观认识，那就是一个字难，正常的学习路线是先图像分类，接着是目标检测，最后才是语义分割。如果你看过上文提到的Faster Rcnn源码的话，你会发现其理解起来还是很难的，而且代码量也非常的大。这样一来，我自然会认为语义分割的代码是恐怖级别的，但是通过我这几天的学习，我发现不管是FCN的原理还是代码都是相对简单的【只针对FCN，其它语义分割网络还没学习，因此也不清楚它们的难度如何】。说这个就是想告诉大家不要害怕语义分割，它远没有想象中的那么难！！！

各位准备好了嘛，我们将一起搭上语义分割号列车，启航！！！

语义分割概念

我想来看这部分内容的读者应该已经对语义分割的概念有所了解了，大家也别嫌我啰嗦，我还是打算给大家来辨析辨析什么物体分类，什么是目标检测，什么是语义分割以及什么是实例分割。物体分类很好理解啦，就是给出一张狗的图片，计算机把这张图片的类别辨别为狗，给出一张猫的图片，计算机把这张图片的类别辨别成猫。下面主要来看看目标检测、语义分割和实例分割的区别，如下图所示：

从上图可以看出，目标检测只会把物体用方框框出来，也会识别出类别（图中未画）。语义分割则会顺着物体的边缘把物体标出来，同样会识别出类别，语义分割可以看成是更加精细的目标检测。实例分割中的实例指的是个体，我们从图中可以发现，实例分割中的不同三人用不同颜色表示，即识别出每一个个体，实例分割可以看成更加精细的语义分割。

相信大家通过上图和相关解释已经明白了物体分类、目标检测、语义分割和实例分割的区别。那么接下来我将为大家详细的讲讲语义分割的开山之作——FCN。

FCN网络整体结构✨✨✨

我们先来看看FCN的整体结构，如下图所示：

大家看到上图的第一反应是什么呢？反正我看到是有点惊讶的，惊讶于语义分割的网络竟然如此简单，不知道大家有没有和我一样的感受呢！

虽然简单，但我们还是要来解释一下，特别要注意理解语义分割的思想。首先，输入是一张RGB三通道的图片，然后会输入特征提取网络提取特征，上图的特征提取网络为AlexNet。（对AlexNet不熟悉的可以点击☞☞☞了解详情）需要注意的是传统AlexNet的后三层为全连接层，而FCN中采用的是卷积层，这样将全连接层换成卷积层可以适应不同尺度的图片。现在看来，这种转化你可能觉得不足为奇，但是大家请注意，这篇文章是2015发表的，那时候有这种思想还是非常可贵的。我们注意到，在特征提取网络的最后一个特征图的通道数是21，这个21是很有讲究的喔，它对应着我们要分类的类别总数，包括背景。论文中使用的是VOC数据集，一个有20个前景类别和一个背景共21个类别数。接着我们会将刚刚得到的chanel=21的特征图进行上采样，将其尺寸变为原始输入图像大小【注：通道数还是21】。最后我们会和语义分割的标注图像（GT）计算损失，最终，这个21通道的原图大小的特征图的每个像素都有21个通道，即有21个值，我们取最大的一个值，其索引对应的类别就是该像素的所属类别！！！

FCN的整体结构就为大家介绍到这里，相信大家心中还是存有疑惑，特别是最后一部分，不用担心，下文我会详细的为大家讲述FCN的细节。

FCN细节理解✨✨✨

在FCN的论文中，主要给出了三种FCN的结构，分别是FCN-32，FCN-16，FCN-8s，如下图所示：

上图的几种网络的backbone都是基于VGG16网络的。【注：FCN-32s-fixed不是end-to-end，这里就不讨论了】

大家是不是对上图的32s、16s和8s不是很理解呢，这个表示的是最后上采样的倍数。我也会在下文详细为大家介绍FCN的这三种结构，届时大家就会理解了。

FCN-32s结构

上文说过，这几个结构的backbone都是基于VGG16的，因此大家需要对VGG16有一点的认识，不清楚的点击☞☞☞了解详情。【注：在FCN整体结构时使用的是AlexNet，这里为VGG16，大家注意一下就好】

为方便大家阅读，这里贴出VGG16网络结构图，如下图所示：

有了VGG16网络的基础，看FCN-32就非常简单了，如下图所示：

图片来自B站霹雳吧啦Wz

现对上图做相关解释。首先一张任意大小的图片经过VGG16下采样了32倍，此时特征图尺寸为 $\frac{h}{32}×\frac{w}{32}×512$ ，这部分对应着VGG16网络中的卷积层。接着我们来看上图黄色虚线框住的三个卷积层，其对应着VGG16网络中最后三个全连接层，这样做的原因上文已经说过了，是为了使网络可以适应不同尺寸的输入，这部分结束后特征图的尺寸变为 $\frac{h}{32}×\frac{w}{32}×num\_{cls}$ ，其中 $num\_cls$ 为语义分割的总类别数，对于VOC数据集来说， $num\_cls=21$ 。

最后我们会经过一个上采样，如使用转置卷积或双线性插值算法进行上采样，将刚刚得到的特征图还原为 $h×w×num\_cls$ 尺寸。【对转置卷积不了解的可以看此篇文章转置卷积部分了解详情。】

到这里，其实整个FCN网络就介绍完了，现在来说说FCN的损失是如何计算的。先来看看我们的真实值（GT）是什么，其是一张张P模式的图片，有关图片的P模式，可以点击本文中附录–>VOC语义分割标注了解详情。相信你看了附录中的解释，你已经知道了GT是一张张单通道的图片，其尺寸为 $h \times w \times 1$ 。刚刚由VGG网络得到的输出尺寸为 $h×w×num\_cls$ ，我们会根据GT和得到的输出计算出损失LOSS，大致过程如下：

上文我没有给出cross_entropy的具体是怎么做的，大家这里先不用着急，在下一篇FCN代码实战中我会通过代码详细的为大家讲解这个cross_entropy函数。这里我还想强调一点——损失函数的构造是我们实现程序功能的重要一环，它决定了输出的走向，即输出不断的拟合GT，当我们的网络训练的足够好时，网络的输出就和GT足够的接近！！！

FCN-16s结构

上节介绍了FCN-32s的结构，这节将来讲解FCN-16s的结构。32s和16s表示最后上采样的倍数分别为32倍和16倍。FCN-16s的结构如下图所示：

图片来自B站霹雳吧啦Wz

大家看到这个结构不知道是不是有点熟悉，我感觉有点像特征金字塔（FPN）结构，利用了不同尺度的信息，熟悉FPN的我觉得就非常好理解上图了。

我也来简要的解释一下，首先我们通过VGG后会分成①和②两条路，①路径和FCN-32s大致相同，只是在上采样时只将原图尺寸扩大了两倍，由 $\frac{h}{32}×\frac{w}{32}×num\_{cls}$ 变成 $\frac{h}{16}×\frac{w}{16}×num\_{cls}$ 。②路径的输入是VGG网络下采样16倍时的输出，尺寸为 $\frac{h}{16}×\frac{w}{16}×512$ ，然后经过一个1×1的卷积核将通道数变成与①相同的通道数，即 $num\_class$ 。①和②完成后，会将两步的结果相加然后再进行上采样，此时上采样的倍数为16，这样我们就得到了我们FCN-16s的输出了！！！

FCN-8s结构

明白了FCN-32s和FCN-16s的结结构，再来看FCN-8s的结构就更简单了。此时用到了VGG网络三个下采样倍数（32倍、16倍、8倍）的输出，其结构如下图所示：

图片来自B站霹雳吧啦Wz

关于FCN-8s的结构我就不带大家一点点分析了，相信你看懂了FCN-32s和FCN-16s再看FCN-8s会毫无压力！！！

小结

FCN的理论部分就为大家介绍到这里了，这部分我觉得大家理解起来应该还是蛮简单的，唯一的难点可能就在损失函数那部分，关于这点，我会在下一篇代码实战中为大家详细解释，同时帮助大家理解FCN的更多细节。

论文下载地址

FCN论文下载

参考链接

FCN网络结构详解(语义分割)

全连接卷积神经网络 FCN

附录

VOC语义分割标注✨✨✨

这个部分我来为大家讲讲VOC语义分割的标注，这部分文件存储在VOC2012/SegmentationClass文件夹下，部分内容如下：

可以看到，这部分文件的格式是png格式。它们图像的模式是P模式，即调色板模式，是单通道的图像。单通道的图像？？这明明是彩色的啊，怎么会是单通道的图像？？我相信你一定有这样的疑问，我们直接用实验来说话。

为方便做对照，我们使用VOC2012/JPEGImages中的三通道图片2007_000032.jpg 和VOC2012/SegmentationClass中的2007_000032.png图片做对比，首先，我们分别载入两种图片并显示一下，代码如下：

img2 = Image.open('D:/数据集/VOC/VOCtrainval_11-May-2012/VOCdevkit/VOC2012/JPEGImages/2007_000032.jpg')
img3 = Image.open('D:/数据集/VOC/VOCtrainval_11-May-2012/VOCdevkit/VOC2012/SegmentationClass/2007_000032.png')
plt.imshow(img2)
plt.imshow(img3)

img2为RGB模式图片（左），img3为P模式图片（右），如下图：

接着我们可以使用.mode方法打印看看图像的模式是否是我们所说的RGB和P，代码如下：

print("image2:",img2.mode)
print("image3:",img3.mode)

结果：

可以看到，确实和我们所说的一样，它们一个是RGB模式，一个是P模式！！！最后我们来看看最重要的一点，即RGB模式是三通道的图像，而P模式是单通道的图像，代码如下：

# 将PIL格式的图像转化为numpy格式
img2_np = np.array(img2)
# 打印img2的尺寸
print("image2_shape:",img2_np.shape)
img3_np = np.array(img3)
print("image3_shape:",img3_np.shape)

结果：

实验为证，现在我想大家是能够接受这样的一个事实了叭。【记住喔，这个对理解FCN还是很重要的】

这里只为大家证明我们使用的VOC标注信息是P模式的通道的图像，关于图像的P模式感兴趣的大家自行查阅资料。

我想大家肯定还是非常好奇，为什么单通道的图片可以是彩色的。这里我简单的说两句，它其实是有一个调色板的，单通道的图片有0-255个灰度值，每一个灰度值就是一个索引，会在调色板中找到对应的颜色，下图展示了调色板中0-4的颜色，一共有0-255个。

看上图就非常好理解了，比如P模式某个像素灰度值为0，则它会在调色板中找0对应的颜色，即[0, 0, 0]，为黑色，即P模式下所有灰度值为0像素颜色都是黑色。需要注意的是调色板中的不同索引对应的颜色是可以修改的，如我们将灰度值0的调色板由[0, 0, 0]修改成[255,255,255]，则现在P模式下所有灰度值为0像素颜色都为白色。

如若文章对你有所帮助，那就

语义分割模型的轻量化与准确率提升研究 pk_xz123456 仿真模型深度学习算法 transformer 深度学习人工智能算法数据结构
语义分割模型的轻量化与准确率提升研究1.引言语义分割是计算机视觉领域的核心任务之一，它要求模型为图像中的每个像素分配一个类别标签。随着深度学习的发展，语义分割模型在多个领域得到了广泛应用，如自动驾驶、医学影像分析、遥感图像解译等。然而，现有的语义分割模型往往面临两个主要挑战：模型复杂度高导致难以部署在资源受限的设备上，以及准确率仍有提升空间以满足实际应用需求。本文将从模型轻量化和准确率提升两个角度
AIGC领域AI作画：在数字雕塑中的应用实践 AI原生应用开发 AI 原生应用开发 AIGC AI作画 ai
AIGC领域AI作画：在数字雕塑中的应用实践关键词：AIGC、AI作画、数字雕塑、生成对抗网络、3D建模、艺术创作、深度学习摘要：本文深入探讨了AIGC(人工智能生成内容)技术在数字雕塑领域的创新应用。我们将从技术原理、算法实现到实际案例，全面解析AI如何赋能传统数字雕塑创作流程。文章首先介绍AIGC在艺术创作中的背景和发展现状，然后详细讲解核心算法原理和数学模型，接着通过实际项目案例展示AI作画
计算机网络第三章——数据链路层（考研和期末复习都适用）成为佬计算机网络背诵码住！计算机网络考研网络协议
目录1、数据链路层使用的信道2.数据链路层概述3.数据链路层的三个重要问题：封装成帧、差错检测、可靠传输。封装成帧透明传输差错检测循环冗余检验的原理（CRC）：冗余码的计算冗余码的计算举例帧检验序列FCSps：4.点对点协议PPP（目前使用最广泛的数据链路层协议）PPP协议的特点PPP协议应满足的需求PPP协议的组成PPP协议的帧格式5.使用广播信道的数据链路层局域网的数据链路层媒体共享技术：以太
C++ unordered_set基础概念、对象创建、赋值操作、数据插入、数据删除、代码练习 1 2 每天搬一点点砖 c++数据结构开发语言
unordered_set的底层是哈希表。增删改查的时间复杂度：数组O(n)二叉树O(logn)哈希表O(1)哈希表的本质原理：哈希键--（哈希函数）--哈希值--（取模、位于）--桶/ID这里的哈希键一般是任意类型，所以需要先通过哈希函数转换为整数，我们叫他哈希值，再通过取模（一般使用的时候采用位于运算），映射到某个桶中。这样就可以把任意类型的数据存储到数组中，且能够快速查找到。桶：下标索引又叫
Flask 框架：深入浅出理解其工作原理与机制 chilavert318 熬之滴水穿石 flask python 后端
今天写不发相关连载了，而是将我近段时间接触到的内容做次分享。这几天，使用了开源的DashGO框架，了解到了这个开源的底层是Flask框架。所以花了点时间了解一下，现在Web开发领域，各种框架层出不穷，看了一下Flask的源码，作为一款轻量级的PythonWeb框架，还是凸显了简洁、灵活的特点。今天就深入浅出地将我理解的Flask讲解出来。一、Flask是什么简单来说，Flask是一个使用Pytho
吐血整理！电动车安全充电原理大公开！：比如我有一辆48度的电动汽车，我在高速上遇到480kw充电桩，如何能够保证汽车安全充电，汽车安全充电的原理是什么 -慧知开源充电桩平台文慧的科技江湖更新日志 -(慧哥)慧知充电桩平台安全汽车大数据人工智能架构开源直流充电桩
确保电动汽车在480kW超充桩上安全充电的核心在于电池管理系统（BMS）、热管理系统、充电桩与车辆的智能协同保护机制。安全充电的核心原理智能功率协商（握手协议）充电前，车辆BMS会与充电桩通信，自动协商最大可接受功率（如您的48度电池可能峰值仅支持100-150kW，而非480kW）。实际充电功率由车辆BMS决定，而非充电桩。充电桩仅提供“可用功率上限”，车辆只会取用自身能承受的部分。电池管理系统
车载以太网-TC8测试-UT(Upper Tester) 天赐好车车载以太网车载以太网 TC8 UT
目录一、技术原理：指令体系与协议适配1.**指令格式与传输机制**2.**协议栈交互逻辑**3.**规范遵循与版本演进**二、测试应用：TC8测试场景与案例1.**TCP协议栈深度验证**2.**ARP协议健壮性测试**3.**SOME/IP服务动态管理**三、实现挑战与解决方案1.**实时性要求**2.**安全性风险**3.**协议栈适配差异**四、集成流程与工具链1.**UT开发与部署**2.
【零基础学AI】第33讲：强化学习基础 - 游戏AI智能体 1989 0基础学AI 人工智能游戏 transformer 分类深度学习神经网络
本节课你将学到理解强化学习的基本概念和框架掌握Q-learning算法原理使用Python实现贪吃蛇游戏AI训练能够自主玩游戏的智能体开始之前环境要求Python3.8+PyTorch2.0+Gymnasium(原OpenAIGym)NumPyMatplotlib推荐使用JupyterNotebook进行实验前置知识Python基础编程（第1-8讲）基本数学概念（函数、导数）神经网络基础（第23讲
MySQL数据库进阶(八)———查询优化与执行计划深度解析【本人】数据库数据库 mysql
前言在掌握了索引原理后，我们将深入MySQL最核心的性能优化领域——查询优化与执行计划分析。本文将从优化器工作原理到实战调优技巧，全方位提升你的SQL性能优化能力。一、查询优化的本质：从分钟级到毫秒级的蜕变查询优化是数据库系统的核心能力，MySQL通过优化器将SQL转换为高效执行计划。优化前后的性能差异可能达到千倍级：--优化前（执行时间12.8秒）SELECT*FROMordersoJOINus
Kotlin Flow 冷流和热流麦田里的守望者-Jiang Kotlin android kotlin rxjava android
本文主要分析了冷流和热流的相关实现原理，原理逻辑长而复杂。特别是涉及热流SharedFlow相关实现原理时，逻辑更是抽象，理解比较困难。本文比较长，建议根据目录选择分段阅读，可以先看基础概念和冷流，再分别看热流SharedFlow和StateFlow。阅读本文时，可以带着以下问题去思考：冷流和热流指的是什么？在业务开发中，冷流和热流可以用来做什么或者解决什么问题？冷流和热流的区别是什么？冷流的执行
Python深度学习实践：建立端到端的自动驾驶系统 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：建立端到端的自动驾驶系统1.背景介绍自动驾驶系统是当今科技领域最具挑战性和前景的应用之一。它融合了计算机视觉、深度学习、规划与控制等多个领域的先进技术,旨在实现车辆的自主感知、决策和操控。随着人工智能技术的不断发展,越来越多的公司和研究机构投入了大量资源来开发自动驾驶系统。Python作为一种高效、易学且开源的编程语言,在这一领域扮演着重要角色。本文将探讨如何利用Pyth
C++游戏开发的一些高级常识（持续更新） Silver Gamer 迈向游戏引擎工程师 C++
C++游戏开发高级常识（纲领整理）前言序章C++开发细节基础1.C++类型转换2.C++静态相关3.C++函数指针4.C++函数指针返回值5.C++常量6.C++开发常用设计模式7.常用STL8.C++面向对象理解9.C++构造与析构10.虚拟内存与物理内存11.C++多态实现原理12.操作系统运行程序流程13.智能指针及其实现14.malloc和alloc的关联与详细过程15.C++内存模型16
Java 并发编程：ReentrantLock原理与实战详解
一、引言在多线程编程中，线程安全始终是一个关键议题。Java在早期版本中提供了synchronized关键字作为内置锁机制，以支持基本的同步控制。然而，随着并发程序复杂度的提高，synchronized的局限性日益显现，主要体现在以下几个方面：功能受限：synchronized不支持尝试加锁、超时获取、可中断获取等高级功能。缺乏灵活性：一旦进入临界区就只能等待，无法主动退出。可观测性差：开发者无法
AIGC空间智能在服装设计领域的颠覆性变革 AI天才研究院 ChatGPT 实战 ChatGPT AI大模型应用入门实战与进阶 AIGC ai
AIGC空间智能在服装设计领域的颠覆性变革关键词：AIGC、空间智能、服装设计、数字孪生、生成式AI、3D人体建模、智能设计系统摘要：本文深入探讨AIGC（人工智能生成内容）与空间智能技术在服装设计领域的融合创新，揭示其如何通过三维人体建模、场景模拟、智能生成算法重构传统设计流程。从技术原理层解析空间智能的核心模块，结合生成对抗网络（GAN）、Transformer模型等前沿算法，展示从创意生成到
【Docker基础】Docker网络模式：Host模式深度解析 IT成长日记容器技术深度解析与实践 docker 网络容器网络模式 Host
目录1Docker网络模式概述1.1Docker网络模式对比2Host模式核心技术解析2.1网络命名空间共享机制2.2架构原理2.3核心配置参数3Host模式深度剖析3.1网络接口共享机制3.2端口空间共享特性3.3网络性能优势分析4与其他网络模式的对比分析4.1与Bridge模式对比4.2与Container模式对比5典型应用场景5.1高性能网络服务部署5.2网络代理与负载均衡5.3系统级监控与
Docker网络模型深度解析｜Docker｜网络模型｜容器化 concisedistinct 运维编程开发技术栈 Docker docker 容器运维
目录1.Docker网络模型概述1.1Docker网络的基本概念1.2Docker的主要网络模式2.Bridge网络模式2.1Bridge模式的工作原理2.2Bridge模式的网络配置2.3Bridge模式的应用场景3.Host网络模式3.1Host模式的工作原理3.2Host模式的优缺点3.3Host模式的应用场景4.Overlay网络模式4.1Overlay模式的工作原理4.2Overlay模
Python元类基础知识示例深度剖析，从新手小白成为Python编程高手只存在于虚拟的King python 开发语言深度学习学习经验分享计算机网络程序人生
文章目录引言一、什么是元类？二、元类的工作原理三、如何定义元类四、元类的应用场景五、元类的注意事项六、结论关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四、Python工具包+项目源码合集①Python工具包②Python实战案例③Python小游戏源码五、面试资料六、Python兼职渠道引言Python是一种强大的编程语言，一部
Python 爬虫实战：Selenium 爬取豆瓣相册（图片分类 + 标签提取）西攻城狮北 python 爬虫 selenium
一、引言豆瓣作为国内知名的社区平台，其相册功能允许用户上传和分享各类图片，涵盖电影海报、音乐专辑、生活记录等多个领域。这些图片数据对于了解用户兴趣、进行内容推荐和市场调研具有重要价值。然而，豆瓣对直接的数据访问设定了诸多限制，因此，本文将介绍如何通过Python爬虫技术结合Selenium自动化工具，合法高效地爬取豆瓣相册图片，并运用深度学习技术实现图片分类和标签提取。二、开发环境搭建（一）编程语
PagedAttention和Continuous Batching 流浪大人大模型深度学习人工智能机器学习
PagedAttention是什么PagedAttention是一种用于优化Transformer架构中注意力机制的技术，主要用于提高大语言模型在推理阶段的效率，特别是在处理长序列数据时能有效减少内存碎片和提高内存利用率。它借鉴了操作系统中虚拟内存分页机制的思想。工作原理传统注意力机制的局限性：传统的注意力机制在处理长序列时，需要为每个位置计算注意力得分并存储中间结果，这会导致内存占用随着序列长度
【深度学习】大模型GLM-4-9B Chat ，微调与部署(3) TensorRT-LLM、TensorRT量化加速、Triton部署 XD742971636 深度学习机器学习深度学习人工智能
文章目录获取TensorRT-LLM代码：构建docker镜像并安装TensorRT-LLM：运行docker镜像：安装依赖魔改下部分package代码：量化：构建图：全局参数插件配置常用配置参数测试推理是否可以代码推理CLI推理性能测试小结验证是否严重退化使用NVIDIATriton部署在线推理服务器代码弄下来编译镜像启动容器安装依赖量化构建trtengines图Triton模板说明实操发起Tr
Swift 析构过程 wjs2024 开发语言
Swift析构过程引言在Swift编程语言中，析构过程是内存管理的重要组成部分。它涉及到对象在被释放时的资源清理工作。Swift通过自动引用计数（ARC）机制来管理内存，但某些情况下，手动管理内存也是必要的。本文将深入探讨Swift中的析构过程，包括其原理、实现方式以及注意事项。自动引用计数（ARC）在Swift中，每个类实例都有一个与之关联的引用计数器。当一个对象被创建时，其引用计数器被初始化为
Nginx完全指南 - 从入门到精通（加强版）
目录1.Nginx简介与架构原理1.1什么是Nginx？1.2Nginx的核心优势1.2.1高并发处理能力1.2.2内存占用极低1.2.3模块化架构1.3Nginx工作原理详解1.3.1Master-Worker模型1.3.2事件驱动模型1.4Nginxvs其他Web服务器2.Nginx安装与环境准备2.1安装前准备2.1.1系统要求2.1.2依赖包安装2.2安装方式详解2.2.1包管理器安装（推
MQTT 是什么？一文读懂 MQTT 协议的原理与优势头发那是一根不剩了网络物联网
1，MQTT是什么MQTT（MessageQueuingTelemetryTransport）是一种发布/订阅消息协议，最早由IBM提出，用于低功耗、低带宽场景下的数据传输，尤其适用于物联网（IoT）设备通信。全称：MessageQueuingTelemetryTransport角色：定义“设备如何发送/接收消息”的规则（通信协议）关键机制：发布/订阅模型（Publish/Subscribe）它不
大白话解释深度学习中多尺度特征融合及其意义来自宇宙的曹先生深度学习人工智能
想象一下，你正在看一幅城市街道的照片。在这张照片中，你可能会看到：远处的小汽车，它们在图像中看起来很小。近处的大巴士，它们在图像中看起来很大。还有一些行人，他们可能在不同的距离上，大小各异。假设你想训练一个计算机程序来识别和分割这些不同的物体（汽车、巴士、行人）。如果这个程序只能在一个固定的尺度上“看”图像，比如说只能处理大物体，它可能会错过那些远处的小汽车，因为这些小汽车在图像中占据的像素很少。
记录一篇HTTPS的文章麦秸垛的守望者 https 网络协议 http
深入理解HTTPS：从发展历程到技术原理与前端实践一、HTTPS发展历程：从安全需求到行业标准的演进HTTPS（HyperTextTransferProtocolSecure）的诞生源于互联网安全通信的迫切需求。早期的HTTP协议以明文传输数据，存在严重的安全隐患，如数据窃听、篡改和身份伪造等问题。随着电子商务、在线支付等场景的兴起，保障数据传输安全成为亟待解决的问题。1994年：网景公司（Net
Puppeteer 库简介：背景、用法与原理超级土豆粉 typescript javascript 前端 html 开发语言
Puppeteer库简介：背景、用法与原理一、背景Puppeteer是Google官方推出的一个Node.js库，最初于2017年发布。它为开发者提供了一个高级API，用于通过编程方式控制Chrome或Chromium浏览器。Puppeteer主要用于自动化网页操作、爬虫、UI测试、生成PDF截图等场景。随着Web自动化需求的增长，Puppeteer逐渐成为前端开发、测试和数据采集领域的重要工具。
Git 子模块 (Submodule) 完全使用指南 BIBI2049 版本托管 Git Windows git TortoiseGit 子模块
Git子模块(Submodule)完全使用指南核心原理解析：子模块是什么？想象一下，你在开发一个大项目（父项目），需要用到另一个独立的项目（例如一个公共库、一个UI组件库）。你不想直接复制粘贴它的代码，因为那样就无法方便地获取那个库的后续更新。Git子模块就是来解决这个问题的。它允许你将一个Git仓库作为另一个Git仓库的子目录。最重要的核心原理：父项目不存储子模块的所有文件内容。它只存储一个“指
12.组件的实现原理青阳流月 vue3 前端 javascript vue.js
将一个大的页面分为多个组件,每个组件都可以完成独立的功能并且可以被复用。1.渲染组件从用户角度,是一个描述对象constmyComponent1={name:'myComponent1',data(){return{name:'wjt'}}}从渲染器角度,是一个特殊的虚拟DOMconstmyComponent2={//type:Fragment,//描述片段type:Text,//描述节点prop
内网穿透：在家本地也能搭建“公网服务器”？转发/直连、原理/操作一文读懂！
这里可以让你终于明白内网穿透是怎么回事了，再也不用求人帮忙搭服务器，自己动手soeasy内网穿透技术允许外网用户访问内网设备，解决了家庭网络中没有公网IP、防火墙端口屏蔽等问题。本文整理汇总介绍了三种实现方式：中转服务器、P2P打洞和路由器端口映射，每种方法都有其优缺点。同时提醒用户注意安全性，避免内网服务被攻击，并提供了快速上手的建议。0、引言你有没有遇到过这些问题？想在外地访问家里的NAS，但
TCP backlog工作机制 riverz1227 tcp/ip 网络服务器
Linux中的TCPbacklog：两个队列与丢连接的真相在高并发网络服务场景中，listen()的backlog参数常常被误解，许多TCP连接被悄悄丢弃时，我们甚至毫无察觉。近期在排查一条内核日志TCP:dropopenrequestfrom...时，对此翻阅整理了一些资料,就TCPbacklog在Linux中的工作原理、背后的两个关键队列机制，以及如何高效排查相关连接丢失问题,做些记录01｜什
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

深度学习语义分割篇——FCN原理详解篇

深度学习语义分割篇——FCN原理详解篇

写在前面

语义分割概念

FCN网络整体结构✨✨✨

FCN细节理解✨✨✨

FCN-32s结构

FCN-16s结构

FCN-8s结构

小结

论文下载地址

参考链接

附录

VOC语义分割标注✨✨✨

你可能感兴趣的:(深度学习,计算机视觉,目标检测,语义分割,FCN原理)