calvinpaean

Densely Connected Convolutional Networks 论文学习

Abstract

近来的工作证明，卷积网络深度越深，准确率就越高，而如果再加上一些 short connections 将靠近输入和输出的层连接起来，训练起来可以更高效。在这篇论文中，我们借由此发现，提出了 Dense Convolutional 网络（DenseNet），它将每一层和其他层通过前馈的方式连接。传统的网络假如有 $L$ 层，它就有 $L$ 个连接，每一层都和它后面的那一层直接连接，而我们的网络有 $\frac{L(L+1)}{2}$ 个连接。每一层都把它前面所有层的特征图当做输入，而它自己的特征图则作为它后面的所有层的输入。DenseNet有多个优势：它们缓解了梯度消失的问题，增强了特征传播，鼓励特征再利用，极大地降低了参数个数。我们在4个目标识别基准（Cifar-10，Cifar-100，SVHIN，ImageNet）上做了测试。DenseNet 相较于目前的 state of the art 的方法取得了显著的提升，而它的计算量更低。

1. Introduction

卷积神经网络（CNNs）在目标识别任务上已经成为主流的机器学习方法。尽管CNN的历史已有20年之久，但直到最近才因为电脑硬件和网络结构的提升，CNN才能够有效地训练起来。起初的 LeNet5 只有5层，VGG 也只有19层，直到2016年，Highway Network 和 ResNet 才使得网络突破100层。

随着CNN变得越来越深，一个新的研究课题就出现了：当输入和梯度信息沿着网络层传递时，该信息最后可能消失。最近很多论文都在讨论如何解决这个问题或相关问题。ResNets 和 Highway Networks 将信号通过 identity connections 从一层传递到下一层。Stochastic depth 在训练中随机丢弃一些层，缩小 ResNets，从而让信息和梯度更好地传递。FractalNets 将多个平行的层序列和不同个数的卷积模块重复连接，让深度看上去显得更深，在网络中也保留了许多 short paths。尽管这些方法在网络的拓扑结构和训练过程上不同，它们都有一个关键特点：在前面的层和后面的层之间构建 short paths。

在这篇论文我们提出了一个网络结构，将上面的想法蒸馏为一个简单的 connectivity pattern：为了确保各层之间流动信息的最大化，我们将所有层（特征图大小要匹配）都直接和其它层连起来。为了保留前馈的本质，每层都从之前所有的层取得输入，然后将它自己的特征图再传递给后续所有的层。图1展示了该网络结构。和 ResNets 不同，在特征传递到下一层之前，我们没有用 summation 将特征结合起来；相反，我们通过 concatenation 将它们结合起来。因此，第 $l$ 层就有 $l$ 个输入，它由之前所有卷积模块的特征图组成。它自己的特征图则传递到后续的 $L - l$ 个层。这样在 $L$ 层的网络中，一共有 $\frac{L(L+2)}{2}$ 个连接。而在传统的网络结构中，只有 $L$ 个连接。因为它具有 dense connectivity 的模式，我们将该方法称为 Dense Convolutional Network, DenseNet。

此 dense connectivity pattern 和传统卷积网络相比，参数个数要少很多，这是因为它无需重复学习冗余的特征图。传统的前馈结构可以看作为带有一个 state 的算法，该 state 从一层传递到下一层。每层从上一层读取 state，然后写给下一层。它会改变这个 state，但也将需要保留的信息传递下去。ResNets 通过恒等变换显式地将此信息保留。最近有人对 ResNets 做了改动，他们发现网络里的许多层其实贡献很少，这些层可以在训练过程中丢掉。这就让 ResNets 的 state 和递归神经网络RNN类似，但是 ResNets 因为自身的权值，参数个数要多得多。DenseNet 结构可以明显地区分出添加到网络的信息和保留的信息。DenseNet 层非常的窄（每层只有12个滤波器），只增加了很少的特征图，而没有更改任何其余的特征—最后的分类器基于所有的特征图来做决定。

除了参数效率更高，DenseNets 的另一个优势就是信息和梯度可以更好地在网络中流动。每一层都可以直接获取损失函数的梯度以及原始的输入信号，实现隐式的深度监督学习。这有助于训练更深的网络结构。此外，我们发现 dense connections 有正则化的作用，在小训练集上降低过拟合。

我们在4个基准数据集上做了测试（Cifar-10，Cifar-100，SVHIN，ImageNet）。与现有的方法比较，我们的模型需要的参数量更少，而准确率差不多。而且，在绝大多数的基准任务上，我们的方法都比 state of the art 的方法好很多。

2. Related Work

网络结构的探索已经成为神经网络研究的一部分。现代网络中层数不断增加，扩大了各网络之间的差异，促进人们去探索不同的连接模式，重新学习旧的研究思想。

在1980年代，就已经有人提出了一个类似于我们的 dense network 的级联结构。他们的工作关注在全连接多层感知机上，逐层地训练。然后，有人提出了利用批梯度下降来训练全连接级联网络。尽管在小数据集上有用，这个方法只对有几百个参数的网络有效。另一些论文中，他们通过 skip-connections 利用 CNN的多层级特征，进行视觉任务。

Highway Networks 首先提供了一种方法，高效率地、端到端地训练层数超过100层的网络。通过 bypassing paths 和 gating units，有几百层的 Highway Networks 可以没有任何难度地进行优化。Bypassing paths 是这些超深网络能够训练的关键因素。在 ResNets中，使用纯恒等映射作为 bypassing paths。ResNet 在许多的图像识别、定位、检测任务上取得了优异、破纪录的表现。最近，有人提出了 stochastic paths，成功训练了一个1202层的ResNet。Stochastic depth 在训练过程中随机丢弃一些层，从而提升深度残差网络的训练。这就说明，在训练中并不是所有的层都是需要的，在深度残差网络中有很多的冗余存在。使用 pre-activation，ResNets 也可促进1000层以上的网络的训练。

让网络更深（比如有 skip connections 的帮助）的一个正交方法就是增加网络的宽度。GoogLeNet 使用“Inception Module”，该 module 将不同大小滤波器输出的特征图 concatenate 起来。在“Resnet in resnet: Generalizing residual architectures” 中，提出了一个ResNets的变形，其中残差模块比较宽。事实上，简单地增加ResNet各层中滤波器的个数就能够提升模型表现，只要深度足够。FractalNets 通过较宽的网络结构也取得了优异的成绩。

DenseNet 没有利用很深或很宽的结构来获取表现力，而是通过“特征再利用”来挖掘网络的潜力，产生容易训练和参数高效的浓缩模型。将不同层学到的特征图 concat 起来，可以增加后面层输入的差异性，提升效率。这是 ResNets 和 DenseNets 的主要不同。和 Inception 网络相比，它也将不同层的特征 concat 起来，DenseNets 的做法要更简单、更高效一些。

其他的一些网络结构创新也有不错的效果。Network in Network 结构在卷积层中包含微型的多层感知机，提取更多复杂的特征。在 Deeply Supervised Network 中，内部层由辅助分类器直接地监督，这有助于网络前面的层接收梯度。Ladder Networks 在 autoencoders 中增加了 lateral connection，在半监督学习任务上取得不错的准确率。Deeply-Fused Nets 将不同 base 网络的中间层结合起来，促进信息流动。用 pathways 来增强网络，降低重建的损失，这也被证明可以改善图像分类模型。

3. DenseNets

假设我们有一张图片 $x_0$ ，输入进一个卷积网络。网络有 $L$ 层，每一层都使用了非线性变换 $H_l(\cdot)$ ， $l$ 表示层的序列号。 $H_l(\cdot)$ 可以是一个复合函数操作，如BN, ReLU, Pooling，或卷积。我们将第 $l$ 层的输出表示为 $x_l$ 。

ResNets. 传统的卷积前馈网络将第 $l$ 层的输出作为输入传递进第 $l + 1$ 层，就有下面的层变换： $x_l=H_l(x_{l-1})$ 。ResNets 增加了一个 skip-connections，通过一个恒等函数越过非线性变换：

$x_l = H_l(x_{l-1}) + x_{l-1}$

ResNets的一个优势就是，梯度能通过恒等映射直接从较后面的层传到前面的层。但是，恒等映射和 $H_l$ 的输出是通过 summation 结合的，这有可能阻碍信息在网络中的流动。

Dense connectivity. 为了进一步提升不同层之间信息的流通，我们提出了一个新的 connectivity pattern：在每一层和之后所有的层之间建立直接连接。图1展示了DenseNet的网络结构。因此，第 $l$ 层接收的特征图来自之前所有的层， $x_0,...,x_{l-1}$ ：
$x_l = H_l ([x_0, x_1,...,x_{l-1}])$

其中， $x_0, x_1,...,x_{l-1}]$ 表示各层（ $0, . . ., l - 1$ ）特征图的 concatenation。因为这种 dense connectivity, 我们称此网络为 DenseNet。为了让实现变得简单，我们将上面等式 $H_l(\cdot)$ 的多个输入 concat 起来，作为一个张量。

复合函数. 我们将 $H_l(\cdot)$ 定义为一个复合函数，它由三个连续的操作构成：BN, ReLU, 和 $3\times 3$ 卷积。

池化层. 如果特征图大小不同，上面等式中用到的 Concat 操作就不能使用。但是，卷积网络的一个核心组成就是下采样层，它能改变特征图的大小。为了能在网络中使用下采样，我们将网络分为多个密集连接的 dense blocks，如图2。我们将每个 block 之间的层称为 transition layers，进行卷积和池化操作。Transition layers 由一个 BN 层、一个 $1\times 1$ 卷积层以及一个 $2\times 2$ 的池化层构成。

Growth rate. 如果每个函数 $H_l$ 产生 $k$ 个特征图，第 $l$ 层就有 $k_0 + k\times (l-1)$ 个输入特征图， $k_0$ 是输入层的通道数。DenseNet 和现有的网络结构一个重要区别就是，DenseNet 可以有非常狭窄的层，比如 $k = 12$ 。我们将这个超参数 $k$ 称为网络的 growth rate。在第四节，我们将证明较小的 growth rate 够用了。这是因为，每一层都可以获得该 block 里前面层的特征图，也就是可以获得整体网络的 “collective knowledge”。人们可以将特征图看作为该网络的 global state。每一层都向这个 state 写入 $k$ 个特征图。Growth rate 控制着每一层向这个 state 写入新信息的量。Global state 一旦写好，就可以从网络的任何位置获取它，而不是像传统的网络结构，你要在层与层之间复制它。

Bottleneck layers. 虽然每一层只产生 $k$ 个输出特征图，但它通常有非常多的输入。在许多文献中都有提到，我们在每个 $3\times 3$ 卷积之前使用 $1\times 1$ 卷积，作为 bottleneck 层，降低输入特征图的个数，提升卷积效率。我们这个设计对于 DenseNet 尤其有效，我们将加入了 bottleneck 层（BN-ReLU-Conv( $1\times 1$ )-BN-ReLU-Conv( $3\times 3$ )）的 DenseNet 称为 DenseNet-B。在试验中，我们让每个 $1\times 1$ 卷积输出4000个特征图。

Compression. 为了进一步提升模型简洁性，我们可以在 transition layers 中降低特征图的个数。如果一个dense block 包含 $m$ 个特征图，我们让随后的 transition layer 产生 $\lfloor \theta m \rfloor$ 个输出特征图，其中 $0<\theta \leq 1$ 作为压缩乘数、当 $\theta=1$ 时，特征图的个数保持不变。我们将 $\theta<1$ 的DenseNet称作 DenseNet-C，在试验中我们设 $\theta=0.5$ 。如果我们既用了 bottleneck 也用了 transition layer ( $\theta<1$ )，我们就将之称为 DenseNet-BC。

实现细节. 在所有的数据集上，除了ImageNet，DenseNet 都有三个 dense blocks，每一个都有着相同的层数。在进入第一个 dense block之前，我们先对输入图像进行一个输出通道数为16（或是两倍于 DenseNet-BC的 growth rate）的卷积操作。对于卷积核大小为 $3\times 3$ 的卷积层，输入的每一边都进行了一个像素点的 zero-padding，保持特征图大小不变。在两个连续的 dense blocks 之间，我们用 $1\times 1$ 卷积和 $2\times 2$ average pooling 作为 transition layers。在最后一个 dense block末尾，执行一个 global average pooling 操作，然后是一个 softmax 分类器。三个 dense blocks 的特征图大小分别是 $32\times 32, 16\times 16, 8\times 8$ 。对于基本的DenseNet，我们用如下配置进行试验： ${L=40,k=12\},\{L=100,k=12\},\{L=100,k=24\}$ 。对于DenseNet-BC，网络的配置为 ${L=100,k=12\},\{L=250,k=24\},\{L=190,k=40\}$ 。

在ImageNet的实验中，对于 $224\times 224$ 的输入图像，DenseNet-BC 有4个 dense blocks。初始卷积层有2000个大小为 $7\times 7$ 、步长为2的卷积组成。所有其他层的特征图个数延续 $k$ 的设定。ImageNet上总体的网络结构如表1所示。

4. Experiments

Pls read paper for more details.

深度学习方法生成抓取位姿与6D姿态估计的完整实现 ZPC8210 ROS 深度学习人工智能
如何将GraspNet等深度学习模型与6D姿态估计集成到ROS2和MoveIt中，实现高精度的机器人抓取系统。1.系统架构text[RGB-D传感器]→[物体检测与6D姿态估计]→[GraspNet抓取位姿生成]→[MoveIt运动规划]→[执行抓取]2.环境配置2.1安装依赖bash#安装PyTorch(根据CUDA版本选择)pip3installtorchtorchvisiontorchaud
监控漏检率 30%？陌讯多模态算法实测优化
破解智慧城市视觉算法困境：陌讯多模态融合技术实战解析在智慧城市建设中，视觉算法作为感知层核心技术，正面临着日益严峻的挑战。传统目标检测算法在暴雨、逆光、遮挡等复杂环境下，漏检率常高达25%-40%，直接导致交通违章误判、异常事件漏报等问题。某新一线城市交管部门曾反馈，现有系统对无牌车的识别准确率不足65%，严重影响执法效率[实测数据来源]。这些痛点的核心在于传统单模态算法难以应对城市环境的动态变化
河道污染难溯源？3步搭建陌讯实时目标检测系统 2501_92472966 目标检测人工智能计算机视觉算法视觉检测
开篇痛点「凌晨3点水泵房渗漏报警，运维人员冒雨排查却是一场误判」——这是某水务企业技术总监向我吐槽的真实案例。在智慧水务场景中，传统视觉算法面临三大死穴：水体反光干扰、微小目标漏检、边缘设备算力受限。尤其当暴雨导致水体浑浊时，OpenCV边缘检测的误报率可达35%以上。技术解析：陌讯多模态融合架构为解决复杂环境泛化问题，陌讯视觉算法提出FMT-Net（FusionMultimodalTransfo
基于深度学习的目标检测：从基础到实践 Blossom.118 机器学习与人工智能深度学习目标检测人工智能音视频语音识别计算机视觉机器学习
前言目标检测（ObjectDetection）是计算机视觉领域中的一个核心任务，其目标是在图像中定位和识别多个对象的类别和位置。近年来，深度学习技术，尤其是卷积神经网络（CNN），在目标检测任务中取得了显著进展。本文将详细介绍如何使用深度学习技术构建目标检测模型，从理论基础到代码实现，带你一步步掌握目标检测的完整流程。一、目标检测的基本概念（一）目标检测的定义目标检测是指在图像中识别和定位多个对象
“显著性”（Saliency）是计算机视觉中的一个重要概念，主要指的是图像或视频中最吸引人注意力的区域或对象步步咏凉天计算机视觉人工智能
“显著性”（Saliency）是计算机视觉中的一个重要概念，主要指的是图像或视频中最吸引人注意力的区域或对象。它模拟的是人类视觉系统对视觉场景中“显著”区域的感知能力。显著性可以用于图像理解、目标检测、图像压缩、图像分割等多个任务。下面是对显著性在计算机视觉中的几个关键方面的解释：一、显著性检测（SaliencyDetection）显著性检测的目标是预测图像中最能吸引人注意的区域，通常输出一个与输
【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型 AIGC零基础入门小白 AI大模型大模型教程人工智能机器学习科技 AI大模型 AIGC AI教程大模型教程
文章目录引言一、人工智能：从概念到现实1.1人工智能的定义1.2人工智能的发展历史1.3人工智能的分类1.4人工智能的应用二、机器学习：人工智能的核心技术2.1机器学习的定义2.2机器学习的分类2.3机器学习的实现原理2.4机器学习的应用2.5机器学习的示例代码2.6解释代码三、大模型：推动AI前沿发展的关键技术3.1大模型的定义3.2大模型的发展历程3.3深度学习与神经网络3.4大模型的优势与挑
基于YOLOv8的火灾智能检测系统设计与实现斟的是酒中桃深度学习人工智能 pyqt yolo
在各类安全事故中，火灾因其突发性强、破坏力大，一直是威胁人们生命财产安全的重大隐患。传统的火灾检测方式多依赖烟雾传感器、温度传感器等，存在响应滞后、易受环境干扰等问题。随着深度学习技术的飞速发展，基于计算机视觉的火灾检测方法凭借其实时性强、检测范围广等优势，逐渐成为研究热点。本文将简单介绍一款基于深度学习的火灾智能检测系统的设计与实现过程。一、系统整体设计本火灾智能检测系统旨在通过深度学习技术实现
人工智能入门指南：从基础概念到实际应用
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north文章目录1.**人工智能的基本概念**1.1什么是人工智能？1.2人工智能的分类2.**人工智能的核心技术**2.1机器学习（MachineLearning）2.1.1机器学习的类型2.1.2机器学习流程2.2深度学习（DeepLearni
Datawhale X 魔塔 Ai夏令营 --深度学习基础
一、局部极小值与全局极小值全局极小值：在损失函数的整个定义域内，损失值最小的点。这是我们在训练深度学习模型时希望找到的点，因为它代表着模型的最佳性能。局部极小值：在损失函数的一个局部区域内，损失值达到最小，但在整个函数定义域内可能不是最小的。当优化算法陷入局部极小值时，它可能会误以为已经找到了全局最优解，从而停止搜索。局部极小值的检测两种直观的方法来检测局部极小值：可视化方法：对于低维问题，我们可
深度学习模块实践手册（第十二期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
56、Ghost模块论文《GhostNet:MoreFeaturesfromCheapOperations》1、作用：Ghost模块是一种轻量级的特征提取模块，旨在通过廉价操作生成更多特征图，减少计算量的同时保持模型性能。传统卷积神经网络在生成特征图时存在大量冗余计算，Ghost模块通过将特征图生成过程分解为两个步骤，有效减少了计算复杂度，特别适合移动端和嵌入式设备部署。2、机制Ghost模块的机
DETR革命：目标检测的Transformer时代加油吧zkf 目标检测 YOLO python 开发语言人工智能图像处理
《DETR从0到1：目标检测Transformer的崛起》为什么会有DETR？在深度学习目标检测发展史上，2014~2019年几乎被基于卷积神经网络（CNN）的检测器统治：两阶段：FasterR-CNN、MaskR-CNN单阶段：YOLO、SSD、RetinaNet这些检测器虽然效果强大，但背后依赖：✅Anchor（先验框）✅NMS（非极大值抑制）✅特征金字塔、手工设计问题：结构复杂、调参困难、不
深度学习模块实践手册（第十一期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
46、缩放点积注意力模块论文《AttentionIsAllYouNeed》1、作用：缩放点积注意力（ScaledDot-ProductAttention）是Transformer模型的核心组件，旨在解决序列建模中长距离依赖关系捕捉的问题。传统的循环神经网络（RNN）在处理长序列时存在梯度消失或爆炸的问题，且并行性较差。该模块通过计算查询（Query）、键（Key）和值（Value）之间的相似度，实
基于NanoDet的健身姿势纠正系统开发 YOLO实战营人工智能 NanoDet 深度学习计算机视觉 ui
1.引言在现代健身行业中，正确的运动姿势至关重要，不仅能提升训练效果，还能预防运动损伤。尤其是在进行一些高强度的力量训练时，如深蹲、俯卧撑等，错误的姿势可能导致肌肉不平衡或关节损伤。传统的健身姿势纠正方式依赖教练的人工指导，但随着人工智能技术的发展，使用计算机视觉和深度学习技术来进行姿势纠正，逐渐成为一种高效且可扩展的解决方案。本文将详细介绍如何基于NanoDet（一个轻量化目标检测模型）开发一个
大模型算法工程师技术路线全解析：从基础到资深的能力跃迁 Mr.小海大模型算法数据挖掘人工智能机器学习深度学习机器翻译 web3
文章目录大模型算法工程师技术路线全解析：从基础到资深的能力跃迁一、基础阶段（0-2年经验）：构建核心知识体系与工程入门数学与机器学习基础编程与深度学习框架NLP与Transformer入门二、进阶阶段（2-4年经验）：深化模型技术与工程落地能力大模型预训练与微调技术预训练原理：数据与任务的协同设计微调工具：参数高效适配与工程优化对齐实践：价值观优化与实证效果分布式训练与框架工具并行策略：多维度协同
【深度学习-Day 36】CNN的开山鼻祖：从LeNet-5到AlexNet的架构演进之路吴师兄大模型深度学习入门到精通 python pytorch 开发语言人工智能 CNN 深度学习大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
Python爬虫实战：批量下载小红书笔记图片的全流程技术解析 Python爬虫项目 2025年爬虫实战项目 python 爬虫笔记开发语言音视频 github
1.引言：为什么要爬取小红书笔记图片小红书作为新兴的生活方式分享平台，聚集了大量高质量原创笔记内容，涵盖时尚、美妆、旅游、美食等多领域。笔记中的图片往往是内容的核心，批量下载小红书笔记图片，有助于：内容归档与备份数据分析与用户行为研究图像识别与机器学习训练电商推广及内容再加工但小红书对内容保护做得较好，爬取难度较高，需要结合多技术手段突破。2.小红书平台特点与爬取难点动态加载与API接口多变：页面
人脸识别实战：使用Python OpenCV 和深度学习进行人脸识别(2)
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
TensorFlow深度学习实战——DCGAN详解与实现盼小辉丶深度学习 tensorflow 生成对抗网络
TensorFlow深度学习实战——DCGAN详解与实现0.前言1.DCGAN架构2.构建DCGAN生成手写数字图像2.1生成器与判别器架构2.2构建DCGAN相关链接0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetwork,DCGAN)是一种基于生成对抗网络(GenerativeAdversarialNetwork,GAN)的深度学
BEV+Transformer Monkey PilotX 自动驾驶 transformer 深度学习人工智能
在自动驾驶系统中，BEV（Bird’sEyeView）+Transformer主要应用于感知与环境建图（Perception&SceneUnderstanding）环节，尤其是在多传感器融合、目标检测、语义分割、轨迹预测等任务中。在自动驾驶中的关键应用场景应用环节BEV+Transformer的作用感知（Perception）多摄像头图像融合成BEV视角，进行目标检测、语义分割预测（Predict
基于densenet网络创新的肺癌识别研究深度学习乐园深度学习人工智能 densenet
获取项目源码点击文末名片摘要本项目针对肺癌CT图像识别等医学影像分析场景，基于DenseNet网络进行创新性改进，综合引入多尺度卷积、深度可分离卷积、注意力机制以及空间金字塔池化（SPP）等模块，以期提升对不同大小的肺结节及关键病理特征的识别能力。同时，通过深度可分离卷积和可选的通道剪枝等策略，将网络参数量和计算开销显著降低，为实际临床应用（如实时诊断系统）提供可行性。本项目的核心内容包括以下几个
基于cnn和resnet和mobilenet对比实现驾驶员分心检测深度学习乐园 cnn 人工智能神经网络
演示效果及获取项目源码点击文末名片本项目旨在通过深度学习技术，结合卷积神经网络（CNN）模型、ResNet模型和MobileNet模型，实现对驾驶员分心行为的自动检测。我们通过训练这些模型来识别不同的驾驶员分心行为，包括如发短信、通话、喝水等行为。使用的数据集包含驾驶员行为的图片，并且针对每个行为标注了相应的标签（例如"正常驾驶"、"右手发短信"等）。MobileNetV2是Google于2018
opencv 4.12.0版本发布详解：核心优化与新特性全解析 Risehuxyc #opencv opencv 人工智能计算机视觉
OpenCV4.12.0夏季更新带来核心模块优化、图像处理增强、深度学习支持扩展及新兴硬件适配，全面提升计算机视觉开发效率与性能。引言OpenCV（开源计算机视觉库）作为计算机视觉领域最受欢迎的开源库之一，在2025年7月发布了4.12.0版本。这个夏季更新带来了大量性能优化、新功能和错误修复，覆盖了核心模块、图像处理、3D校准、深度学习等多个领域。本文将详细介绍OpenCV4.12.0的主要更新
如何用深度学习实现图像风格迁移
最近研学过程中发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。前言图像风格迁移是人工智能领域中一个非常有趣且富有创意的应用。它能够让一张普通的照片瞬间变成梵高笔下的《星月夜》风格，或者像莫奈的《睡莲》一样充满艺术感。这种技术不仅在
AI人工智能领域TensorFlow的模型训练策略 AIGC应用创新大全人工智能 tensorflow python ai
AI人工智能领域TensorFlow的模型训练策略关键词：TensorFlow、模型训练、深度学习、神经网络、优化策略、分布式训练、迁移学习摘要：本文将深入探讨TensorFlow框架下的模型训练策略，从基础概念到高级技巧，全面解析如何高效训练深度学习模型。我们将从数据准备、模型构建、训练优化到部署应用，一步步揭示TensorFlow模型训练的核心技术，并通过实际代码示例展示最佳实践。背景介绍目的
ROS2 通过相机确定物品坐标位置
要实现通过相机确定物品坐标位置，通常需要相机标定、物体检测和坐标转换几个步骤。下面我将提供一个完整的解决方案，包括相机标定、物体检测和3D坐标估计。1.系统架构相机标定-获取相机内参和畸变系数物体检测-使用OpenCV或深度学习模型检测物品坐标转换-将2D图像坐标转换为3D世界坐标ROS2集成-将上述功能集成到ROS2节点中2.实现步骤2.1创建功能包bashros2pkgcreateobject
目标检测中的标签分配算法总结北京地铁1号线目标检测与图像处理人工智能
目标检测中的标签分配算法是训练过程中的一个核心环节，它决定了如何将标注好的真实目标框分配给模型预测出来的候选框（AnchorBoxes或Points），从而为这些候选框提供监督信号（正样本、负样本、忽略样本）。它的质量直接影响模型的学习效率和最终性能。简单来说，标签分配要解决的关键问题是：“哪些预测框应该负责学习哪些真实目标？”一、为什么标签分配如此重要？1.定义学习目标：它直接告诉模型哪些预测应
【机器学习&深度学习】什么是量化？一叶千舟深度学习【理论】机器学习深度学习人工智能
目录前言一、量化的基本概念1.1量化对比示例1.2量化是如何实现的？二、为什么要进行量化？2.1解决模型体积过大问题2.2降低对算力的依赖2.3加速模型训练和推理2.4优化训练过程2.5降低部署成本小结：量化的应用场景三、量化的类型与实现3.1权重量化（WeightQuantization）3.2激活量化（ActivationQuantization）3.3梯度量化（GradientQuantiz
基于AutoCut实现在文档中按照片段剪辑视频 Mr数据杨 Python 音频技术音视频
本项目致力于通过构建一个具备深度学习支持的多功能视频处理环境，为用户提供高效、智能的视频编辑和字幕生成工具。依托Anaconda环境管理工具和PyTorch的GPU加速能力，用户能够迅速搭建一个符合项目需求的Python环境。结合FunClip的源代码以及相关插件的安装和配置，用户可充分利用项目所支持的图像、音频识别功能，并以极少的配置便获得理想的视频裁剪效果。项目的核心在于简化深度学习项目的环境
基于深度学习的和平精英（吃鸡）内置锁头训练摆烂仙君深度学习人工智能
前言本教程以和平精英为例，主要讲解如何构建深度学习模型对游戏中角色进行头部标注，并控制鼠标对其进行锁定射击，同时围绕其游戏防作弊系统进行算法攻防讲解，该方案对于csgo,cf等游戏也同样适用。请注意，该教程仅供娱乐教学，若本教程评论超过100，将会开源相关代码并对实际的代码部署进行进一步分析。一、和平精英伤害机制分析在《刺激战场》（现为《和平精英》）中，击中头部的伤害远高于身体其他部位，这是由游戏
迁移学习让深度学习更容易城市中迷途小书童
摘要：一文读懂迁移学习及其对深度学习发展的影响！深度学习在一些传统方法难以处理的领域有了很大的进展。这种成功是由于改变了传统机器学习的几个出发点，使其在应用于非结构化数据时性能很好。如今深度学习模型可以玩游戏，检测癌症，和人类交谈，自动驾驶。深度学习变得强大的同时也需要很大的代价。进行深度学习需要大量的数据、昂贵的硬件、甚至更昂贵的精英工程人才。在ClouderaFastForward实验室，我们
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla