YOLOv4理论深度剖析

目标检测方向发展迅速。十几个月前，谷歌Brain团队发布了用于对象检测的EfficientDet，挑战了YOLOv3作为(近)实时对象检测的主要模型的地位，并推动了对象检测模型的可能上界。
现在YOLOv4已经发布，COCO平均精度(AP)和帧率(FPS)分别提高了10%和12%。

解剖物体检测器

所有的目标检测器都将图像作为输入，并通过卷积神经网络主干压缩特征。在图像分类中，这些主干是网络的末端，可以利用它们进行预测。在目标检测中，需要在图像中的目标周围绘制多个边界框并进行分类，因此卷积主干的特征层需要相互混合并相互作用。主干特征层的组合发生在颈部。

将目标检测器分为两类也很有用:单阶段检测器和双阶段检测器。检测发生在头部。双阶段检测器解耦了每个包围框的目标定位和分类任务。单阶段检测器同时进行目标定位和分类预测。YOLO是一个单阶段检测器。

YOLOv4骨干网（Backbone）-特征生成

目标检测器的骨干网络通常是在ImageNet分类上预先训练的。预训练意味着网络的权值已经被用来识别图像中的相关特征，尽管在新的目标检测任务中还会有所调整。

作者考虑了以下YOLOv4对象检测器的主干网络：

CSPResNext50
CSPDarknet53
EfficientNet-B3

CSPResNext50和CSPDarknet53都是基于DenseNet的。DenseNet被设计用于连接卷积神经网络中的层，其动机如下:缓解梯度消失问题(很难通过非常深的网络回传信号)，支持特征传播，鼓励网络重用特征，并减少网络参数的数量。

Dense Block & DenseNet

为了提高准确性，我们可以设计一个更深层次的网络来扩展感受野并增加模型的复杂性。为了减轻训练的难度，可以使用跳跃连接。我们可以用高度互联的层进一步扩展这个概念。

Dense Block包含多个卷积层，每一层Hi由批处理归一化、ReLU和卷积组成。Hi不只是使用最后一层的输出，而是将所有以前层的输出以及原始层的输出作为其输入。即x₀，x₁，…和xᵢ₋₁。下面的每个Hi输出四个特征映射。因此，在每一层，特征图的数量增加了4倍。

然后，通过在卷积和池化之间的过渡层（transition layer）中组合多个Dense Block，形成一个DenseNet。

下面是详细的结构设计。

Cross-Stage-Partial-connections (CSP)

CSPNet将DenseBlock的输入特征图分为两部分。第一部分x₀’绕过DenseBlock，成为下一个过渡层（transition layer）输入的一部分。第二部分x₀”经过Dense block，如下所示。

这种新的设计通过将输入分成两部分来降低计算复杂度——只有一部分通过DenseBlock。

CSPResNext50和CSPDarknet53的想法是消除DenseNet中的计算瓶颈，并通过传递部分未经修改的特征图来改进学习。

EfficientNet是谷歌大脑设计的，主要研究卷积神经网络的缩放问题。在缩放ConvNet时，你可以做很多决定，包括输入大小、宽度缩放、深度缩放，以及以上所有的缩放。EfficientNet论文假设所有这些都有一个最佳点，通过搜索，他们找到了它。

在图像分类方面，EfficientNet优于其他同等规模的网络。然而，YOLOv4的作者假设，其他网络在目标检测设置中可能工作得更好，并决定对所有网络进行试验。
基于他们的直觉和实验结果，最终YOLOv4网络使用CSPDarknet53作为骨干网。

CSPDarknet53

YOLOv4利用上面的CSP连接和下面的Darknet-53作为提取特征的骨干。

与基于ResNet的设计相比，CSPDarknet53模型具有更高的目标检测精度，即使ResNet具有更好的分类性能。但CSPDarknet53的分类精度可以通过Mish等技术来提高。因此，YOLOv4的最终选择是CSPDarknet53。

YOLOv4 Neck -特征聚合

目标检测的下一步是混合和结合ConvNet骨干中形成的特征，为检测步骤做准备。YOLOv4考虑了一些neck的选择，包括:

FPN
PAN
NAS-FPN
BiFPN
ASFF
SFAM

neck的组件通常在各层之间上下流动，只连接卷积网络末端的几层。

上面的每个 $P_i$ 代表CSPDarknet53骨干中的一个特征层。
上面的图像来自YOLOv4的前身EfficientDet。由谷歌大脑编写，EfficientDet利用神经架构搜索在网络的颈部部分找到块的最佳形式，得到NAS-FPN。然后，EfficientDet作者稍微调整了一下，使体系结构更加直观(并且可能在他们的开发集上执行得更好)。

Feature Pyramid Networks (FPN)

YOLOv3采用了与FPN类似的方法，在backbone不同的输出层进行目标预测。

在对特定的backbone输出层进行预测时，FPN向上采样(2×)之前的自上而下流，并将其与自下而上流的相邻层相加(见下图)。结果被传递到3×3卷积滤波器，以减少上采样的伪影，并为head创建特征图P4。

SPP (spatial pyramid pooling layer)

SPP在检测不同尺度的物体时采用了稍微不同的策略。它用一个空间金字塔池化层替换了最后一个池化层(在最后一个卷积层之后)。feature map在空间上被划分为m×m个bins, m分别等于1、2和4。然后对每个通道的每个bin应用一个最大池。这形成了一个固定长度的表示，可以用fc层进一步分析。

许多基于cnn的模型包含fc层，因此只接受特定尺寸的输入图像。相比之下，SPP接受不同大小的图像。然而，像完全卷积网络(FCN)这样的技术不包含fc层，并接受不同维度的图像。这种设计对于空间信息非常重要的图像分割尤其有用。因此，对于YOLO，将2-D特征映射转换为固定大小的1-D向量不一定是可取的。

YOLO with SPP (spatial pyramid pooling layer)

在YOLO中，SPP被修改以保留输出空间维度。最大池化使用大小为1×1、5×5、9×9、13×13的kernel。空间维度得以保留。然后将经过不同kernel操作后得到的特性图连接在一起作为输出。

下图演示了如何将SPP集成到YOLO中。

路径聚合网络（Path Aggregation Network (PAN)）

在FPN中，信息来自自底向上和自顶向下的流中邻近层的组合。

层之间的信息流成为模型设计中的另一个关键决策。

下图是用于目标检测的路径聚合网络(PAN)。一个自底向上的路径(b)被扩充，以使低层信息更容易传播到高层。在FPN中，局部空间信息在红色箭头中向上移动。虽然在图表中没有清楚地显示，但红色路径通过了大约100多层。PAN引入了一条捷径(绿色路径)，只需要大约10层就可以到达N₅层。这种短路概念使上层可以使用细粒度的局部信息。

neck设计可以如下图所示:

然而，在YOLOv4中，不是将相邻的特征层加在一起，而是将相邻的特征层连接在一起。

在FPN中，目标是在不同的尺度水平上分别独立检测的。这可能会产生重复的预测，并且不会利用来自其他特征图的信息。PAN首先使用逐元素最大运算将所有层的信息融合在一起。

空间注意模块(Spatial Attention Module (SAM))

注意力在DL设计中被广泛采用。在SAM中，最大池化和平均池化分别应用于输入特征图，创建两组特征图。结果被输入一个卷积层，然后是一个sigmoid函数来创建空间注意力。

该空间注意力掩码应用于输入特征，输出精细化的特征图。

在YOLOv4中，使用了一个修改过的SAM，没有应用最大池化和平均池化。

YOLOv4选择PANet作为网络的特征聚合。他们没有写太多关于这个决定的基本原理，而且由于NAS-FPN和BiFPN是同时写的，这可能是未来研究的一个领域。
在YOLOv4中，FPN概念逐渐被改进后的SPP和PAN所取代。

YOLOv4 Head -检测步骤

YOLOv4使用了与YOLOv3相同的head，使用基于锚的检测步骤进行检测，有三个级别的检测粒度。

通道的数量是255，因为(80个类+ 1个对象+ 4个坐标)* 3个锚框。

消除网格敏感性(Eliminate grid sensitivity)

对于bₓ= cₓ和bₓ= cₓ+1的情况，我们需要tₓ分别有一个巨大的负数和正数。但是我们可以将σ与一个比例因子(>1.0)相乘使之更容易。以下是源代码更改:

计算机视觉中的数据增强

图像增强是从现有的训练数据中创建新的训练数据。我们不可能为我们的模型捕捉到每个可能的真实场景图像。因此，调整现有的训练数据，使之适用于其他情况，可以提高模型的泛化能力。

失真（distortion)

光度失真（Photometric Distortion）：这包括改变图像的亮度、对比度、饱和度和噪声。(例如，在计算机视觉中的模糊数据增强。)

几何失真（Geometric Distortion）：这包括随机缩放、裁剪、翻转和旋转。这些类型的增强可能特别棘手，因为包围框也会受到影响，必须更新。

这两种方法都是像素调整，这意味着通过一系列的变换可以很容易地恢复原始图像。

图像遮挡（Image Occlusion）

随机删除（Random Erase）：这是一种用随机值或训练集的平均像素值替换图像区域的数据增强技术。通常，它是通过不同比例的图像擦除和擦除区域的宽高比来实现的。从功能上来说，这成为一种正则化技术，它可以防止我们的模型记忆训练数据和过拟合。

Cutout：在训练中，正方形区域被掩盖。cutout区域只在CNN的第一层隐藏。这与随机擦除非常相似，但是在cutout中遮盖区域一个常量。目的是相似的:我们减少过拟合。

Hide and Seek：将图像划分为SxS个网格。以一定的概率隐藏每个网格(p_hide)。这使得模型可以了解一个对象是什么样子，而不只是了解对象的单个部分是什么样子。

Grid Mask：图像的区域被隐藏在网格中。类似于Hide and Seek，这迫使我们的模型学习单个对象的各个组件。

MixUp：图像及其标签的叠加。

YOLOv4-Bag of Freebies（涨点或变快，但是不增加计算量）

YOLOv4的作者在题为“bag of freebies”的论文中包含了一系列的贡献，在不增加推理时间的情况下提高模型性能。由于它们不会影响模型的推理时间，所以大多数改进都是在训练管道的数据管理和数据增强方面。这些技术改进了训练集，并扩大了训练集的规模，以将模型泛化到原本看不到的场景中。计算机视觉中的数据增强是最大限度地利用数据集的关键，而最新的研究也在继续验证这一假设。

现在我们将查看YOLOv4在训练期间使用的数据增强策略。研究过程的特点是一系列的实验，所以我们可以想象作者实验了更多的策略，但没有进入最后的论文。这进一步证明，在自定义视觉任务中，在您自己的训练/测试集上探索各种数据增强策略是非常重要的。

CutMix：通过从一个图像中剪切部分并将其粘贴到增强的图像中来组合图像。图像的切割迫使模型学会基于大量稳健的特征进行预测。看上面的“Hide and Seek”，在那里，没有切割，模型专门依靠狗的头来进行预测。如果我们想要准确地识别一只把头藏起来的狗(可能是在灌木丛后面)，这就有问题了。在CutMix中，切割的部分被替换为另一个图像的一部分以及第二个图像的ground truth标签。每个图像的比例在图像生成过程中设定(例如0.4/0.6)。在下面的图片中，你可以看到CutMix的作者是如何证明这种技术比简单的MixUp和Cutout更有效。

马赛克数据增强（Mosaic）：马赛克数据增强将4幅训练图像按一定比例组合成一幅(在CutMix中只有两幅)。Mosaic是YOLOv4引入的第一个新的数据增强技术。这使得模型能够学习如何识别小物体。

类标签平滑（Class label smoothing）：类标签平滑不是一种图像处理技术，而是一种对类标签的直观改变。一般来说，一个边界框的正确分类是用一个one-hot向量表示的[0,0,0,1,0,0，…]，并以此表示计算损失。然而，当一个模型的预测接近1.0时，它往往是错误的，过度拟合，在某种程度上忽略了其他预测的复杂性。按照这种直觉，对类标签增加某种程度上的不确定性更为合理。当然，作者选择了0.9，所以[0,0,0,0.9,0…来表示正确的类。

自我对抗训练（Self-Adversarial Training (SAT)）：首先，图像经过一个正常的训练步骤。然后，不是通过权重反向传播，而是利用损失信号以对模型最不利的方式改变图像。在随后的训练中，模型被迫面对这个特别困难的例子，并围绕它学习。在我们这里介绍的技术中，这可能是最不直观和最接近建模方面的技术。

SAT的目标是找到网络在训练过程中最依赖的图像部分，然后对图像进行编辑，以掩盖这种依赖，迫使网络泛化到可以帮助它检测的新特征。

YOLOv4的作者提供了一项消融研究，证明他们使用的数据增强是正确的。

这是在COCO上效果最好的方法，但对于您自己的数据集，重要的是批判性地思考哪些增强可能会有帮助，并实验性地使用增强技术。

DropBlock正则化：
在全连接层中，我们可以应用drop来迫使模型从各种特征中学习，而不是对少数特征过于自信。然而，这可能不适用于卷积层。相邻位置高度相关。因此，即使一些像素被丢弃(下图中间的图表)，空间信息仍然是可检测的。DropBlock正则化基于与卷积层相似的概念。

DropBlock不是丢弃单个像素，而是丢弃一个block_size × block_size像素块。

另一个无痛涨点的技巧是CIoU损失函数。YOLOv4的作者使用CIoU损失，这与预测的边界框与真实边界框重叠的方式有关。基本上，只看重叠是不够的，因为在没有重叠的情况下，你还想看边界框离真实框有多近，并鼓励网络把预测的边界框拉到离真实框更近的地方。当然，这里面有很多数学工程。

许多单阶段目标检测器都是用固定的输入图像形状进行训练的。为了提高泛化能力，我们可以用不同的图像大小来训练模型。(YOLO的多尺度训练)

YOLOv4 - Bag of Specials（BoS）

YOLOv4部署的策略称为“Bag of Specials”，之所以这么说，是因为它们增加了推理时间，但显著提高了性能，所以它们被认为是值得的。

Mish激活函数

下面的新激活函数Swish显示出比ReLU和许多其他激活函数更好的性能。

Mish是另一个与ReLU和Swish非常相似的激活函数。Mish在不同数据集的许多深度网络中都能胜过它们。

在CSPDarknet53和检测器上使用Mish，可以提高YOLOv4的精确度。

DIoU NMS

NMS过滤掉其他预测相同对象的边界框，并保留一个置信度最高的边界框。

DIOU方法在抑制冗余框时取IoU和两个边界框中点之间的距离。这使得它在有遮挡的情况下更加健壮。

我使用的是YOLOv3，它需要一些更好的NMS，比如YOLOv4 -这不能同时是两种吉普车(绿色标签是吉普车TJ，棕色标签是吉普车YJ)。

对于批处理归一化，作者使用了交叉批处理归一化(CmBN)，这可以在人们使用的任何GPU上运行。许多批处理归一化技术需要多个gpu协同操作。

YOLOV4中的BoF和BoS总结

YOLOv4 -实验结果

YOLOv4的技术通过MS COCO上的实验得到了充分的验证。COCO包含80个对象类，用于表示检测器可能在野外遇到的广泛的对象检测场景。

YOLOv4对本文中尝试的技术进行了深入的消融研究。一项消融研究试图依次去除添加物，以证明哪些添加物改善了网络。

通过最终的配置，YOLOv4实现了对象检测的最好性能。本文研究了许多不同gpu上的推理时间，尽管我们在这里只显示一个。

技术评估

虽然本文介绍了哪些技术已经集成到YOLOv4中，但YOLOv4在评估其他技术方面花费了大量精力。为了结束本文，下面的图表列出了YOLOv4考虑的技术。

YOLOV3与YOLOV4差异

YOLOV3和YOLOV4网络架构图

YOLOV3和YOLOV4网络架构对比

使用YOLOV4注意事项

由于cfg的anchors是使用coco datasets计算出来的anchors,在训练自己的数据集时候不一定适用，因此需要使用cal_anchors来计算出适合自己的datasets的anchors。
如果是在类似colab这种不能有弹出式视窗的环境下训练时候，后面记得要加上-dont_show,不然会报错，例如：darknet detector train data/coco.data data/yolov4-coco.cfg data/yolov4-csp.conv.142 -dont_show
当发生类别不均衡时候可以使用GAN的方法来自己生成数量较少的数据，例如在瑕疵检测中，一定有一些的瑕疵是很少出现的，这时候使用segmentation的方法将瑕疵切出来再贴到背景图像上，若想要将其更无违和的贴上去可以使用GP-GAN的方法，如下图所示：
当开始训练时候，结果只训练一下就断掉了有segmentation fault(core dumped)的情形发生，这时候会生成bad.list，里面会记录一些不正常的训练记录，例如你的x,y,w,h有<0的状况，更正后就可以训练了。
若训练完模型，想在Python中做进一步的应用，可以使用opencv来导入YOLO模型的权重和配置文件，例如：

import cv2
CONFIDENCE_THRESHOLD=0.2
NMS_THRESHOLD=0.4
net = cv2.dnn.readNet("yolov4.weights", "yolov4.cfg")
model = cv2.dnn_DetectionModel(net)
model.setInputParams(size=(416, 416), scale=1/255, swapRB=True)
classes, scores, boxes = model.detect(img, CONFIDENCE_THRESHOLD, NMS_THRESHOLD)

总结

总之，YOLOv4是计算机视觉中目标检测的一大套技术集大成。这些技术已经经过测试和改进，形成了最好的实时对象检测器，它是轻量级的，易于使用。

参考目录

https://jonathan-hui.medium.com/yolov4-c9901eaa8e61
https://medium.com/ai-academy-taiwan/yolov4-%E7%94%A2%E6%A5%AD%E6%87%89%E7%94%A8%E5%BF%83%E5%BE%97%E6%95%B4%E7%90%86-72d072007e2

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
[数据集][图像分类]河道污染分类数据集1923张4类别 FL1623863129 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：1922分类类别数：4类别名称:["lianghao","qingwei","yanzhong","zhongdu"]每个类别图片数：lianghao图片数：435qingwei图片数：423yanzhong图片数：577zhongdu图片数：487重要说明
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
深度学习项目-基于深度学习的股票价格预测研究雅致教育计算机毕业设计深度学习人工智能
概要随着经济的发展，中国股票市场的规模持续扩大，早已成为金融投资的重要部分，掌握股票市场的变化规律无论是对监管者还是投资者都具有极其重要的意义。正因如此，人们不断探索着股票市场的变化规律，其中使用深度学习预测股价是当前国内国际研究与应用的热点。本文首先从有效市场假说和分形市场假说两个角度讨论了中国股票市场的有效性，说明股票市场具有复杂的非线性特征。其次，结合股票市场特征对比了当前的预测方法
PaperWeekly sapienst Papers PaperwithCode General ML
1.Python软件包解决DL在未见过的数据分布下性能差的问题：（1）神经网络和损失分离的模块化设计（2）强大便捷的基准测试能力（3）易于使用但难以修改（4）github:https://github.com/marrlab/domainlabTrainer和Models之间是什么关系Trainer和Models是DomainLab中的两个核心概念。Trainer是一个用于指导数据流向模型并计算S
ChatGPT技巧大揭秘：AI写代码新境界 2401_83550420 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT技巧大揭秘：AI写代码新境界随着人工智能技术的不断进步，开发人员现在有了更多有趣的工具来提高他们的工作效率。其中，ChatGPT作为一种基于深度学习的自然语言处理模型，已经成为许多开发者的新宠。在本文中，我们将揭秘使用ChatGPT来帮助编写代码的技巧，探索AI在编程领域的新境界。ChatGPT简介ChatGPT是一种基于大型神经网络的对话生成模型，它
AI大模型学习：开启智能时代的新篇章游向大厂的咸鱼人工智能学习
随着人工智能技术的不断发展，AI大模型已经成为当今领先的技术之一，引领着智能时代的发展。这些大型神经网络模型，如OpenAI的GPT系列、Google的BERT等，在自然语言处理、图像识别、智能推荐等领域展现出了令人瞩目的能力。然而，这些模型的背后是一系列复杂的学习过程，深度学习技术的不断演进推动了AI大模型学习的发展。首先，AI大模型学习的基础是深度学习技术。深度学习是一种模仿人类大脑结构的机器
【Python】成功解决ModuleNotFoundError: No module named ‘torchinfo‘ 高斯小哥 BUG解决方案合集 python pytorch 新手入门学习 debug
【Python】成功解决ModuleNotFoundError:Nomodulenamed‘torchinfo’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文
【循环神经网络rnn】一篇文章讲透 CX330的烟花 rnn 人工智能深度学习算法 python 机器学习数据结构
目录引言二、RNN的基本原理代码事例三、RNN的优化方法1长短期记忆网络（LSTM）2门控循环单元（GRU）四、更多优化方法1选择合适的RNN结构2使用并行化技术3优化超参数4使用梯度裁剪5使用混合精度训练6利用分布式训练7使用预训练模型五、RNN的应用场景1自然语言处理2语音识别3时间序列预测六、RNN的未来发展七、结论引言众所周知，CNN与循环神经网络（RNN）或生成对抗网络（GAN）等算法结
ChatGPT神技：AI成为你的编程良友 2401_83481083 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT神技：AI成为你的编程良友近年来，人工智能技术的发展迅猛，ChatGPT作为其中一项创新技术，正逐渐走进我们的生活。在编程领域，AI不仅可以助力我们提高效率，还能成为我们的良友，帮助解决各种编程难题。一、ChatGPT简介ChatGPT是一种基于自然语言处理技术的人工智能模型，它能够生成类人对话。ChatGPT通过深度学习模型，能够理解输入的文本并生成
SWIFT环境配置及大模型微调实践 weixin_43870390 swift 开发语言 ios
SWIFT环境配置及大模型微调实践SWIFT环境配置基础配置增量配置SWIFTQwen_audio_chat大模型微调实践问题1:问题2:问题定位解决方法手动安装pytorchSWIFT介绍参考：这里SWIFT环境配置基础配置condacreate-nswiftpython=3.8pipinstallms-swift[all]-U#下载项目gitclonehttps://github.com/mo
深度学习如何入门？科学的N次方深度学习
入门深度学习需要系统性的学习和实践经验积累，以下是一份详细的入门指南，包含了关键的学习步骤和资源：预备知识：•编程基础：熟悉Python编程语言，它是深度学习领域最常用的编程语言。确保掌握变量、条件语句、循环、函数等基本概念，并学习如何使用Python处理数据和文件操作。•数学基础：理解线性代数（矩阵运算、向量空间等）、微积分（导数、梯度求解等）、概率论与统计学（期望、方差、概率分布、最大似然估计
深度学习与（复杂系统）事物的属性科学禅道深度学习模型专栏深度学习人工智能
深度学习与复杂系统中事物属性的关系体现在：特征学习与表示:深度学习通过多层神经网络结构，能够自动从原始输入数据中学习和提取出丰富的特征表示。每一层神经网络都可能对应着事物属性的不同抽象层次，底层可能对应简单直观的属性，而随着网络深度的增加，顶层可以学习到更抽象、复杂的属性及其相互关系。非线性关系建模:深度学习特别擅长处理非线性关系，而在复杂系统中，事物属性间的相互作用往往表现为非线性，例如，某些属
Win环境下安装 torch==1.1.0 JOYCE_Leo16 Bug记录深度学习 python 人工智能 pytorch
问题描述复现很多模型的时候，会遇到torch版本不一致问题，尤其是torch1.1.0一直都在安装错误，试了很多方法都没用。解决方案在默认环境中安装torch：pipinstallhttps://download.pytorch.org/whl/cu90/torch-1.1.0-cp36-cp36m-win_amd64.whlpipinstallhttps://download.pytorch.o
智合同如何助力建筑行业合同智能化管理智合同（小智）合同智能应用 AI技术降本增效提质人工智能自然语言处理知识图谱深度学习大数据
#建筑行业#人工智能#AI#合同智能应用#深度学习#自然语言处理技术#知识图谱智合同-采用深度学习、自然语言处理技术、知识图谱等人工智能技术，为企业提供专业的合同相关的智能服务。其主要服务包含：合同智能审查、合同要素智能提取、合同版本对比、合同智能起草、ICR智能识别、合同履约追踪、文本一致性对比、广告审查、合同范本库等服务。智合同在助力建筑行业合同智能化管理方面具有显著的优势。首先，智合同利用A
神经网络（深度学习，计算机视觉，得分函数，损失函数，前向传播，反向传播，激活函数） MarkHD 深度学习神经网络计算机视觉
神经网络，特别是深度学习，在计算机视觉等领域有着广泛的应用。以下是关于你提到的几个关键概念的详细解释：神经网络：神经网络是一种模拟人脑神经元结构的计算模型，用于处理复杂的数据和模式识别任务。它由多个神经元（或称为节点）组成，这些神经元通过权重和偏置进行连接，并可以学习调整这些参数以优化性能。深度学习：深度学习是神经网络的一个子领域，主要关注于构建和训练深度神经网络（即具有多个隐藏层的神经网络）。通
目标检测——摩托车头盔检测数据集钓了猫的鱼儿目标检测数据集目标检测摩托车头盔检测数据集
一、简介首先，摩托车作为一种交通工具，具有高速、开放和稳定性差的特点，其事故发生率高，伤亡率排在机动车辆损伤的首位。因此，摩托车乘员头盔对于保护驾乘人员头部安全至关重要。在驾乘突发状况、人体受冲击时，头盔能够吸收碰撞能量，减轻伤害。研究摩托车头盔检测，能够确保头盔的质量和安全性能，从而更有效地保护驾乘人员的生命安全。其次，随着科技的发展，人们对于交通安全和生命安全的重视程度日益提高。摩托车头盔作为
MATLAB 2023a：强化学习算法的实战演练与性能评估 zmjia111 机器学习 matlab matlab 算法开发语言深度学习机器学习 yolo
在深度学习领域，MATLAB2023版深度学习工具箱以其完整的工具链和高效的运行环境，为研究人员和开发者提供了前所未有的便利。这一工具箱不仅集成了建模、训练和部署的全部功能，更以其简洁易用的语法和强大的算法库，为深度学习任务的快速实现铺平了道路。相较于Python等编程语言，MATLAB的语法更为直观，上手更为迅速。无需繁琐的环境配置和库安装，用户只需打开MATLAB界面，即可轻松开始深度学习之旅
动手学习深度学习——2.5 自动微分 X_Imagine 动手学习深度学习深度学习人工智能自动微分
2.5自动微分正如【2.4微积分】所说，微分是深度学习中几乎所有最优化算法的关键步骤。虽然求这些导数的计算过程很简单，只需要一些基本的微积分知识。但对于复杂的模型，手工计算参数的更新可能很痛苦(而且经常容易出错)。深度学习框架通过自动计算导数加快了这一工作，即自动微分（AutomaticDifferentiation）。在实践中，基于我们设计的模型，系统构建了一个计算图，跟踪哪些数据结合哪些操
飞桨科学计算套件PaddleScience skywalk8163 人工智能 paddlepaddle 人工智能飞桨
PaddleScience是一个基于深度学习框架PaddlePaddle开发的科学计算套件，利用深度神经网络的学习能力和PaddlePaddle框架的自动(高阶)微分机制，解决物理、化学、气象等领域的问题。支持物理机理驱动、数据驱动、数理融合三种求解方式，并提供了基础API和详尽文档供用户使用与二次开发。安装当然要先安装好飞桨PaddlePaddle，再安装PaddleSciencepipinst
训练时损失出现负数，正常吗？为什么苏苏大大机器学习深度学习人工智能
在训练神经网络时，通常期望损失函数的值是非负的，因为损失函数是用来度量模型预测与真实值之间的差异的。然而，有时候在训练过程中，损失函数可能会出现负数的情况，这可能是正常的，也可能是因为某些原因导致了不寻常的行为。出现损失函数为负数的情况可能有以下几种原因：1.数值不稳定性：如果在计算损失函数时使用了数值不稳定的操作，比如过大或过小的数值，可能会导致损失函数出现负数。这可能是由于数值计算中的舍入误差
最新ChatGPT支持下的PyTorch机器学习与深度学习 zkzhzy ChatGPT 机器学习 python 机器学习深度学习 pytorch chatgpt 数据分析人工智能
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。郁磊（副教授）主要从事AI人工智能、大语言模型及软件开发、生理系统建模与仿真、生物医学信号处理，具有丰富的科研经验，主编《MATLAB智能算
神经网络量化小厂程序猿人工智能
神经网络量化（NeuralNetworkQuantization）是一种技术，旨在减少神经网络模型的计算和存储资源需求，同时保持其性能。在深度学习中，神经网络模型通常使用高精度的参数（例如32位浮点数）来表示权重和激活值。然而，这种表示方式可能会占用大量的内存和计算资源，特别是在部署到资源受限的设备（如移动设备或嵌入式系统）时会受到限制。神经网络量化通过将模型参数和激活值从高精度表示（例如32位浮
神奇的微积分科学的N次方人工智能人工智能 ai
微积分在人工智能（AI）领域扮演着至关重要的角色，以下是其主要作用：优化算法：•梯度下降法：微积分中的导数被用来计算损失函数相对于模型参数的梯度，这是许多机器学习和深度学习优化算法的核心。梯度指出了函数值增加最快的方向，通过沿着负梯度方向更新权重，可以最小化损失函数并优化模型。•反向传播：在神经网络训练中，微积分的链式法则用于计算整个网络中每个参数对于最终损失函数的影响（偏导数），这一过程就是反向
看见光，追逐光，成为光~ 默涵在当下
高屋建瓴的人，散发着高贵气质，周遭牛人很多，咬紧他们~杜总，从看网知网背景出发，讲到发现流量痛点，讲到站点布局，讲到下一步机会，从而又契合到自动驾驶网络。从如何构建五级驾驶，到如何结合现状落地~研究字节跳动对神经网络的改造，注入人的干预分类，优化再到聚类，让算法匹配人的干预能力~基础操作效能提升达到90%，告警防护率达到90%，两者交叉防护有效率达到多少？99%一切皆可AI~一切皆可AI~优秀自觉
线性代数在卷积神经网络（CNN）中的体现科学的N次方人工智能线性代数 cnn 人工智能
案例：深度学习中的卷积神经网络（CNN）在图像识别领域，卷积神经网络（ConvolutionalNeuralNetworks,CNN）是一个广泛应用深度学习模型，它在人脸识别、物体识别、医学图像分析等方面取得了显著成效。CNN中的核心操作——卷积，就是一个直接体现线性代数应用的例子。假设我们正在训练一个用于识别猫和狗的图像分类器，原始输入是一幅RGB彩色图片，可以将其视为一个高度、宽度和通道数（R
高质量 Git 仓库汇总（持续更新，方便查看） Nice_cool. 学习
Leetcodehttps://github.com/kamyu104/LeetCode-SolutionsCmakehttps://github.com/viva64/pvs-studio-cmake-examples3D目标检测Awesome-3D-Object-DetectionAwesome-3D-Object-Detection-for-Autonomous-DrivingCudaCod
【PyTorch】成功解决ModuleNotFoundError: No module named ‘torch’ 高斯小哥 PyTorch零基础入门教程 pytorch 人工智能 python conda debug 深度学习机器学习
【PyTorch】成功解决ModuleNotFoundError:Nomodulenamed‘torch’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录
今日无更新我的昵称违规了
学校的一个会忙得昏天黑地。明天有自己的一个发表，还要准备PPT，根据原来的改改就好……这周真的是有点繁杂了，搞定之后连着四五月份要写两篇论文，再加上五月底的课程论文还有紧接着的文献综述，看样子要疯……现在梳理一下自己手里的锤子：转到Pytorch，使用AllenNLP了解Transformer、了解LSTM了解jieba等分词工具了解Gensim等NLP处理工具接下来要做的：基于AllenNLP搞
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&