zjjszj

YOLO1-3

0 引言

Yolov1（You Only Look Once: Unified, Real-Time Object Detection）是2015年。
Yolov2（YOLO9000: Better, Faster, Stronger）是2017年文章。
Yolov3（YOLOv3: An Incremental Improvement）是2018年文章。
Yolo系列是一个集其他网络优点于一身的检测网络。

YoloV1

方法

图像被划分为S×S的格子（S=7），每个格子设置B（B=2）个bounding box，因此输出为 $\times S \times ((4+1)B +C)$ 维向量，其中的1为置信度。C为类别数目。与fasterrcnn中region proposal network不同的是bounding box的大小以及形状并不是预先设定好的，需要训练过程中不断学习。回归网络部分使用全连接层作为输出，直接输出边框的坐标及宽高，最后对所有的bounding box使用NMS并按照置信度（confidence）排序，生成检测结果。

损失函数

将分类也作为回归问题看待，损失函数由三部分组成：回归损失函数、置信度损失函数和类别损失函数，都是使用的均方误差损失函数。

第一二行为坐标损失函数， $1_{i,j}^{obj}$ 为真值表达式，在一个grid内，当存在对象时，按照一个bounding box对一个对象负责的原则，选取IOU最大值的bounding box的 $1_{i,j}^{obj}$ 设为1，另一个设为0 。宽或高直接相减的话，小物体比大物体更加敏感，因此使用先取根号想减在平方的方式。当 $1_{i,j}^{obj}$ 为1时预测的坐标及宽高的值选取bounding box中IOU最大的一个。
第三行为bounding box中存在对象（属于前景）的损失函数。
第四行为bounding box中不存在对象（属于背景）的损失函数， $1_{i,j}^{noobj}$ 与 $1_{i,j}^{obj}$ 正好相反，因为背景的格子相当多容易导致模型跑偏所以使用 $\lambda_{noobj}$ 控制样本不平衡问题。
第五行为分类损失函数， $1_i^{obj}$ 为真值表达式，当格子对对象负责时也就是说对象的中心点落在当前格子中时，值为1，否则为0。

优点

速度快。

缺点

定位不够准确、准确率不高、召回率低（bounding box太少）。
因为设置的是S=7，一个格子只能预测一个对象，所以一张图像中最多能识别7×7=49个对象，对于数量很多的图像如鸟群则效果不好。
因为bounding box是从训练数据中学习到的，因此很难检测新的或不寻常形状的物体。也就是说物体的形状与训练数据的形状差别很大。
小bounding box与大bounding box权重相同，然而一个小的误差对小bounding box的影响要大于对大bounding box的影响。

YOLOv2

获得2017年最佳论文。yolov2也叫yolo9000， yolo2与yolo9000是两个模型，结构相同只是训练方法不同，后者采用联合训练的方式使得检测物体超过9000种。yolov2主要是借鉴了许多优秀成果然后在yolov1上的改进，yolov2与其他优秀算法在数据集VOC2007上的比较如图1和图2所示。

图1 yolov2与其他优秀算法在数据集VOC2007的比较

图2 yolov2与其他算法在数据集VOC2007上的比较

图2中yolov2 288 $\times$ 288表示测试图像的分辨率为288 $\times$ 288，依次类推，模型本身是相同的。
从图1和图2中可以看到当测试图片的分辨率为416 $\times$ 416及以上时，yolov2与faster-rcnn、ssd512的map相当，但是速度要快很多。在coco数据集上的比较如图3所示。

图3 yolov2与其他优秀算法在数据集coco的比较

注:
coco数据集：包含80个类别，20多万张图片，评价指标中S：<32, M：32-96， S：>96，检测指标如下图所示。
voc2007和voc2012：包含20个类别，总共3万多张图片。

从图3中可以看到在coco数据集上yolov2的检测效果甚至不如ssd300，说明了当需要检测的类别数量很多时，只从map的角度看SSD512>Faster-rcnn>SSD300>YOLOV2.

1 创新点

创新点不多，大部分都是借鉴了其他优秀成果。

提高了yolov1的速度与精度。
提出一种联合训练的方法，提高检测物体的种类数。当测试图像的大小为416时，yolov2的预测种类数为 $13\times13\times5=845$ 个，yolo9000则能够预测9000多种。

2 优点

在VOC数据集上无论是速度还是精度都优于ssd、faster-rcnn。

3 缺点

在coco数据集上，AP和AR均低于ssd、faster-rcnn。

4 方法

yolov2的思想是在保证速度的前提下通过使用一堆技术提升map，使用的技术如下图3所示.

图3 从yolo过渡到yolov2

4.1 batch norm

在每一个卷积后加入batch norm，规范化数据，可以提升收敛速度也可以降低模型过拟合。MAP提升了2.4%。

4.2 High Resolution Classifier

解决预训练输入图片分辨率与训练图片分辨率不同的问题。首先在ImageNet分类数据集训练主体网络（特征提取器），数据集的分辨率为224 $\times$ 224，小分辨率不利于检测，所以yolov1的办法是将检测图片的分辨率增加到448，微调模型。在不同的数据集上微调模型显然不如都在分类数据集上微调模型，yolov2具体的做法是在分类数据集上训练完模型后，将图片的分辨率调至448，微调模型10epoch。然后直接在检测模型上训练。MAP提高4%

4.3 Convolutional With Anchor Boxes

借鉴了faster-rcnn的anchor，去掉了全连接层，使用卷积层代替，去掉一个pool层，检测网络的输入不是448 $\times$ 448，而是采用416 $\times$ 416，输出为13 $\times$ 13，输出要尽可能为奇数，因为作者认为大的物体的中心落在特征图中心，奇数的特征图中心只有一个，正好负责预测该物体。因为网络下采样为32倍，所以输入为32的倍数。在yolov1中，一个格子（两个bounding box）负责类别预测，而yolov2中一个bounding box负责一个类别预测。召回率提升了7%而MAP略有下降，有可能是召回率提升了，所以MAP略有下降。

4.4 Dimension Clusters

在数据集VOC和COCO上对图像边框聚类。结果如图4所示。

图4 VOC和COCO数据集上聚类边框结果

4.5 New Network: Darknet-19

使用新的主体网络架构。MAP几乎不变，但是计算量减少约33%

4.6 Direct location prediction

回归网络中，在faster-rcnn中的预测方法为：给定anchor的宽为 $w_a$ （其他类似），预测的宽为 $w$ ，宽的偏移值为 $t_w$ ，GT为 $w_g$ ，目的是使预测值 $w$ 接近GT值 $w_g$ ，对anchor进行平移和缩放，有(原论文中减号写错了)：
$x=(t_x *w_a)+x_a$ $y=(t_y *h_a)+y_a$ $w=w_a*e^{t^w}$ $h=h_a*e^{t^h}$ 只要预测出偏移值 $t_x t_y w_a h_a$ 即可，但是这种方法对x和y的值没有约束，因此x、y可以出现在图中的任意位置，而yolov2想要将x、y限制在一个格子内，所以在回归中心坐标时采用的方法为预测格子左上角与gt的距离，网络输出值经过函数sigmoid函数 $\sigma(x)$ 转化为0-1的值。注意到此时并没有使用anchor中心点坐标值。在回归边框宽和高时采用的方法与faster-rcnn相同。
设 $c_x$ 表示格子左上角x坐标， $b_x$ 表示预测的边框x坐标， $p_w$ 表示anchor的宽。计算方法如下：

位置关系如图5所示。

图5 anchor和预测值的位置关系

4.7 Fine-Grained Features

当输入图像大小为416时输出大小为13，此时不能检测小物体，还需要更加精细特征，yolov2提出passthrough层来做获得图像细粒度特征。思想是将前面大的特征图连接到后面小的特征图当中，因此小的特征图就获得了更加精细的特征。比如将 $26\times26\times512$ 大小的特征图经过passthrough处理后变成 $13\times13\times2048$ 大小的特征图，特征图大小减小4倍通道增加4倍，如图6所示，然后再与后面的 $13\times13\times512$ 的特征图连在一起。MAP提升1%

图6 passthrough演示

4.8 Multi-Scale Training

由于yolov2中只有卷积和池化，因此可以输入不同尺寸的图片，采用的方法是每隔10 iteration后，改变输入图片的大小，因为yolov2下采样总共为32倍，因此图片大小为32的倍数（320…352…608…），当输入图片为320时，输出的特征图大小为10，不是奇数了，这个是一个疑问，

5 训练

训练提取特征的分类网络：在ImageNet分类数据集上训练，此时输入分辨率为224，训练160epochs，然后微调网络将图片分辨率调至448，训练10epochs。
修改分类网络：移除最后一个卷积层、global avgpooling层以及softmax层，并且新增了三个 $3\times3\times1024$ 卷积层，同时增加了一个passthrough层，最后使用 $1\times1$ 卷积层输出预测结果，输出的通道为 $nums\_anchor\times(5+nums\_classes)$ 。

5.1 损失函数

损失函数原文中并没有给出，参考链接：yolov2的原理与实现知乎，框的匹配原则与yolov1相同，只有一个框对对象负责，与yolov1不同点在于yolov2每一个anchor都有一个类别的预测，因此每一个框都可以检测一个对象，而yolov1中每一个格子预测一个类别概率，格子中的边框共享同一个类别概率，因此yolov2能够预测更多的对象。

与YoloV1损失函数公式相似，都是正例贡献所有三个部分的损失值，负例只贡献置信度部分的损失值，不同点在于

分类部分损失值：YoloV1分类损失函数只计算对象中心点所在的格子，而YoloV2计算IOU最大值的bounding box。
位置部分损失值：一样。
置信度部分损失值：YoloV1中IOU最大值为正例，另外一个为负例。YoloV2中IOU最大值为正例，IOU<0.6为负例。

yolo9000

1 创新

提出一种分类和检测联合训练的策略。

YoloV3

1 创新

多个网络优点的叠加。

2 优点

Yolov3的推理时间及精度如图1.1所示。

图1.1 推理时间与ap图

由图1.1可知，与SSD、RetinaNet及之前的网络相比，ap都为33.0%左右时，推理时间更快。
多尺度的实现：使用三个特征图，有利于检测小物体。
没有正负样本不平衡问题，作者认为是因为将置信度损失与分类损失分开的原因，使得负例只在置信度部分而分类损失部分没有负例。
使用带残差块的网络Darknet-53，相比yolov2网络结构更深。

3 缺点

由图1.1可知，Yolov3网络的最高ap为33.0%，而RetinaNet为37.8%，但是RetinaNet的推理时间增加好几倍。

4 方法

输出三个特征图：8 × 8 × 255、16 × 16 × 255、32 × 32 × 255，每个特征图每个grid包含3个先验框，共9种先验框（(10×13)，(16×30)，(33×23)，(30×61)，(62×45)，(59× 119)， (116 × 90)， (156 × 198)，(373 × 326) ，顺序为w × h），这些先验框由k-means算法在coco数据集中（resize to(416×416)）聚类带标签的框而求得。分类回归网络在第一个特征图上输出8 × 8 × 255（3 x（4+80+1）)，以此类推。
训练时所有的先验框都参与训练。推理时去掉低阀值的先验框，然后经过NMS，得到最后的结果。
与ground truth的IOU值最大的先验框为正例，大于某阀值（论文取0.5）为忽略样例不贡献损失值，小于该阀值为负例只贡献objectness部分损失（正例为1，其他为0，判断为前景还是背景）。

5 训练

5.1 backbone网络

darknet网络结构如下图所示。

5.2 损失函数

与YoloV2损失函数公式相似，都是正例贡献所有三个部分的损失值，负例只贡献置信度部分的损失值，不同点在于

分类部分损失值：yolov3没有使用softmax损失函数，而是使用多标签分类损失函数binary cross-entropy loss，也可以在多标签任务中使用。
位置部分损失值：yolov3中并没有使用根号的方式，采用 $2-w_i*h_i）$ 的方式，作用效果相似，类似于focal loss的形式。
置信度部分损失值：YoloV3中IOU<0.5为负例，yolov2中IOU<0.6为负例。

6 作者使用不成功的方法

使用focal loss后，ap值下降。作者认为可能是由于不存在正负样本不均衡问题导致。
正负样本划分标准为：>0.7为正[0.7, 0.3]忽略，<0.3为负，但是不work作者认为可能是因为训练不稳定所致。

7 U版代码阅读

通过阅读代码发现其中用到了许多技巧。

7.1 rectangle training

长方形训练，常见的训练方法是将训练图片裁剪到比如416*416的正方形，作者使用长方形的训练方法可以使检测速度提高1/3，具体的做法是按照原图像的比例缩放为最长边为416的图片，作为batch_shape(选择最大的)，计算方法为

self.batch_shapes = np.ceil(np.array(shapes) * img_size / 32. + pad).astype(np.int) * 32

同样地缩放图片最长边为416，但是短边的计算方法为：

w=w0*416/max(h0,w0)
h=h0*416/max(h0,w0)

8 模型结构

下面图片来源自博客

下图展示了U版yolov3-spp的结构图细化。
其中cat表示连接操作。Conv(channels, size, stride, pad)

从图中可以看出：

在生成最终的scale时，需要对特征图卷积。
scale分为3个尺度，当输入图片的大小为256时，尺度的大小分别为8，16，32.

SPP结构图如下图所示。论文中是修改后的SPP网络结构。maxpool(stride, size)

【小白学AI系列】NLP 核心知识点（三）Word2Vec Blankspace空白人工智能自然语言处理 word2vec
Word2Vec定义：Word2Vec是一种将单词转化为向量的技术，基于神经网络模型，它能够将单词的语义关系通过向量空间的距离和方向进行表示。通过Word2Vec，我们可以将单词从一个离散的符号转化为一个稠密的向量（一般是高维的），并且能够捕捉到单词之间的语义关系和相似性。历史来源：Word2Vec由TomasMikolov等人于2013年在谷歌提出，它迅速成为了词向量表示（wordembeddi
图像超分，提高图像分辨率的方法和工具风暴之零 python 图像处理深度学习
图像超分是一种图像处理技术，旨在提高图像的分辨率，使其具有更高的清晰度和细节。这一技术通常用于图像重建、图像恢复、图像增强等领域，可以帮助我们更好地理解和利用图像信息。图像超分技术可以通过多种方法实现，包括插值算法、深度学习等。其中，深度学习的方法在近年来得到了广泛的关注和应用。基于深度学习的图像超分技术，可以利用深度神经网络学习图像的高频部分，从而提高了图像的分辨率和清晰度。总结：传统方法效果不
深度学习模型在汽车自动驾驶领域的应用 eso1983 深度学习汽车自动驾驶
汽车自动驾驶是一个高度复杂的系统，深度学习和计算技术在其中扮演核心角色。今天简单介绍一下自动驾驶领域常用的深度学习模型及其计算原理的解析。1.深度学习模型分类及应用场景1.1视觉感知模型CNN（卷积神经网络）应用：图像分类、物体检测（车辆、行人、交通标志）、语义分割（道路、车道线）。典型模型：YOLO：实时目标检测，低延迟特性适合自动驾驶。MaskR-CNN：结合检测与像素级分割，用于精确场景理解
自然语言处理-词嵌入 (Word Embeddings) 纠结哥_Shrek 自然语言处理人工智能
词嵌入（WordEmbedding）是一种将单词或短语映射到高维向量空间的技术，使其能够以数学方式表示单词之间的关系。词嵌入能够捕捉语义信息，使得相似的词在向量空间中具有相近的表示。常见词嵌入方法基于矩阵分解的方法LatentSemanticAnalysis(LSA)LatentDirichletAllocation(LDA)非负矩阵分解(NMF)基于神经网络的方法Word2Vec（Google提
基于深度学习的大规模模型训练 SEU-WYL 深度学习dnn 深度学习人工智能 dnn
基于深度学习的大规模模型训练涉及训练具有数百万甚至数十亿参数的深度神经网络，以处理复杂的任务，如自然语言处理、计算机视觉和语音识别。以下是关于基于深度学习的大规模模型训练的详细介绍：1.背景和动机数据和模型规模增长：随着数据量和模型复杂度的增加，传统的单机或小规模集群训练难以满足需求。计算资源需求：大规模模型训练需要大量计算资源和存储，单一设备无法满足。任务复杂性：处理复杂任务（如GPT-3、BE
深度解读大语言模型中的Transformer架构老三不说话、 transformer
一、Transformer的诞生背景传统的循环神经网络（RNN）和长短期记忆网络（LSTM）在处理自然语言时存在诸多局限性。RNN由于其递归的结构，在处理长序列时容易出现梯度消失和梯度爆炸的问题。这导致模型难以捕捉长距离的依赖关系，对于复杂的自然语言文本，无法有效地学习到上下文的关键信息。LSTM虽然在一定程度上缓解了梯度消失的问题，但依然存在梯度不稳定的情况。而且，RNN和LSTM在计算过程中，
Transformer模型结构分析：Encoder、Decoder以及注意力机制详解 AI天才研究院 Python实战大数据AI人工智能自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介Transformer模型由论文[1]提出，其基本思想是使用注意力机制代替循环神经网络(RNN)或卷积神经网络(CNN)，是一种基于序列到序列(Seq2seq)的机器翻译、文本摘要、对话系统等任务的成功范例。Transformer模型使用全连接层代替RNN和CNN的门控结构，并用多头注意力机制进行了改进，能够在捕捉全局上下文信息的同时，还保持输入输出序列之间的独
基于深度学习的行人检测识别系统：YOLOv8 + UI界面 + 数据集完整实现 2025年数学建模美赛深度学习 YOLO ui 人工智能分类
1.引言行人检测与识别是计算机视觉中的一个重要领域，广泛应用于安防监控、智能交通、自动驾驶等多个领域。传统的行人检测方法面临着许多挑战，如低光照、复杂背景、遮挡等问题。随着深度学习技术的迅猛发展，基于卷积神经网络（CNN）的方法，尤其是YOLO（YouOnlyLookOnce）系列算法，在行人检测中取得了显著的效果。YOLOv8作为YOLO系列的最新版本，继承了YOLO一贯的高效性和准确性，在速度
Python从0到100（八十六）：神经网络-ShuffleNet通道混合轻量级网络的深入介绍是Dream呀 Python python 神经网络网络
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
【人工智能】基于Python的机器翻译系统，从RNN到Transformer的演进与实现蒙娜丽宁 Python杂谈人工智能人工智能 python 机器翻译
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界机器翻译（MachineTranslation,MT）作为自然语言处理领域的重要应用之一，近年来受到了广泛的关注。在本篇文章中，我们将详细探讨如何使用Python实现从传统的循环神经网络（RNN）到现代Transformer模型的机器翻译系统。文章将从机
python 求导实现_python – NumPy中的Softmax导数接近0(实现) 非凡运营笔记 python 求导实现
这是如何以更加矢量化的numpy方式计算softmax函数的导数的答案.然而,偏导数逼近零的事实可能不是数学问题,并且只是学习率或复杂深度神经网络的已知死亡权重问题.像ReLU这样的图层有助于防止后一问题.首先,我使用了以下信号(仅复制您的上一个条目),使其成为4个样本x3个特征,因此更容易看到尺寸发生了什么.>>>signal=[[0.3394572666491664,0.30890680539
跨平台物联网漏洞挖掘算法评估框架设计与实现文献综述之GMN XLYcmy 漏洞挖掘物联网网络安全漏洞挖掘跨架构静态检测图神经网络项目报告
2.4Gemini和GMN我们采用了两种方式：Gemini和GMN。2.4.2GMN图神经网络（GraphNeuralNetworks-GNNs）是一种用于学习结构化数据及相关预测问题的方法。节点的表示被用于节点分类或生成图向量再用于分类。GMN模型针对图的相似性学习问题，提出了一种使用GNNs将图嵌入到向量空间，并通过交叉图注意机制来计算相似度分数以关联图之间的相似性的模型。GMN模型不是独立地
讯飞智作 AI 配音技术浅析（一）爱研究的小牛 AIGC—技术综述 AIGC—概述 AIGC—音频人工智能 AIGC 机器学习深度学习
一、核心技术讯飞智作AI配音技术作为科大讯飞在人工智能领域的重要成果，融合了多项前沿技术，为用户提供了高质量的语音合成服务。其核心技术主要涵盖以下几个方面：1.深度学习与神经网络讯飞智作AI配音技术以深度学习为核心驱动力，通过以下关键模型实现语音合成：Tacotron模型：该模型采用端到端的编码器-解码器架构，将输入文本直接转换为梅尔频谱（Mel-spectrogram），再通过声码器生成语音信号
利用去雾算法实现低光增强 mytzs123 图像增强算法 opencv 人工智能
[论文阅读](11)ACE算法和暗通道先验图像去雾算法（Rizzi|何恺明老师）_暗通道去雾算法-CSDN博客//https://zhuanlan.zhihu.com/p/500023711?utm_id=0#include#include#include#include#include#includeusingnamespacecv;usingnamespacestd;namespace{voi
超实用的Python深度学习教程 - 基于TensorFlow和Keras框架（含实例及完整代码） AI_DL_CODE 人工智能 python 深度学习 tensorflow
一、深度学习概述（一）深度学习的定义与发展历程深度学习在当今的科技领域占据着极为重要的地位。它是人工智能的一个重要分支，其定义为通过构建具有很多层的神经网络模型，让计算机自动从大量数据中学习复杂模式的一种技术。深度学习的发展历程可谓波澜壮阔，早期它源于对人工神经网络的研究，从简单的感知机模型开始。在发展初期，由于计算资源的限制以及数据量的不足等因素，发展较为缓慢。然而，随着计算机技术的飞速发展，尤
2025年美赛数学建模2025 MCM Problem A: Testing Time: The Constant Wear On Stairs A题测试时间：楼梯上的持续磨损代码解析 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模 2025年数学建模美赛 2025数学建模美赛 A题 2025 楼梯上的持续磨损 matlab代码
目录Python1.数据预处理与特征工程数据标准化与特征构建2.行进方向偏好分析深度神经网络（DNN）用于方向性分析3.多人同时使用分析卷积神经网络（CNN）用于磨损模式识别4.时间序列分析LSTM模型用于时间序列预测matlab代码Python我们将采用更多的机器学习和深度学习技术，例如图像处理、深度神经网络（DNN）、卷积神经网络（CNN）等，并结合不同的算法进行更深入的分析。1.数据预处理与
Llama大型语言模型原理详解摆烂大大王 llama llama 语言模型人工智能
Llama大型语言模型是一种基于深度学习的自然语言处理模型，它在文本生成、问答、摘要等多种NLP任务中展现出强大的性能。本文将详细解析Llama模型的原理，包括其结构、训练过程以及工作机制，帮助读者深入理解这一先进的模型。一、模型结构Llama模型采用了一种基于Transformer的架构，这是一种由多个自注意力机制和前馈神经网络组成的深度神经网络结构。Transformer架构通过自注意力机制捕
PyTorch 快速入门無量空所深度学习机器学习 pytorch 开源
我们将通过一个简单的示例，快速了解如何使用PyTorch进行机器学习任务。PyTorch是一个开源的机器学习库，它提供了丰富的工具和库，帮助我们轻松地构建、训练和测试神经网络模型。以下是本教程的主要内容：一、数据处理PyTorch提供了两个基本的数据处理工具：torch.utils.data.DataLoader和torch.utils.data.Dataset。Dataset用于存储样本及其对应
零碎的知识点（十二）：卷积神经网络CNN通道数的理解！墨绿色的摆渡人零碎知识点 cnn 深度学习神经网络
卷积神经网络CNN通道数的理解！通道数的核心概念解析1.通道数的本质2.单张灰度图的处理示例：3.批量输入的处理通道与批次的关系：4.RGB三通道输入的处理计算过程：示例：5.通道数的实际意义6.可视化理解(1)单通道输入（灰度图）的过滤器(2)三通道输入（RGB）的过滤器总结通道数的核心概念解析1.通道数的本质在卷积神经网络中，通道数（Channels）表示不同过滤器的数量。每个通道对应一个独立
神经网络|(七)概率论基础知识-贝叶斯公式西猫雷婶概率论人工智能概率论
【1】引言前序我们已经了解了一些基础知识。古典概型：有限个元素参与抽样，每个元素被抽样的概率相等。条件概率：在某条件已经达成的前提下，新事件发生的概率。实际计算的时候，应注意区分，如果是计算综合概率，比如A已经发生时，B发生的概率，其实计算的目标是P(AB)。条件概率公式的通用表达式为P(B|A)=P(AB)/P(A)，乘法表达式为P(AB)=P(B|A)P(A)全概率公式：全概率公式综合了所有条
斯坦福吴恩达-深度学习和机器学习全套视频+课件！ Alexquyun 人工智能机器学习深度学习 python
这些课程专为已有一定基础（基本的编程知识，熟悉Python、对机器学习有基本了解），想要尝试进入人工智能领域的计算机专业人士准备。介绍显示：“深度学习是科技业最热门的技能之一，本课程将帮你掌握深度学习。”学生将可以学习到深度学习的基础，学会构建神经网络，并用在包括吴恩达本人在内的多位业界顶尖专家指导下创建自己的机器学习项目。DeepLearningSpecialization对卷积神经网络(CNN
Python从0到100（四十九）：数据库设计及Django ORM使用是Dream呀 python 数据库 django
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
前馈神经网络——最基本的神经网络架构纠结哥_Shrek 神经网络人工智能深度学习
前馈神经网络（FeedforwardNeuralNetwork,FNN）是一种基本的人工神经网络类型，其结构简单，广泛应用于各种机器学习任务。它由多个层次组成，包括输入层、隐藏层和输出层。FNN中的每一层与下一层的神经元之间是完全连接的，但不同层之间的神经元不相互连接。FNN以其数据流动方式来命名——前馈，意味着信息从输入层开始，经过一系列的隐藏层，最终输出结果，不存在任何循环或反馈连接。与递归神
pytorch深度Q网络纠结哥_Shrek pytorch 人工智能 python
DQN引入了深度神经网络来近似Q函数，解决了传统Q-learning在处理高维状态空间时的瓶颈，尤其是在像Atari游戏这样的复杂环境中。DQN的核心思想是使用神经网络Q(s,a;θ)Q(s,a;\theta)Q(s,a;θ)来近似Q值函数，其中θ\thetaθ是神经网络的参数。DQN的关键创新包括：经验回放（ExperienceReplay）：在强化学习中，当前的学习可能会依赖于最近的经验，容易
灰色预测模型_预测模型——灰色模型 weixin_39548740 灰色预测模型
网上有许多大佬写的灰色预测模型，写的非常的棒，但是我个人感觉，在公式部分，许多大佬在写最小二乘法得出a，b的值的时候并不是那么细致，所以我写这一篇灰色模型既是详细介绍公式的由来，同时也是为后续我要写的组合模型，如灰色模型与神经网络的结合，灰色模型与马尔可夫链式模型的结合做一个铺垫，希望对大家有帮助。1，灰色系统介绍灰色系统是由华中科技大学的邓聚龙教授于80年代初创立，该系统作为新兴的横断学科，在短
AI 大模型创业：如何利用商业优势？ AI天才研究院大数据AI人工智能 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
第1章：AI大模型概述1.1AI大模型的概念与演进AI大模型（Large-scaleArtificialIntelligenceModels）是指通过大规模数据训练得到的复杂神经网络模型。这些模型通常具有数十亿甚至千亿个参数，能够实现从自然语言处理到计算机视觉、语音识别等广泛领域的任务。AI大模型的概念起源于20世纪80年代，当时研究人员提出了深度学习（DeepLearning）这一概念。深度学习
Python 实现文本摘要功能热爱技术的小胡 python
互联网时代信息爆炸式增长，人们面对越来越多的信息无法一一阅读，而文本自动摘要技术可以一定程度上缓解这个问题。摘要就是一篇文章的核心部分信息，文本自动摘要技术分抽取式摘要和生成式摘要，前者是在原文中挑选一定比例的句子拼凑成一个摘要，后者更接近人为的总结式简写一篇文章。目前越来越多的研究者使用深度神经网络来研究生成式摘要技术，但是难度也挺大，效果有限。本文的方法是使用基于启发式规则的算法实现了一个抽取
基于CNN-GRU-Attention混合神经网络的负荷预测方法（Python代码实现）宇哥预测优化代码学习神经网络 cnn gru
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述一、引言二、模型结构三、数据预处理四、模型训练与评估五、实验结果与分析六、结论与展望2运行结果3参考文献4Python代码实现及数据1概述基于CNN-GRU(convolutionalneuralnetworks-gaterecurrentunit)神经网络的电
python神经网络框架有哪些,python调用神经网络模型小明技术分享 python 神经网络深度学习
人工智能Python深度学习库有哪些由于Python的易用性和可扩展性，众多深度学习框架提供了Python接口，其中较为流行的深度学习库如下：第一：CaffeCaffe是一个以表达式、速度和模块化为核心的深度学习框架，具备清晰、可读性高和快速的特性，在视频、图像处理方面应用较多。Caffe中的网络结构与优化都以配置文件形式定义，容易上手，无须通过代码构建网络;网络训练速度快，能够训练大型数据集与S
大语言模型原理与工程实践：残差连接与层归一化 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着自然语言处理（NLP）的发展，深度学习在过去几年中取得了令人瞩目的成果。其中，循环神经网络（RNN）和卷积神经网络（CNN）在图像和文本分类、语义角色标注、机器翻译等领域表现出色。然而，这些网络在训练过程中经常遭遇梯度消失和梯度爆炸的问题。为了解决这些问题，我们引入了残差连接（ResidualConnections）和层归一化（BatchNormalization）来改善模型性能。
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多

YOLO1-3

0 引言

YoloV1

方法

损失函数

优点

缺点

YOLOv2

1 创新点

2 优点

3 缺点

4 方法

4.1 batch norm

4.2 High Resolution Classifier

4.3 Convolutional With Anchor Boxes

4.4 Dimension Clusters

4.5 New Network: Darknet-19

4.6 Direct location prediction

4.7 Fine-Grained Features

4.8 Multi-Scale Training

5 训练

5.1 损失函数

yolo9000

1 创新

YoloV3

1 创新

2 优点

3 缺点

4 方法

5 训练

5.1 backbone网络

5.2 损失函数

6 作者使用不成功的方法

7 U版代码阅读

7.1 rectangle training

8 模型结构

你可能感兴趣的:(论文阅读,神经网络)