秃头小苏

yolo原理系列——yolov1--yolov5详细解释

yolo系列原理

文章目录

yolo系列原理
- 先唠唠
- yolo-v1
- - 整体架构
  - 具体实现
  - 损失函数
  - yolo-v1的优点及局限
- yolo-v2
- - batch normalization（归一化）
  - hi-res calssifier（高分辨率分类器）
  - new network
  - anchor boxes（先验框）
  - dimension priors（维度聚类）
  - location prediction
  - passthrough
  - multi-scale
- yolo-v3
- - 多scale
  - resnet（残差网络）
  - 多标签分类
  - 网络架构
- yolo-v4
- yolo-v5

先唠唠

这部分主要讲述yolo系列各个版本的的原理，这部分会把yolov1到yolov5的原理进行详细的阐述。首先我们先来看深度学习的两种经典的检测方法：

Two-stage（两阶段）：代表-- Fsater-rcnn Mask-rcnn系列
One-stage（单阶段）：代表-- Yolo系列

两阶段和单阶段有什么样的区别呢，我们从整体上理解：单节段的就是一步到位，我们输入一个图像，经过一系列传化，最终会得到一个输出结果；双阶段相较于单节段多了一些中间步骤，输入一个原始图像，我们会先得到一些中间值，最后才输出结果，更形象的表述为，我们要选择一个人当代表，代表安徽省踢球，那么双阶段就类似与我先在安徽各个市找一些好苗子，最后再从这些好苗子中选择一个最优秀的。具体可以参照下图：

既然两种检测方式有所区别，那自然会讨论他们的优缺点：

One-stage
- 优势：速度非常快，适合做实时检测任务
- 劣势：效果通常不会太好
Two-stage
- 优势：效果通常比较好
- 劣势：速度较慢，不适合做实时检测任务

其实他们的优缺点我们也很好理解，单阶段检测的没有中间过程，那速度肯定是相当哇塞了，但从效果来说，就相对差一点。我们可以看一下他们的对比（以单阶段的yolo和双阶段的Faster-rcnn为代表）

从上图可以看出，YOLO的mAP要低于Fast-rcnn,但是FPS却远高于Fast-rcnn。【FPS表示一个网络的检测速度，越大速度越快，mAP表示模型综合检测的效果，越大效果越好】

上面提到了一个术语：mAP。它表示的是一个综合检测的效果，因为表示模型效果的参数有很多，像IOU、precision、recall（好吧，这三是不是也不知道）下面先来介绍这三个参数：

IOU

IOU其实很好理解，其表示（真实值和预测值的交集）占（真实值和预测值的并集）的比列，这也即是IOU的计算公式，如下：

哎！！！？不是很好理解嘛…通俗点讲，IOU就表示真实值和预测值重叠的部分多不多，重叠多IOU就大，检测效果就好！！！可以再参照下图进行理解：

precision(精度) && recall(召回率)

我们先来看他们的公式（好吧，我承认开始肯定看不懂）

我们通过一个例子来解释上诉公式中TP、FP、FN的含义，进而解释precision和recall。

已知：班级共100人，其中男生80人，女生20人

目标：找出所有女生

结果：从班级中选择了50人才找出20个女生，也即错误的把30名男生也挑选出来了

我们先来看看TP、FP、FN中三个英文字母T、F、P、N的含义，可能会便于你理解

T——Ture 正确的判断

F——False 错误的判断

P——Positives 正类（表示需要检测目标，例子中就是指女生）

N——Negatives 负类

知道了这些字母的含义，就很好解释这三个哥们了。

TP——Ture Positives（表示判断正确，把正类判断成正类，例子中也就是表示把女生判断成了女生）

FP——False Positives（表示判断错误，把负类判断成正类，例子中也就是表示把男生判断成了女生）

FN——False Negatives（表示判断错误，把正类判断成负类，例子中也就是表示把女生判断成了男生）

TN——True Negatives（表示判断正确，把负类判断成负类，例子中也就是表示把男生判断成了男生）【公式中没用到这个】

上面的几个可能会有点绕，但静下心来研究研究，会发现很简单。这里我就当上面的都看懂了，下面我们就可以计算例子中的TP、FP、FN、TN的值了。

TP=20 【把正类判断成正类，即找到的20个女生】

FP=30 【把负类判断成正类，即错误选出的30个男生】

FN=0 【把正类判断成负类，这里为0】

TN=50 【把负类判断成负类，即没有选出来的50个男生】

好，现在就都求出了TP、FP、FN，则precision和recall都可以计算出来了。

读到这里，我想你就明白了precision和recall是怎么计算出来的了，但是对于precison和recall为什么用这样的式子表示呢，可能还存在一定的疑惑，先对两个公式进行描述。

precision（精度）
首先，精度表示分类的准确性，它等于将（正类分类正确）与（正类分类正确和错误）的比列。对于例子来说precision=20/(20+30)=2/5。
recall（召回率，也叫查全率）

召回率的含义是表示（正类分类正确）与（正类分类正确和把正类判断成负类）的比值。对例子来说recall=20/(20+0)=1。通俗点说，recall表示的就是一些没有检测到的物体的比例，比如一张图片有10个目标需要检测，一种方法你检测到了10种目标，那你的召回率就好；而另一种方法只检测到了8个图片，那么你的召回率就不好。

知道了precision和recall，这两个指标都可以表示检测的效果，为了综合表示检测效果，产生了mAP。首先先介绍什么是AP？AP事实上指的是，我们取不同的置信度，可以获得不同的Precision和不同的Recall，当我们取置信度足够密集的时候，就可以获得非常多的Precision和Recall。利用不同的Precision和Recall的点的组合，画出来的曲线下面的面积即为AP的大小。如下图所示：

AP衡量的是对一个类检测好坏，mAP就是对多个类的检测好坏。计算方法就是把所有类的AP值取平均。比如有两类，类A的AP值是0.6，类B的AP值是0.4，那么mAP=（0.6+0.4）/2=0.5。

yolo-v1

整体架构

yolo的英文全称为You only look once，听起来好的样子。这也反应了yolo检测的速度很快，适合做实时检测任务。我们先来看yolo-v1的整体网络架构，如下图所示：

从上图可以看出yolo-v1：

网络输入：448×448×3的彩色图片。
卷积层：由若干卷积层和最大池化层（池化层未画出）组成，用于提取图片的抽象特征。
全连接层：由两个全连接层组成，用来预测目标的位置和类别概率值。
网络输出：7×7×30的预测结果。

具体实现

从上文我们可以得知，yolo-v1的输入是448×448×3的彩色图片，我们会将每一张图片平均的分成7x7个网格，每个网格分别负责预测中心点落在该网格内的目标。

具体实现过程如下：

将一幅图像分成 S×S个网格（grid cell），如果某个 object 的中心落在这个网格中，则这个网格就负责预测这个object。【yolo-v1分成的是7x7大小的网格】
每个网格要预测 B 个bounding box，每个 bounding box 要预测 (x, y, w, h) 和 confidence 共5个值。【yolo-v1要预测的是2个bbox】
每个网格还要预测一个类别信息，记为 C 个类。【yolo-v1预测的类别有20种，像猫，狗，汽车等】
总的来说，S×S 个网格，每个网格要预测 B个bounding box ，还要预测 C 个类。网络输出就是一个 S × S × (5×B+C) 的张量。【对于yolo-v1，网络输出即是一个7x7x30的张量】

如果你之前已经对yolo算法有了一定的了解，看了上面的内容，大概已经知道yolo-v1的核心思想了。但是呢，如果你第一次看yolo或者对yolo原理不是很熟悉的话，那估计还是有点懵逼。下面从网络的架构出发，详细的介绍yolo-v1的细节。

再次贴出这张图，我们从这张网络架构图进行分析。

输入层

输入层是448×448×3的彩色图片，在yolo-v1中要求图片大小是448x448的，这是因为在yolo-v1网络最后接了两个全连接层，全连接层是要求固定大小的向量作为输入的【因为全连接层中权重矩阵W和偏置矩阵b的维度是不变的】，因此要求原始图像也需要一致的图片大小。
卷积层

卷积层就是一层一层的卷积，这一部分倒也没什么好说的，对cnn不熟悉的可以看此篇文章。介绍一下，这是July的创始人写的，我觉得他的机器学习的文章写的真是太好了，用很抽象的语言来解释一些算法，读了之后会让你茅厕顿开——哦，原来是这么回事！！！
全连接层

全连接层有两层，enmm…其实也没什么好讲的，不明白的可以看上面推荐的文章。但是我们可以来看一下后一个全连接层的维度，1470x1，看着是不是有点奇怪，之前好像几乎没有看到这种维度的输出，为什么设计这样的维度呢？我们在下面的网络输出中进行介绍。
输出层

上文提到，最后的全连接层有一个1470x1的输出，这样的维度有什么用呢？其实呢，这是为网络输出准备的，我们的输出要求是7x7x30的张量，刚好是1470，所以全连接层的1470x1的输出经过reshape就可以得到7x7x30的网络输出。我们再来看这个7x7x30网络输出，为什么是这个维度的呢？下面来介绍：

yolo-v1的输入图像被划分为 7x7 的网格（grid），输出张量中的 7x7 就对应着输入图像的 7x7 网格。或者我们把 7x7x30 的张量看作49个30维的向量，也就是输入图像中的每个网格对应输出一个30维的向量。每个网格对应一个30维的向量，这30维的向量中包含哪些信息呢？如下图所示：
- 20个对象的概率
  
  20个对象的概率表示yolo-v1支持20种不同的对象（如猫、狗、汽车等），这里20个对象的概率就是指对应网格中存在任一种对象的概率。
- 2个bbox的置信度
  
  bbox的置信度Confidence表示它是否包含对象且位置准确的程度。置信度高表示这里存在一个对象且位置比较准确，置信度低表示可能没有对象或者即便有对象也存在较大的位置偏差。
- 2个bbox的位置
  
  一个bbox的位置需要4个数值来表示其位置，(Center_x,Center_y,width,height)，即(bounding box的中心点的x坐标，y坐标，宽度，高度)，2个bounding box共需要8个数值来表示其位置。

损失函数

损失函数主要由三部分组成，分别是：坐标预测损失、置信度预测损失、类别预测损失。

yolo-v1的优点及局限

优点
- 检测速度快
- 迁移能力强
缺点
- 输入尺寸固定：由于输出层为全连接层，因此在检测时，YOLO 训练模型只支持与训练图像相同的输入分辨率。其它分辨率需要缩放成此固定分辨率；
- 占比小的目标检测效果不好：虽然每个格子可以预测 2 个 bounding box，但是最终只选择只选择 IOU 最高的bbox作为物体检测输出，即每个格子最多只预测出一个物体。当物体占画面比例较小，如图像中包含畜群或鸟群时，每个格子包含多个物体，但却只能检测出其中一个。
- yolo-v1多标签任务不好完成
- yolo-v1有较大的定位误差

yolo-v2

yolo-v2和yolo-v1的整体思想还是基本一致的，但是也做了很多改进，具体如下图：可以发现再进行这些改进之后，网络的mAP指数基本都有所增加，最后yolo-v2的mAP达到了78.6，而yolo-v1只要63.4。下面将对这些改变进行讲述。

batch normalization（归一化）

v2版本舍弃了droupout（在全连接层，v2没有使用全连接层），卷积后全部加入batch normalization（BN）。什么是BN呢，其实就是归一化，在网络的每一层输入都会做归一化的操作，这样会使收敛更加容易，从上图可以看出，网络加入BN后，网络的mAP提升了将近2个百分点，可见效果十分显著。现在看来，几乎所有的卷积网络都会有batch normalization这一步骤。

BN为什么这么强呢？我举个通俗的例子，现在我市要为小王同学打造一个三年的造星计划，最终目标就是三年后让小王成为我市顶级足球运动员，可是现在一下定一个三年的目标可有点远，我们要一年对小王进行一次全面检测，看看他哪些地方做得不好，给出调整，这样才能尽可能的得到一个高水平的小王。那么BN其实就类似做了每年对小王做检测这样的事，在网络中我们一个卷积后都会对其进行BN操作,这样就会让网络效果更加好，也更容易收敛。

hi-res calssifier（高分辨率分类器）

前面谈及v1版本的时候，说v1输入的是448*448大小的图片，但这是在测试时使用的图片大小，而v1在训练时用的图片大小时224*224d的，这样可能会导致模型前后不一致，影响效果。于是v2在训练时额外又加了10次448*448的微调，这样也使得v2的mAP提升了约4个百分点。

new network

v2中网络结构发生了改变，采用DarkNet19网络（有19个卷积层）。可以看出网络中没有全连接层，进行了5次降采样，网络的实际输入为416*416，在该网络中采用了很多卷积核为1*1的卷积，这样省了很多的参数。

anchor boxes（先验框）

在v1版本当中，我们说到每个网格要预测 2 个bbox。但是呢，这往往会出现一些问题：就是某个网格中物体较多时，会检测不到所有的物体，即出现漏检的情况，这也就导致recall（召回率，查全率）比较低。那么在v2中呢，我们选择每个网格要预测 5 个bbox，采用这种方法来减少recall低的情况。

下图显示了加了先验框后的效果，可以看出，mAP反而减少了【变化不大，可以认为几乎没变】，但网络的recall却增加了7个百分点。

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0u8Ergv1-1642432549760)(C:\Users\WSJ\AppData\Roaming\Typora\typora-user-images\image-20220108162234752.png)]$

dimension priors（维度聚类）

在上文说到在v2版本中每个网格要预测 5 个bbox，但是这5个bbox的大小不是随便给的，而是通过原始图片聚类得到的，将原始图像中物体框通过K-means算法聚成5类，然后取这五类的平均值作为bbox的大小。这样得出的bbox的大小更符合实际情况，检测效果更好。

location prediction

在yolo-v1中，是通过预测 bounding box 与 ground truth 的位置偏移值t_x,t_y，间接得到bounding box的位置。其公式如下：

个公式是无约束的，预测的边界框很容易向任何方向偏移。因此，每个位置预测的边界框可以落在图片任何位置，这会导致模型的不稳定性。

因此 YOLOv2 在此方法上进行了一点改变：预测边界框中心点相对于该网格左上角坐标（ C _x , C _y ）的相对偏移量，同时为了将bounding box的中心点约束在当前网格中，使用 sigmoid 函数将t_x,t_y归一化处理，将值约束在0-1，这使得模型训练更稳定。

passthrough

这部分要涉及感受野的知识，不做解释，不知道的可以查阅相关资料。但还是要给出感受野的相关性质和结论：我们在卷积中往往期待用一些小的卷积核来代替大的卷积核【他们的感受野相同，但使用小卷积核所需的网络参数较少】。卷积网络中，越是后面的卷积层其感受野就越大，这样就更容易看到原始图片的全局信息，但是这样对于原始图片中小物体的检测就变得困难，这时候我们就希望同时获得一些感受野稍微小一点的特征图（卷积层越往前感受野越小），这样就可以检测到小目标。具体做法如下：

可以看出，v2把上一层卷积中的特征图插成了4份，然后再和最后一层的特征图叠加得到最后的输出，这样的结果就同时有了感受野大的和感受野小的特征图，这样对图片的大目标和小目标都会有一个不错的检测效果。

multi-scale

v2版本相较于v1版本而言，没有了全连接层，都是卷积层，这使得网络可以适应多种不同尺度的输入。和v1训练时网络输入的图像尺寸固定不变不同，v2每隔几次迭代后就会微调网络的输入尺寸。这样可以让检测的能力更加全面。通常最小的图像尺寸为320x320，最大的图片尺寸为608x608。

yolo-v3

我们先来看一下v3和其他网络模型的对比！！！看到这张图我不自觉的笑了，这个作者也太有意思了，把v3都画到第二象限了（原点是50）【跨象限碾压】这就足以看出v3的强大了！！！

多scale

在阐述yolo-v2的改进时，我们谈到使用passthrough可以让我们更有效的检测小目标物体，但其实这样的效果还不是很好。yolo-v3又进行了改进，它采用了多scale的先验框来进行检测。如图所示，我们对不同感受野的网络输出结果采用不同的先验框，设计了三种规模的先验框，每种规模又有三种bbox，也就是一共9种先验框。

resnet（残差网络）

resnet（残差网络），这个大家应该都很熟悉了吧，因为是我们中国人先提出的。在深度神经网络训练中，从经验来看，随着网络深度的增加，模型理论上可以取得更好的结果。但是实验却发现，深度神经网络中存在着退化问题，人们就以为神经网络就只能做到这里了。但是后来提出一种网络：resnet。其实这种网络原理很好理解，就类似做一个if语句，每加一层后我都进行一个判断，如果结果是好的我就保留，不好的就舍弃。现在基本上resnet已经成为了网络模型的标配。

多标签分类

yolo-v3在类别预测方面将yolo-v2的单标签分类改进为多标签分类，在网络结构中将yolo-v2中用于分类的softmax层修改为逻辑分类器。在yolo-v2中，算法认定一个目标只从属于一个类别，根据网络输出类别的得分最大值，将其归为某一类。然而在一些复杂的场景中，单一目标可能从属于多个类别。
比如在一个交通场景中，某目标的种类既属于汽车也属于卡车，如果用softmax进行分类，softmax会假设这个目标只属于一个类别，这个目标只会被认定为汽车或卡车，这种分类方法就称为单标签分类。如果网络输出认定这个目标既是汽车也是卡车，这就被称为多标签分类。
为实现多标签分类就需要用逻辑分类器来对每个类别都进行二分类。逻辑分类器主要用到了sigmoid函数，它可以把输出约束在0到1，如果某一特征图的输出经过该函数处理后的值大于设定阈值，那么就认定该目标框所对应的目标属于该类。

网络架构

相比于 YOLOv2 的骨干网络，YOLOv3 进行了较大的改进。借助残差网络的思想，YOLOv3 将原来的 darknet-19 改进为darknet-53。Darknet-53主要由1×1和3×3的卷积层组成，每个卷积层之后包含一个批量归一化层和一个Leaky ReLU，加入这两个部分的目的是为了防止过拟合。卷积层、批量归一化层以及Leaky ReLU共同组成Darknet-53中的基本卷积单元DBL。因为在Darknet-53中共包含53个这样的DBL，所以称其为Darknet-53。

yolo-v4

v3和v4两个版本的作者发生了变化。当时前三个版本的作者redmon在推特上发表了一个声明：大致是说因为yolo-v3已经被用在一些军事上，这是他不想看到的，因此他表示退出CV界。这也从侧面反映了yolo-v3性能的强大。2020年，Alexey Bochkovskiy等人接手了yolo系列，yolo-v4油然而生。

yolo-v4对深度学习中一些常用Tricks进行了大量的测试，最终选择了这些有用的Tricks：WRC、CSP、CmBN、SAT、 Mish activation、Mosaic data augmentation、CmBN、DropBlock regularization 和 CIoU loss。
正是v4中采用了很多的技巧，这些都是近先年各种先进的算法，我没有认真读过这些算法，对这些也不是特别清楚，所以这里不对yolo-v4做整理（整理可能会有很多描述不准确的地方）但是呢，我也在网上看了很多文章，这里我觉得这一篇写得非常清楚，也都把这些用到的算法出处贴了出来，感兴趣的可以自己研读。链接如下：yolo-v4

上面的链接中没有给出原yolo-v4论文,这里附上链接：论文

yolo-v5

呼，终于到v5了，上面的写内容不多，但也花费了2天多的时间终于感觉要到头了

果然不能偷懒，上面的yolo-v4没有自己写，现在的v5好像也不想自己写了。但是“自己的事情自己做”这句话涌上心头，因此我决定还是放上链接吧（真不是自己懒，这个人写的太好了，图文并茂，我认为以我现在的知识储备写不出来，因此还是借用他人的叭！！！到时候需要再看的时候也好直接找到好文章）

链接如下：yolo-v5

咻咻咻咻~~duang~~点个赞呗

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
COCO 格式的数据集转化为 YOLO 格式的数据集 QYQY77 YOLO python
"""--json_path输入的json文件路径--save_path保存的文件夹名字，默认为当前目录下的labels。"""importosimportjsonfromtqdmimporttqdmimportargparseparser=argparse.ArgumentParser()parser.add_argument('--json_path',default='./instances
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
yolov5＞onnx＞ncnn＞apk 图像处理大大大大大牛啊 opencv实战代码讲解 yolo onnx ncnn 安卓
一.yolov5pt模型转onnx条件：colabnotebookyolov51.安装环境!pipinstallonnx>=1.7.0#forONNXexport!pipinstallcoremltools==4.0#forCoreMLexport!pipinstallonnx-simplifier2.修改common.py在classFocus下面
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st