Json____

深度学习之---yolov1,v2,v3详解

（写在前面：如果你想 run 起来，立马想看看效果，那就直接跳转到最后一张，动手实践，看了结果再来往前看吧，开始吧······）

一、YOLOv1 简介

这里不再赘述，之前的我的一个 GitChat 详尽的讲述了整个代码段的含义，以及如何一步步的去实现它，可参照这里手把手实践YOLO深度残差神经网络拐点检测

二、YOLOv2 简介

V1 版本的缺陷和不足，就是 V2 版本出现的源泉与动力，而 V1 版本究竟在哪些地方是它的短板之处呢：

V1 缺陷之处：

输入尺寸固定：由于输出层为全连接层，因此在检测时，YOLO 训练模型只支持与训练图像相同的输入分辨率。其它分辨率需要缩放成此固定分辨率；

占比较小的目标检测效果不好：虽然每个格子可以预测 B 个 bounding box，但是最终只选择只选择 IOU 最高的 bounding box 作为物体检测输出，即每个格子最多只预测出一个物体。当物体占画面比例较小，如图像中包含畜群或鸟群时，每个格子包含多个物体，但却只能检测出其中一个。

2.1 anchor box 的思想引入

为提高物体定位精准性和召回率，YOLO 作者提出了《YOLO9000: Better, Faster, Stronger》 (Joseph Redmon, Ali Farhadi, CVPR 2017, Best Paper Honorable Mention)，也就是 YOLOv2 的论文全名，相比 v1 提高了训练图像的分辨率；引入了 faster rcnn 中 anchor box 的思想，对网络结构的设计进行了改进，使得模型更易学习。

什么是（候选区域框）anchor box？

假设特征可以看做一个尺度 6448 像素的 256 通道图像，对于该图像的每一个位置，考虑 9 个可能的候选窗口：三种面积三种比例。这些候选窗口称为 anchors。下图示出 6448 图像 anchor 中心，在每个面积尺寸下，取三种不同的长宽比例（1:1,1:2,2:1），这样一来，我们得到了一共 9 种面积尺寸各异的 anchor。示意图如下：

以一个点 9 种尺寸来取 proposal，重复区域多。而且 feature map 相邻两个点对应原图的 9 个 proposal 也是很多重复区域。只是整个 faster RCNN 中的第一步，只是对候选区域进行提取 (RPN, region proposal networks, 候选区域生成网络)。这个过程只是希望能够得到覆盖目标的候选区域，所以有不同尺寸不同比例的 proposal(这样才有最大可能可以在一个候选框中包括完整的目标)。而在这之后，确实会有很多重复区域，而这其实是候选区域生成之后的下一个问题。针对这个问题，一般会采用非极大值抑制算法进行去重 (NMS, non maximum suppression)。

至于这个 anchor 到底是怎么用的，这个是理解整个问题的关键。

下面是整个 faster RCNN 结构的示意图：

输入图像无论是什么大小的样本，都要转化为 224*224（可根据情况自己设定）大小的图片，送进网络进行训练。（为什么要固定输入网络图片尺寸呢？后面解释。）

对于每个 3x3 的窗口，作者就计算这个滑动窗口的中心点所对应的原始图片的中心点。然后作者假定，这个 3x3 窗口，是从原始图片上通过 SPP 池化 得到的，而这个池化的区域的面积以及比例，就是一个个的 anchor。换句话说，对于每个 3x3 窗口，作者假定它来自 9 种不同原始区域的池化，但是这些池化在原始图片中的中心点，都完全一样。这个中心点，就是刚才提到的，3x3 窗口中心点所对应的原始图片中的中心点。如此一来，在每个窗口位置，我们都可以根据 9 个不同长宽比例、不同面积的 anchor，逆向推导出它所对应的原始图片中的一个区域，这个区域的尺寸以及坐标，都是已知的。而这个区域，就是我们想要的 proposal。所以我们通过滑动窗口和 anchor，成功得到了 51x39x9 个原始图片的 proposal。接下来，每个 proposal 我们只输出 6 个参数：每个 proposal 和 ground truth 进行比较得到的前景概率和背景概率 (2 个参数）（对应图上的 clsscore）；由于每个 proposal 和 ground truth 位置及尺寸上的差异，从 proposal 通过平移放缩得到 ground truth 需要的 4 个平移放缩参数（对应图上的 bboxpred）。

为什么之前的 CNN 要固定输入网络图片尺寸呢？

CNN 大体包含 3 部分：卷积、池化、全连接

卷积层。卷积操作对图片输入的大小会有要求吗？比如一个 5 * 5 的卷积核，我输入的图片是 30 * 81 的大小，可以得到 (26,77) 大小的图片，并不会影响卷积操作。我输入 600 * 500，它还是照样可以进行卷积，也就是卷积对图片输入大小没有要求，只要你喜欢，任意大小的图片进入，都可以进行卷积。

池化层。池化对图片大小会有要求吗？比如我池化大小为（2，2）我输入一张 30 * 40 的，那么经过池化后可以得到 15 * 20 的图片。输入一张 53 * 22 大小的图片，经过池化后，我可以得到 26 * 11 大小的图片。因此池化这一步也没对图片大小有要求。只要你喜欢，输入任意大小的图片，都可以进行池化。

全连接层。既然池化和卷积都对输入图片大小没有要求，那么就只有全连接层对图片结果又要求了。因为全连接层我们的连接劝值矩阵的大小 W，经过训练后，就是固定的大小了，比如我们从卷积到全连层，输入和输出的大小，分别是 50、30 个神经元，那么我们的权值矩阵（50,30）大小的矩阵了。因此空间金字塔池化，要解决的就是从卷积层到全连接层之间的一个过度。

这里插入卷积、池化层的输入输出计算方法：

例子计算详情

怎么改变这个现状呢，也就是无论输入图片是什么大小，不需要都转化为统一大小的图片，再送入网络的预处理过程。这就出现了大神何凯明的 CNN 应用之 SPP。空间金字塔池化的卷积神经网络物体检测，很详细，能看懂其中原因和机理，不赘述。

2.2 YOLOv2 多处改进

2.2.1 输出层使用卷积层替代 YOLOv1 的全连接层

附 darknet-19 的结构表：

包含 19 conv + 5 maxpooling。用 1x1 卷积层替代 YOLOv1 的全连接层。

1x1 卷积层（此处 1x1 卷积层的存在是为了跨通道信息整合）如上图的红色矩形框部分。

引入一点：YOLO，YOLOv2、YOLO9000，Darknet-19，Darknet-53，YOLOv3 分别是什么关系？

YOLOv2 是 YOLO 的升级版，但并不是通过对原始加深或加宽网络达到效果提升，反而是简化了网络。

YOLO9000 是 CVPR2017 的最佳论文提名。首先讲一下这篇文章一共介绍了 YOLOv2 和 YOLO9000 两个模型，二者略有不同。前者主要是 YOLO 的升级版，后者的主要检测网络也是 YOLOv2，同时对数据集做了融合，使得模型可以检测 9000 多类物体。而提出 YOLO9000 的原因主要是目前检测的数据集数据量较小，因此利用数量较大的分类数据集来帮助训练检测模型。

YOLOv2 使用了一个新的分类网络作为特征提取部分，参考了前人的先进经验，比如类似于 VGG，作者使用了较多的 3 * 3 卷积核，在每一次池化操作后把通道数翻倍。借鉴了 network in network 的思想，网络使用了全局平均池化（global average pooling），把 1 * 1 的卷积核置于 3 * 3 的卷积核之间，用来压缩特征。也用了 batch normalization（前面介绍过）稳定模型训练。最终得出的基础模型就是 Darknet-19，如上图，其包含 19 个卷积层、5 个最大值池化层（maxpooling layers ）

2.2.2 卷积层全部使用 Batch Normalization

v1 中也大量用了 Batch Normalization，同时在定位层后边用了 dropout，v2 中取消了 dropout，在卷积层全部使用 Batch Normalization。

2.2.3 K-Means 算法

我们知道在 Faster R-CNN 中 anchor box 的大小和比例是按经验设定的，然后网络会在训练过程中调整 anchor box 的尺寸。但是如果一开始就能选择到合适尺寸的 anchor box，那肯定可以帮助网络越好地预测 detection。所以作者采用 k-means 的方式对训练集的 bounding boxes 做聚类，试图找到合适的 anchor box。

另外作者发现如果采用标准的 k-means（即用欧式距离来衡量差异），在 box 的尺寸比较大的时候其误差也更大，而我们希望的是误差和 box 的尺寸没有太大关系。所以通过 IOU 定义了如下的距离函数，使得误差和 box 的大小无关：

Faster R-CNN 采用的是手选先验框方法，YOLOv2 对其做了改进，采用 k-means 在训练集 bbox 上进行聚类产生合适的先验框. 由于使用欧氏距离会使较大的 bbox 比小的 bbox 产生更大的误差，而 IOU 与 bbox 尺寸无关, 因此使用 IOU 参与距离计算, 使得通过这些 anchor boxes 获得好的 IOU 分值。距离公式：

如下图 Figure2，左边是聚类的簇个数核 IOU 的关系，两条曲线分别代表两个不同的数据集。在分析了聚类的结果并平衡了模型复杂度与 recall 值，作者选择了 K=5，这也就是 Figure2 中右边的示意图是选出来的 5 个 box 的大小，这里紫色和黑色也是分别表示两个不同的数据集，可以看出其基本形状是类似的。而且发现聚类的结果和手动设置的 anchor box 大小差别显著。聚类的结果中多是高瘦的 box，而矮胖的 box 数量较少。

K-Means 算法概述：k-means 是非监督学习中的聚类算法; 基本 K-Means 算法的思想很简单，事先确定常数 K，常数 K 意味着最终的聚类类别数，首先随机选定初始点为质心，并通过计算每一个样本与质心之间的相似度 (这里为欧式距离)，将样本点归到最相似的类中，接着，重新计算每个类的质心 (即为类中心)，重复这样的过程，知道质心不再改变，最终就确定了每个样本所属的类别以及每个类的质心。由于每次都要计算所有的样本与每一个质心之间的相似度，故在大规模的数据集上，K-Means 算法的收敛速度比较慢。

使用聚类进行选择的优势是达到相同的 IOU 结果时所需的 anchor box 数量更少, 使得模型的表示能力更强, 任务更容易学习。

2.2.4 Multi-Scale Training

和 YOLOv1 训练时网络输入的图像尺寸固定不变不同，YOLOv2（在 cfg 文件中 random=1 时）每隔几次迭代后就会微调网络的输入尺寸。训练时每迭代 10 次，就会随机选择新的输入图像尺寸。因为 YOLOv2 的网络使用的 downsamples 倍率为 32，所以使用 32 的倍数调整输入图像尺寸 {320,352，…，608}。训练使用的最小的图像尺寸为 320 x 320，最大的图像尺寸为 608 x 608。这使得网络可以适应多种不同尺度的输入。更多详细的资料可查看这里目标检测之 YOLOv3，YOLOv3 才是全文的的重点。

这里给出官方的 YOLOv2 与其它模型在 VOC 2007 数据集上的效果对比

三：YOLO v3 简介

本文的重点，先一张图看看 V3 版本的强大

横轴是每张图像的预测推理时间，单位 ms。纵轴是在 COCO 数据集上预测的 [email protected] 的精度。无论是在耗费时间，还是预测精度上面，v3 版本都完胜过去的一些模型。

darknet-53 模型

注：YOLO Detection 层: 坐标及类别结果输出层；Region 82,Region 94,Region 106。

YOLOv3 的改进之处：多尺度预算

坐标预测：bbox 预测仍是 yolov2 的使用维度聚类（dimension clusters ）作为 anchor boxes 来预测边界框. 在训练期间，我们使用平方误差损失的总和。
对象分数：YOLOv3 使用逻辑回归预测每个边界框（bounding box）的对象分数。如果先前的边界框比之前的任何其他边界框重叠 ground truth 对象，则该值应该为 1。如果以前的边界框不是最好的，但是确实将 ground truth 对象重叠了一定的阈值以上，我们会忽略这个预测，按照 [15] 进行。我们使用阈值 0.5。与 [15] 不同，我们的系统只为每个 ground truth 对象分配一个边界框。如果先前的边界框未分配给 grounding box 对象，则不会对坐标或类别预测造成损失。
类别预测：每个框使用多标签分类来预测边界框可能包含的类。在训练过程中，使用二元交叉熵损失来进行类别预测。

补充：Darknet 框架 Darknet 由 C 语言和 CUDA 实现, 对 GPU 显存利用效率较高 (CPU 速度差一些, 通过与 SSD 的 Caffe 程序对比发现存在 CPU 较慢,GPU 较快的情况). Darknet 对第三方库的依赖较少, 且仅使用了少量 GNU linux 平台 C 接口, 因此很容易移植到其它平台, 如 Windows 或嵌入式设备.

四：动手实践篇

来开始本文的重中之重吧——

第一步：首先根据官网提示，一步步的走一遍，直到能够训练 VOC 数据集，就可以停下来歇歇了。官网点这里穿越如果一起正常，恭喜你，就可以开始之后的步骤了。当然有兴趣想了解 YOLOv3 中设计上的更多细节，可以去看下诙谐幽默的论文，点这里，看 YOLOv3: An Incremental Improvement后面也会就论文中和修改中的一些联系，做个解释。

第二步：上面做完，只是说明你可以检测和训练了官方的图片数据集，下面开始自己的数据集。

注意点：如果你的电脑设备是有 GPU 加速图像运算的，那样在第一步中，默认的还是 CPU 下的训练，想要使用 GPU 就要改 Makefile 文件这里了

这是我这一个博客中看到的，将红色框圈中的部分改为 1，修改了之后，在 darknet 文件目录下 make clean 清除之前的 make 文件，重新 make，发现速度明显提高，使用上了 GPU 训练。（其实在之前第一次我重新 make 时候报 opencv 错误，后来尽管发错 opencv 没有安装好，make 也通过了，对这个没有影响，就没有太关注这里了，有经验的求告知）。相同的命令，再来训练一次 VOC 数据试试看，速度是不是提高杠杠的。

第三步：数据集的采集，制作标签，这块还参考手把手实践 YOLO 深度残差神经网络拐点检测，一句话也就是 labelImg 标记软件工具了，具体不详述了。其中有一点就是 ImageSets/Main/ 文件夹下的 train.txt，test.txt，val.txt，这里的文件需要改为自己待训练的图片所有名字编号，在生成待训练的 train.txt 大有用处。

第四步：对待训练初始配置参数进行修改

**改动一 **

首先确定你需要做几个类别的物体检测，也就是 classes=1，还是 classes=5 或者 7，或者 20。我这里待检测的类别为一类，所以 classes=1, 如下图的 cfg 文件夹下的.data 文件：

class 为训练的类别数
train 为训练集 train.txt
valid 为验证集 val.txt(未标识添加，后期可加入)
names 为 my_target.names，里面为自己训练的目标名称
backup 为 weights 的存储位置

将 VOC 格式的 xml 文件转换成 YOLO 格式的 txt 文件。

train.txt 为 python voclabel.py 自动生成的，为自己的待训练样本文件位置。其中在 voclabel.py 文件我对其进行了修改，sets=[] 也进行了删减，只留下自己需要的那一部分；lasses=[" "], 里面为自己的检测类别；生成的 train.txt 也只是自己需要的部分，如下图（如有不妥或者错误，求批评指正，自己想着改的，并未看到相关材料指导）

<文件名>.names 文件 原始的部分为 coco.data。如果你不想惹麻烦，直接将此处更名为 coco.data 即可。如若你想将此处的.data 文件更改为自己的特有命名，如 my_yolov3.data。这就需要在 examples 里面的 darknet.c 文件的 440 行处进行修改为自己的命名，然后 cd 到 darknet 文件夹下 make clean 删除之前的 make 文件，然后重新 make 即可。

没改之前直接使用，会出现这个错误提示（训练和检测报错都有）：

改动就是在这里修改：

make 命令百科

在软件开发中，make 是一个工具程序（Utility software），经由读取叫做“makefile”的文件，自动化建构软件。它是一种转化文件形式的工具，转换的目标称为“target”；与此同时，它也检查文件的依赖关系，如果需要的话，它会调用一些外部软件来完成任务。它的依赖关系检查系统非常简单，主要根据依赖文件的修改时间进行判断。大多数情况下，它被用来编译源代码，生成结果代码，然后把结果代码连接起来生成可执行文件或者库文件。它使用叫做“makefile”的文件来确定一个 target 文件的依赖关系，然后把生成这个 target 的相关命令传给 shell 去执行。

许多现代软件的开发中 (如 Microsoft Visual Studio)，集成开发环境已经取代 make，但是在 Unix 环境中，仍然有许多任务程师采用 make 来协助软件开发。

/backup/ 文件夹下用于存放训练好的.weights 参数文件，源代码里面是迭代次数小于 1000 时，每 100 次保存一次，大于 1000 时，没 10000 次保存一次。自己可以根据需求进行更改，然后重新编译即可。代码位置在 examples 里面的 detector.c line 138，和上面的一样，cd 到 darknet 文件夹下 make clean 删除之前的 make 文件，然后重新 make 即可。这样.data 文件就这么些内容。

**改动二 **

cfg 文件夹下的.cfg 文件，有很多，用到的只是 yolov3-voc.cfg（现在还不知道别的.cfg 文件该怎么用，求指点，于是我把别的文件全删除了，只留下 coco.data 和 yolov3-voc.cfg）一切正常，还没发现出错。删了 -- 改名，就这样了（改了名之后报错？就需要改动一处的指示了，回看改动一）

最重要的改动，是在 my_yolov3.cfg（已图片处的名字为例）下的参数，欲知详情，娓娓道来······

my_yolov3.cfg 下参数改动：Training or Testing pattern?

如图：

batch：每次迭代要进行训练的图片数量
subdivisions:batch 中的图片再产生子集，源码中的图片数量 int imgs = net.batch * net.subdivisions * ngpus （一次传入 batch 张图像，细分成 subdivisions 组行迭代训练，此时的 subdivisions=8，就会发现 train 时候，两次迭代输出之间，共输出了 8 次 Region 82,Region 94,Region 106。这里的 batch 是 16，即 8 组 2 个图像。你也可以设定 batch=64，此时的训练迭代就有 8 组 8 个图像了。）

Training pattern：注释掉 Testing 下的 batch 和 subdivisions 两个初始参数，让 Training 下的 batch 和 subdivisions 两个初始参数参与运算；
Testing pattern：反之，注释掉 Training 下的 batch 和 subdivisions 两个初始参数，让 Testing 下的 batch 和 subdivisions 两个初始参数参与运算。(上图就是在 test 下的参数模式，切记)

YOLOv3 预测 3 个不同尺度的 box

我们的系统使用类似的概念以金字塔网络（SPP）从这些量表中提取特征。最后一层网络预测一个 3D 张量编码的边界框，对象和类的预测（classes）。COCO 试验中，我们预测每个尺度上的 3 个盒子，所以这个张量是 NN3（4+1+80）的 4 个边界框偏移量，1 个目标预测，和 80 个类的预测。如果 classes=1，也就是上面的 my_yolov3.data，文件里面定义的，此时的最后一层 filters=3*（4+1+1）=18。

论文对最后一层网络的解释如下

第五步：Now we can train my target_yolo!

参考这个官方提示来做对应的修改，改为自己的命名形式，如果还是不行，恐怕就是你的 make 步骤没有做。make clean-- --make

红色框：cfg 文件夹下的.data 文件
绿色框：cfg 文件夹下的.cfg 文件
黄色框：darknet-53 的预训练参数作为整个 train 的初始参数

具体的输出详解

Region Avg IOU: ----0.326577 is the average of the IOU of every image in the current subdivision. A 32,66% overlap in this case, this model still requires further training. Class: -----0.742537 still figuring this out Obj: -----0.033966 still figuring this out No Obj:----- 0.000793 still figuring this out The Avg Recall:------ 0.12500 is defined in code as recall/count, and thus a metric for how many positives YOLOv2 detected out of the total amount of positives in this subdivision. In this case only one of the eight positives was correctly detected. count: -----8 is the amount of positives (objects to be detected) present in the current subdivision of images (subdivision with size 8 in our case). Looking at the other lines in the log, you'll see there are also subdivision that only have 6 or 7 positives, indicating there are images in that subdivision that do not contain an object to be detected.

如果不幸，输出的是这个样子

那就是你在 2.1.1 节时候，把 Training or Testing 注释错了，更改下，再试试。

如果成功了，那就出去溜溜等着吧，记得回来看看 loss 参数，迭代输出像这样

9798----- indicates the current training iteration/batch. 0.370096 -----is the total loss. 0.451929 ------avg is the average loss error, which should be as low as possible. As a rule of thumb, once this reaches below 0.060730 avg, you can stop training. 0.001000----- rate represents the current learning rate, as defined in the .cfg file. 3.300000 -----seconds represents the total time spent to process this batch. The 627072 -----images at the end of the line is nothing more than 9778 * 64, the total amount of images used during training so far.

序列测试，这里将 cfg/myyolov3.data 进行修改，加入 valid 的测试序列地址，重新 python voclabel.py

valid 测试

./darknet detector valid cfg/myyolov3.data cfg/myyolov3.cfg backup/yolo-voc_final.weights

/在终端只返回用时，在./results/comp4dettest_[类名].txt 里保存测试结果/

打开查看内容

依次表示的是：文件名；每个框中存在该分类物体的概率；框框坐标 xmin；框框坐标 ymin；框框坐标 xmax；框框坐标 ymax，代码区如下截图，位置 examples/detector.c

当然也有别的测试方式，并返回评价指标，如图，可自己尝试

参考资料：

https://timebutt.github.io/static/understanding-yolov2-training-output/
https://www.zhihu.com/question/42205480
https://blog.csdn.net/qq_30401249/article/details/51694298

转载：https://gitbook.cn/books/5aceab0afafeca4b1a33e7b4/index.html

你可能感兴趣的:(学习总结)

(学习总结28)Linux 基本命令3 瞌睡不来学习 linux
Linux基本命令3工具使用命令使用vim编辑器命令vim使用nano文本编辑器命令nano使用gcc/g++编译器命令gcc/g++使用gdb/cgdb调试器命令gdb/cgdb使用自动化构建命令make使用版本控制器命令git系统或进程相关命令读取输入并赋值给变量命令read设置或修改shell环境命令set设置环境变量命令export测试网络连接命令ping显示系统登录记录命令last显示失
Spring Cloud 与微服务学习总结（14）—— 云原生时代，如何从 Java 开发者转型微服务？一杯甜酒 Spring Cloud与微服务 java 云原生 spring cloud 微服务微服务架构
前言根据维基百科定义，微服务不是整体应用程序中的一个层。相反，微服务是一个独立的业务功能，具有清晰的接口，并且可以通过内部组件实现分层架构。从战略角度来看，微服务架构基本上遵循“做一件事，就要做得好”的Unix哲学。为了应对传统单体架构的缺陷，微服务架构被企业广泛应用。然而，实践之前有很多问题都需要提前考虑清楚，比如Java背景的开发者是否更有优势？微服务、容器化、DevOps和CI/CD之间的关
Git学习总结（9）——如何构建你自己的 Git 服务器一杯甜酒 Git
现在我们将开始学习如何构建一个Git服务器，如何在具体的事件中写一个针对特定的触发操作的自定义Git（例如通告），如何发布你的代码到一个网站。
C# WPF学习总结战族狼魂 WPF C#c#wpf 学习
经过一段时间的学习和实践，我对C#WPF（WindowsPresentationFoundation）有了更深入的理解。WPF作为一个强大的桌面应用程序开发框架，为开发者提供了丰富的UI控件、强大的数据绑定和灵活的布局系统。以下是我对C#WPF学习的一些总结：目录1.基础知识2.UI设计3.数据绑定4.动画和特效5.命令和路由事件6.自定义控件和扩展性7.性能优化和内存管理8.实战项目经验9.学习
playWright学习总结 one day321 python 开发语言
注意，这里并没有学过selenium自动化。playwright对比selenium来说，不需要不断下载驱动。且playWright最大的优点是可以录制操作，并自动生成自动化脚本。视频：快速上手-3-示例_哔哩哔哩_bilibili资料：Xpath/Role/视觉定位方法-白月黑羽安装：直接使用命令安装：pipinstallplaywright安装需要的浏览器：playwrightinstall安
今日学习之 Java TCP通信技术与群聊程序开发 java修仙传学习 java tcp/ip 经验分享
在今天的Java学习中，我深入探索了TCP通信技术，并将其应用于群聊程序的开发，同时了解了TCP通信的BS架构。以下是我的学习总结与技术分享。一、TCP通信技术基础TCP（传输控制协议）是一种面向连接的、可靠的、基于字节流的传输层通信协议。它的主要特点包括：面向连接：在通信开始之前，需要建立连接（三次握手），通信结束后需要释放连接（四次挥手）。可靠交付：通过确认、重传和排序机制，确保数据准确无误地
第N2周：构建词典 OreoCC NLP
本人往期文章可查阅：深度学习总结我的环境：语言环境：Python3.11编译器：PyCharm深度学习环境：Pytorchtorch==2.0.0+cu118torchvision==0.18.1+cu118显卡：NVIDIAGeForceGTX1660本周任务：使用N1周的.txt文件构建词典，停用词请自定义1.导入数据fromtorchtext.vocabimportbuild_vocab_f
第N3周：NLP中的数据集构建 OreoCC 自然语言处理深度学习 pytorch
本人往期文章可查阅：深度学习总结对于初学者，NLP中最烦人的问题之一就是数据集的构建问题，处理不好就会引起shape问题（各种由于shape错乱导致的问题）。这里我给出一个模板，大家可根据这个模板来构建。torch.utils.data是PyTorch中用于数据加载和预处理的模块。其中包括Dataset和DataLoader两个类，它们通常结合使用来加载和处理数据。1.Datasettorch.u
ZooKeeper学习总结（1）——ZooKeeper入门介绍一杯甜酒 ZooKeeper学习总结 Zookeeper
1.概述Zookeeper是Hadoop的一个子项目，它是分布式系统中的协调系统，可提供的服务主要有：配置服务、名字服务、分布式同步、组服务等。它有如下的一些特点：简单Zookeeper的核心是一个精简的文件系统，它支持一些简单的操作和一些抽象操作，例如，排序和通知。丰富Zookeeper的原语操作是很丰富的，可实现一些协调数据结构和协议。例如，分布式队列、分布式锁和一组同级别节点中的“领导者选举
Zookeeper【概念（集中式到分布式、什么是分布式、CAP定理、什么是Zookeeper、应用场景、为什么选择Zookeeper 、基本概念）】(一)-全面详解（学习总结---从入门到深化）童小纯中间件大全---全面详解 zookeeper 分布式
作者简介：大家好，我是小童，Java开发工程师，CSDN博客博主，Java领域新星创作者系列专栏：前端、Java、Java中间件大全、微信小程序、微信支付、若依框架、Spring全家桶如果文章知识点有错误的地方，请指正！和大家一起学习，一起进步如果感觉博主的文章还不错的话，请三连支持一下博主哦博主正在努力完成2023计划中：以梦为马，扬帆起航，2023追梦人目录Zookeeper概念_集中式到分布
Python学习总结 serve the people 巨人的肩膀 python 开发语言
第一个python程序print("HelloWorld")#缩进一般4个空格键或者1个tab键，但是所有代码块语句必须是相同的缩进，这个必须严格执行，不同的缩进会导致程序不能运行，不能混用空格和tabifTrue:print("True")else:print("False")python注释符单行注释（行注释）#print("HelloWorld")多行注释（块注释）'''print("Hel
学习总结项目苏小夕夕学习人工智能深度学习机器学习
近段时间学习了机器学习、线性回归和softmax回归、多层感知机、卷积神经网络、Pytorch神经网络工具箱、Python数据处理工具箱、图像分类等的知识，学习了利用神经网络实现cifar10的操作、手写图像识别项目以及其对应的实验项目报告总结。项目总结本次项目我使用了VGG19模型、AlexNet模型和已使用的VGG16模型进行对比，在已有的条件下，对代码进行更改是，结果展示中，VGG19模型的
第N4周：NLP中的文本嵌入 OreoCC 自然语言处理人工智能
本人往期文章可查阅：深度学习总结词嵌入是一种用于自然语言处理（NLP）的技术，用于将单词表示为数字，以便计算机可以处理它们。通俗的讲就是，一种把文本转为数值输入到计算机中的方法。之前文章中提到的将文本转换为字典序列、one-hot编码就是最早期的词嵌入方法。Embedding和EmbeddingBag则是PyTorch中的用来处理文本数据中词嵌入（wordembedding）的工具，它们将离散的词
Java学习——day14 blackA_ java 学习开发语言
文章目录1.项目需求分析2.项目设计3.代码分析4.运行示例5.今日学习总结6.今日生词今日学习计划1.项目需求分析功能要求：(1)存储学生信息：使用HashMap存储学生信息（学号作为键，Student对象作为值）。(2)操作学生数据：添加学生（姓名、学号、成绩）。删除学生（按学号删除）。查询学生（按学号查询）。显示所有学生信息。(3)异常处理：防止重复添加（如果学号已存在，抛出异常）。查询/删
第二周的学习总结没耐心的胖子学习总结 c语言
第二周的学习总结计算器边缘计算计算器请设计一款加减乘除计算器，要求能输入小数，并对非数字的输入进行报警。#includeintmain(intarg,constchar*argv[]){charmrk;floatnum1,num2,result=0;intn1,n2;printf("请输入需要计算的式子：");n1=scanf("%f",&num1);scanf("%c",&mrk);n2=sca
云计算第一周学习总结（2）夊亙云计算学习
接下来是两个初始化设置，一个是关闭防火墙，另一个是关闭seLinux，防火墙的作用是保证系统的安全，那既然是为了保护系统的安全那为什么要关闭呢，主要原因就是我们所建立服务器本身就是为了让客户访问，但一旦防火墙开启，客户访问时防火墙会把客户当作入侵者，阻止客户的正常访问，所以需要将其关闭，那么紧接着就会产生另一个问题，要是将防火墙关闭了，真正的入侵者过来破坏服务器了怎么办，不用担心一般会有两种解决手
第十一周：学习总结程序员
1.前言历时三个月的学习，让我对管理有了更为清晰的认知，以前自己是摸着石头过河，很难判断什么样的方式，或者说什么样的思路是正确的，但是，经过这段时间的学习，自己好像突然在迷雾中看见了明灯，可以看见前方的路况，仿佛看到了整个管理世界的地图，然后知道了自己处于哪个位置。2.角色转变在没有学习之前，我是这样认为的，普通员工只需要做好自己手头上的工作，比如他是一位开发人员，那么他只需要按照需求完成开发任务
Redis 学习总结(2) Java 操作 Redis 的示例 caihuayuan4 面试题汇总与解析 spring 课程设计 springboot vue sql
1.背景在java开发中集成redis。我们用到SpringDataRedis。2.知识SpringDataRedis是更大的SpringData系列的一部分，它提供了从Spring应用程序对Redis的轻松配置和访问。它支持两种Redis驱动程序：LettuceJedisSpringDataRedis实现了对底层的抽象，无论是那一种驱动，使用起来是一样的。3.示例3.1导入依赖包org.spri
关于openAI接口的使用(个人学习总结) 暗雾飘扬 python机器学习_实验项目学习人工智能
文章目录背景OpenAIOpenAI的三种使用方法模型python的openai库根据文档自定义request函数http请求构成接口的响应构成自定义请求和接收函数背景在使用OpenAIAPI接口时遇到了许多问题，在此总结个人的问题（不代表大众），如要深究请看官方OpenAI-API接口文档（中文版）。OpenAIOpenAI的三种使用方法1、使用OpenAIAPI2、使用第三方库3、自己训练模型
【FFmpeg】拉流 gma999 ffmpeg
概述项目实践中涉及到使用ffmpeg进行推流和拉流操作，本文主要对一些基本操作做一个学习总结，后续再学习其源码架构；总结方法遵循实现功能配合函数具体实现基本使用拉流avformat_network_init();//日志输出等级set_ffmpeg_log_level();AVFormatContext*fmt_ctx=NULL;AVPacket*pkt=av_packet_alloc();if(
Python学习总结学学睡觉 python 学习开发语言
客户端与服务端聊天窗口服务端导入wxPython用于创建图形界面。socket用于网络通信，AF_INET是IPv4地址族，SOCK_STREAM表示流式套接字（TCP）。利用wxPython创建图形界面，并通过socket与服务器通信。主要功能：连接服务器。发送和接收消息。断开连接。界面上有文本框和按钮来操作。wxPython处理UI部分，socket处理网络通信。importthreading
Rust学习总结之-match ftzchina Rust rust 学习 match
Rust有一个叫做match的极为强大的控制流运算符，它允许我们将一个值与一系列的模式相比较，并根据相匹配的模式执行相应代码。模式可由字面量、变量、通配符和许多其他内容构成。一：match定义可以把match表达式想象成某种硬币分类器：硬币滑入有着不同大小孔洞的轨道，每一个硬币都会掉入符合它大小的孔洞。同样地，值也会通过match的每一个模式，并且在遇到第一个“符合”的模式时，值会进入相关联的代码
python总结报告_python 学习总结 weixin_39628247 python总结报告
数据蛙第一期课程已经进行了两周了，最近一周学习的内容是python相关，这里总结性地概况课程内容，以作知识回顾参考。一、python的基础知识1、数据类型数字型：int、float、Boolean非数字型：字符串、列表、元组、字典可变类型：列表、字典不可变类型：数字、字符串、元组格式化字符串：两种写法a、python的格式化字符串，使用%如果希望输出文字信息的同时输出数据，那就需要使用到格式化操作
Redis哨兵模式（sentinel）学习总结及部署记录（主从复制、读写分离、主从切换） coding996
Redis哨兵模式（sentinel）学习总结及部署记录（主从复制、读写分离、主从切换）https://segmentfault.com/a/1190000020849841Redis的集群方案大致有三种：1）rediscluster集群方案；2）master/slave主从方案；3）哨兵模式来进行主从替换以及故障恢复。一、sentinel哨兵模式介绍Sentinel(哨兵)是用于监控redis集
第G9周：ACGAN理论与实战 OreoCC GAN
>-**本文为[365天深度学习训练营]中的学习记录博客**>-**原作者：[K同学啊]**本人往期文章可查阅：深度学习总结我的环境：语言环境：Python3.11编译器：PyCharm深度学习环境：Pytorchtorch==2.0.0+cu118torchvision==0.18.1+cu118显卡：NVIDIAGeForceGTX1660论文地址：ConditionalImageSynthe
Docker学习总结（8）——利用Docker开启持续交付之路一杯甜酒 Docker
持续交付即ContinuousDelivery，简称CD，随着DevOps的流行正越来越被传统企业所重视。持续交付讲求以短周期、小细粒度，自动化的方式频繁的交付软件，在这个过程中要求开发、测试、用户体验等角色紧密合作，快速收集反馈，从而不断改善软件质量并减少浪费。然而，在我所接触的传统企业中，对于持续交付实践的实施都还非常初级，坦白说，大部分还停留的手工生成发布包，手工替换文件进行部署的阶段，这样
(学习总结25)Linux工具：vim 编辑器和 gcc/g++ 编译器瞌睡不来 linux 编辑器学习 vim gcc/g++编译器
Linux工具：vim编辑器和gcc/g++编译器vim编辑器在Linux命令行中执行vimvim命令模式光标操作相关命令文本或字符操作命令撤销操作命令查找操作vim插入模式vim底行模式查找与编写操作界面操作文件处理操作vim与shell交互其它操作退出vim一般操作vim可视模式vim替换模式vim简单配置配置文件位置：常用配置选项，用来测试(可以在vim底行模式使用)：使用插件gcc/g++
rust - trait学习田园诗人之园编程语言-rust rust rust -trait学习 trait
通过对《Rust程序设计语言》，《通过例子学Rust中文版》以及令狐一冲老师对相关知识点的学习总结而成。rust-trait学习1trait的基本含义2定义trait3实现trait4trait作为参数5默认实现6trait_bound6.1trait_bound语法6.2trait_bound语法7trait作为返回值8使用traitbound有条件的实现1trait的基本含义1，trait用于
Spring全面详解：架构体系演变及其入门（学习总结）小夕Coding 大数据系列 spring java 大数据 javabean spring boot
文章目录架构体系演变背景单一应用架构垂直应用架构分布式服务架构流动计算架构入门配置文件yaml语法快速入门基本格式要求对象数组常量一些特殊符号使用yaml进行配置注解学习反射获取注解配置文件优先级存放目录Application属性文件，按优先级排序，位置高的将覆盖位置读取顺序web开发嵌入式Servlet容器支持扫描Servlet，过滤器和listeners1、springboot整合servle
机器学习—逻辑回归 60岁的程序猿 1024程序员节机器学习逻辑回归人工智能算法
本内容是博主自学机器学习总结的。由于博主水平有限，内容可能有些许错误。如有错误，请发在评论区。目录1、基础概念1.1、什么是逻辑回归1.2、逻辑回归与线性回归的区别1.3应用场景2、逻辑回归模型2.1、模型定义2.2、Sigmoid函数2.3、决策边界2.4、概率解释3、模型训练3.1、损失函数3.2、梯度下降法3.3、牛顿法3.4、拟牛顿法3.4、正则化3.5、总结4、多分类问题4.1、一对多（
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo