曉a_寧

YOLO系列

这几天整理了一下目标检测的模型，整理一下以便以后参考。

目前，基于深度学习算法的一系列目标检测算法大致可以分为两大流派：
1.两步走（two-stage）算法：先产生候选区域然后再进行CNN分类(RCNN系列)，
2.一步走（one-stage）算法：直接对输入图像应用算法并输出类别和相应的定位(YOLO系列)

RCNN系列

faster—Rcnn中也是整个图片输入，然后得到的是一个端到端的模型，但是Faster-Rcnn中还是采用的RCNN系列的proposal+classifier的思想即先识别出区域再用分类器进行分类，Faster-Rcnn只不过讲提取proposal的步骤方法了卷积层中。详情见上面的链接。

YOLO

YOLO算法的基本思想是：

首先通过特征提取网络对输入图像提取特征，得到一定size的feature map，比如13*13，然后将输入图像分成13*13个grid cell.
接着如果ground truth中某个object的中心坐标落在哪个grid cell中，那么就由该grid cell来预测该object，因为每个grid cell都会预测固定数量的bounding box（YOLO v1中是2个，YOLO v2中是5个，YOLO v3中是3个，这几个bounding box的初始size是不一样的），那么这几个bounding box中最终是由哪一个来预测该object？答案是：这几个bounding box中只有和ground truth的IOU最大的bounding box才是用来预测该object的。
可以看出预测得到的输出feature map有两个维度是提取到的特征的维度，比如13*13，还有一个维度（深度）是B*（5+C），注：YOLO v1中是（B*5+C），其中B表示每个grid cell预测的bounding box的数量，比如YOLO v1中是2个，YOLO v2中是5个，YOLO v3中是3个，C表示bounding box的类别数（没有背景类，所以对于VOC数据集是20），5表示4个坐标信息和一个置信度（objectness score）。

yolo V1（CVPR 2016）

YOLO的检测思想不同于R-CNN系列的思想，它将目标检测作为回归任务来解决。它的核心思想就是直接以整张图作为输入，直接在输出层回归bounding box（边界框）的位置信息以及对象所属的类别。

粗略流程：

给定一张输如图片，将图片粗暴的分为7*7的网格
默认对于每一个网格默认有两个边框（包括边框中心、长、宽、是否有对象的confidence、在20个类别上的概率），就相当于提取了98个框
根据阈值去除可能性较低的框（也就是网络认为没有对象），最后用NMS去除重叠高的窗

网络结构：

Yolo采用卷积网络来提取特征，然后使用全连接层来得到预测值。网络结构参考GooLeNet模型，包含24个卷积层和2个全连接层，如图所示。对于卷积层，主要使用1x1卷积来做channle reduction，然后紧跟3x3卷积。对于卷积层和全连接层，采用Leaky ReLU激活函数：。但是最后一层却采用线性激活函数

448*448*3 卷积的stride是1，卷积两次，maxpooling 两次448/2/2得到下一层的特征图大小112*112，最后得到的是7*7大小的特征图所以把图片分成7*7大小的网格

坐标归一化

因为这里是当作回归问题来解决的，所以所有的输出包括坐标和宽高最好都定义在0到1之间。

来看一下每个单元格预测的B个(x,y,w,h,confidence)的向量和C的条件概率中，每个参数的含义(假设图片宽为{wi}高为{hi}，将图片分为S×S)：

1.(x,y)是bbox的中心相对于单元格的offset ：

对于上图中蓝色框的那个单元格(坐标为 $(x_{col}=1,y_{row}=4)$ ，假设它预测的输出是红色框的bbox,设bbox的中心坐标为,那么最终预测出来的(x,y)是经过归一化处理的，表示的是中心相对于单元格的offset，计算公式如下：

$x=\frac{x_c}{w_i}*S-x_{col} , y=\frac{y_c}{h_i}* S-y_{row}$
2.(w,h)是bbox相对于整个图片的比例
预测的bbox的宽高为，(w,h)表示的是bbox的是相对于整张图片的占比，计算公式如下:
$w=\frac{w_b}{w_i} , h=\frac{h_b}{h_i}$
3.confidence
这个置信度是由两部分组成，一是格子内是否有目标，二是bbox的准确度。定义置信度为 $P_r(Object)*IOU_{truth-pred}$
这里，如果格子内有物体，则，此时置信度等于IoU。如果格子内没有物体，则，此时置信度为0

Yolo算法将目标检测看成回归问题，所以采用的是均方差损失函数。但是对不同的部分采用了不同的权重值。首先区分定位误差和分类误差。对于定位误差，即边界框坐标预测误差，采用较大的权重。

训练

1 预训练分类网络：在 ImageNet 1000-class Competition Dataset上预训练一个分类网络（见网络结构部分），这个网络是前文网络结构中的前20个卷机网络+Average_Pooling Layer+Fully Connected Layer（此时网络输入是224*224）。

2 训练检测网络：文献[6]提到在预训练网络中增加卷积和全链接层可以改善性能。YOLO添加4个卷积层和2个全链接层，随机初始化权重。检测要求细粒度的视觉信息，所以把网络输入也从224*224变成448*448。

（1）一幅图片分成7*7个网格，某个物体的中心落在这个网格中此网格就负责预测这个物体。每个网格预测两个Bounding Box。网格负责类别信息，Bounding Box负责坐标信息（4个坐标信息及一个置信度），有20个类，所以最后一层输出为7*7*（2*（4+1）+20）=7*7*30的维度。

（2）Bounding Box的坐标使用图像的大小进行归一化0-1（见坐标归一化部分）。Confidence使用计算，其中第一项表示是否有物体落在网格里，第二项表示预测的框和实际的框之间的IOU值。

3 损失函数的确定：损失函数的定义（见损失函数部分），损失函数的设计目标就是让坐标，置信度和类别这个三个方面达到很好的平衡.

测试

下面就来分析Yolo的预测过程，这里我们不考虑batch，认为只是预测一张输入图片。根据前面的分析，最终的网络输出是个边界框。

所有的准备数据已经得到了，那么我们先说第一种策略来得到检测框的结果，我认为这是最正常与自然的处理。首先，对于每个预测框根据类别置信度选取置信度最大的那个类别作为其预测标签，经过这层处理我们得到各个预测框的预测类别及对应的置信度值，其大小都是。一般情况下，会设置置信度阈值，就是将置信度小于该阈值的box过滤掉，所以经过这层处理，剩余的是置信度比较高的预测框。最后再对这些预测框使用NMS算法，最后留下来的就是检测结果。一个值得注意的点是NMS是对所有预测框一视同仁，还是区分每个类别，分别使用NMS。Ng在deeplearning.ai中讲应该区分每个类别分别使用NMS，但是看了很多实现，其实还是同等对待所有的框，我觉得可能是不同类别的目标出现在相同位置这种概率很低吧。

存在问题：

YOLO对相互靠的很近的物体（挨在一起且中点都落在同一个格子上的情况），还有很小的群体检测效果不好，这是因为一个网格中只预测了两个框，并且只属于一类。
测试图像中，当同一类物体出现的不常见的长宽比和其他情况时泛化能力偏弱。
由于损失函数的问题，定位误差是影响检测效果的主要原因，尤其是大小物体的处理上，还有待加强。

YOLO V2（CVPR 2017）

yolo v2是在yolo v1版本上的提高，对yolo 进行的改进，提高了yolo中的缺陷。

按照论文顺序来阅读

Better

Batch Normalization （批归一化）
High Resolution Classifier （高分辨率分类器）
Convolutional With Anchor Boxes
Dimension Clusters （维度聚类）
Direct Location prediction （直接位置预测）
Fine-Grained Features （细粒度特征）
Multi-Scale Training （多尺度训练）

Faster

Darknet-19
Training for Classification

Stronger

Better

Batch Normalization （批归一化）

CNN在训练过程中网络每层输入的分布一直在改变, 会使训练过程难度加大，但可以通过normalize每层的输入解决这个问题。新的YOLO网络在每一个卷积层后添加batch normalization，通过这一方法，mAP获得了2%的提升。batch normalization 也有助于规范化模型，可以在舍弃dropout优化后依然不会过拟合

High Resolution Classifier （高分辨率分类器）

目前的目标检测方法中，基本上都会使用ImageNet预训练过的模型（classifier）来提取特征，如果用的是AlexNet网络，那么输入图片会被resize到不足256 * 256，导致分辨率不够高，给检测带来困难。为此，新的YOLO网络把分辨率直接提升到了448 * 448，这也意味之原有的网络模型必须进行某种调整以适应新的分辨率输入。

对于YOLOv2，作者首先对分类网络（自定义的darknet）进行了fine tune，分辨率改成448 * 448，在ImageNet数据集上训练10轮（10 epochs），训练后的网络就可以适应高分辨率的输入了。然后，作者对检测网络部分（也就是后半部分）也进行fine tune。这样通过提升输入的分辨率，mAP获得了4%的提升。

Convolutional With Anchor Boxes

原来的YOLO是利用全连接层直接预测bounding box的坐标(也就是在我们上面提到的7*7大小的卷积层后的全连接层）

，会丢失较多的空间信息，而YOLOv2借鉴了Faster R-CNN的思想，引入anchor。

为了引入anchor boxes来预测bounding boxes，作者在网络中果断去掉了全连接层。剩下的具体怎么操作呢？首先，作者去掉了后面的一个池化层以确保输出的卷积特征图有更高的分辨率。然后，通过缩减网络，让图片输入分辨率为416 * 416，这一步的目的是为了让后面产生的卷积特征图宽高都为奇数，这样就可以产生一个center cell。作者观察到，大物体通常占据了图像的中间位置，就可以只用中心的一个cell来预测这些物体的位置，否则就要用中间的4个cell来进行预测，这个技巧可稍稍提升效率。最后，YOLOv2使用了卷积层降采样（factor为32），使得输入卷积网络的416 * 416图片最终得到13 * 13的卷积特征图（416/32=13）。

加入了anchor boxes后，可以预料到的结果是召回率上升，准确率下降。我们来计算一下，假设每个cell预测9个建议框，那么总共会预测13 * 13 * 9 = 1521个boxes，而之前的网络仅仅预测7 * 7 * 2 = 98个boxes。具体数据为：没有anchor boxes，模型recall为81%，mAP为69.5%；加入anchor boxes，模型recall为88%，mAP为69.2%。这样看来，准确率只有小幅度的下降，而召回率则提升了7%，说明可以通过进一步的工作来加强准确率，的确有改进空间。

Dimension Clusters （维度聚类）

我们知道在Faster R-CNN中anchor box的大小和比例是按经验设定的，然后网络会在训练过程中调整anchor box的尺寸。但是如果一开始就能选择到合适尺寸的anchor box，那肯定可以帮助网络越好地预测detection。所以作者采用k-means的方式对训练集的bounding boxes做聚类，试图找到合适的anchor box。
另外作者发现如果采用标准的k-means（即用欧式距离来衡量差异），在box的尺寸比较大的时候其误差也更大，而我们希望的是误差和box的尺寸没有太大关系。所以通过IOU定义了如下的距离函数，使得误差和box的大小无关：

Direct Location prediction （直接位置预测）

那么，作者在使用anchor boxes时发现的第二个问题就是：模型不稳定，尤其是在早期迭代的时候。大部分的不稳定现象出现在预测box的（x,y）坐标上了。在区域建议网络中，预测（x,y）以及tx，ty使用的是如下公式（）：

作者应该是把加号写成了减号。理由如下，anchor的预测公式来自于Faster-RCNN，我们来看看人家是怎么写的：

公式中，符号的含义解释一下：x 是坐标预测值，xa 是anchor坐标（预设固定值），x∗ 是坐标真实值（标注信息），其他变量 y，w，h 以此类推，t 变量是偏移量

这个是faster Rcnn的位置信息回归的损失函数

作者在引入anchor box的时候遇到的第二个问题：模型不稳定，尤其是在训练刚开始的时候。作者认为这种不稳定主要来自预测box的中心坐标(x,y)值。
在基于region proposal的目标检测算法中，是通过预测tx和ty来得到(x,y)值，也就是预测的是offsets。
论文这里公式是错的，应该是“+”号。依据是下文中的例子，以及Faster R-CNN中的公式。

这个公式是无约束的，预测的边界框很容易向任何方向偏移。
当tx=1时，box将向右偏移一个anchor box的宽度；
当tx=-1时，box将向左偏移一个anchor box的宽度；
因此，每个位置预测的边界框可以落在图片任何位置，这导致模型的不稳定性，在训练时需要很长时间来预测出正确的offsets。

YOLOv2中没有采用这种预测方式，而是沿用了YOLOv1的方法，就是预测边界框中心点相对于对应cell左上角位置的相对偏移值。
网络在最后一个卷积层输出13*13的feature map，有13*13个cell，每个cell有5个anchor box来预测5个bounding box，每个bounding box预测得到5个值。
分别为：tx、ty、tw、th和to（类似YOLOv1的confidence）
为了将bounding box的中心点约束在当前cell中，使用sigmoid函数将tx、ty归一化处理，将值约束在0~1，这使得模型训练更稳定。

Fine-Grained Features （细粒度特征）

这里添加了一个直通层（passthrough layer），即就是源码中的reorg layer，将前面一层的26*26的特征图和本层13*13的特征图进行连接，与ResNet网络的shortcut类似，以前面更高分辨率的特征图为输入，然后将其连接到后面的低分辨率特征图上。
在13*13的特征图上做预测，虽然对于大目标已经足够了，但对小目标不一定足够好，这里合并前面大一点的特征图可以有效的检测小目标。
具体操作：对于26*26*512的特征图，经passthrough层处理之后就变成了13*13*2048的新特征图（特征图大小变为1/4，而通道数变为以前的4倍），然后与后面的13*13*1024特征图连接在一起形成13*13*3072的特征图，最后在该特征图上卷积做预测。

Multi-Scale Training （多尺度训练）

YOLOv2中只有卷积层和池化层，因此不需要固定的输入图片的大小。
为了让模型更有鲁棒性，作者引入了多尺度训练。就是在训练过程中，每迭代一定的次数，改变模型的输入图片大小。

注意：这一步是在检测数据集上fine-tuning时候采用的，不要跟前面在Imagenet数据集上的两步预训练分类模型混淆。

具体操作：在训练时，每10个batch？确定不是10个epoch？网络就会随机选择另一种size的输入。

网络输入是416*416，经过5次max pooling之后会输出13*13的feature map，也就是下采样32倍，因此作者采用32的倍数作为输入的size，具体采用320、352、384、416、448、480、512、544、576、608共10种size。

输入图片大小为320*320时，特征图大小为10*10，输入图片大小为608*608时，特征图大小为19*19。
每次改变输入图片大小还需要对最后检测层进行处理，然后开始训练。

Faster

Darknet-19

网络包含19个卷积层和5个max pooling层，而在YOLOv1中采用的GooleNet，包含24个卷积层和2个全连接层，因此Darknet-19整体上卷积卷积操作比YOLOv1中用的GoogleNet要少，这是计算量减少的关键。最后用average pooling层代替全连接层进行预测

Training for Classification

这部分前面有提到，就是训练处理的小trick。
这里的Training for Classification都是在ImageNet上进行预训练。
YOLOv2的训练主要包括三个阶段：
第一阶段：在ImageNet分类数据集上从头开始预训练Darknet-19，训练160个epoch。输入图像的大小是224*224，初始学习率为0.1。另外在训练的时候采用了标准的数据增加方式比如随机裁剪，旋转以及色度，亮度的调整等。
第二阶段：将网络的输入调整为448*448，继续在ImageNet数据集上fine-tuning分类模型，训练10个epoch。参数的除了epoch和learning rate改变外，其他都没变，这里learning rate改为0.001。

Training for Detection
第三阶段：修改Darknet-19分类模型为检测模型，并在检测数据集上继续fine-tuning网络。

网络修改包括：移除最后一个卷积层、global avgpooling层以及softmax层，新增了三个332014卷积层，同时增加了一个passthrough层，最后使用1*1卷积层输出预测结果。输出通道数计算如下。
对于VOC数据，每个cell预测num=5个bounding box，每个bounding box有5个坐标值和20个类别值，所以每个cell有125个filter。即：filter_num = num * (classes + 5) = 5 * (20 + 5) = 125

注意：

这里filter_num的计算和YOLOv1不同，在YOLOv1中filter_num = classes + num * (coords + confidence) = 20 + 2 * (4 + 1) = 30，在YOLOv1中，类别概率是由cell来预测的，一个cell对应的两个box的类别概率是一样的，但是在YOLOv2中，类别概率是属于box的，每个box对应一个类别概率，而不是由cell决定，因此这边每个box对应25个预测值（5个坐标加20个类别值）。
YOLOv2和YOLOv3的计算方式是一致的。

YOLOv2训练的三个阶段如下图所示：

YOLOv2的结构示意图如下：

YOLOV3

网络结构图

改进之处：

多尺度预测（类FPN）
更好的基础分类网络（类ResNet）和分类器 darknet-53，见下图
分类器-类别预测：

YOLO v3采用多个scale融合的方式做预测。

原来的YOLO v2有一个层叫：passthrough layer，假设最后提取的feature map的size是13*13，那么这个层的作用就是将前面一层的26*26的feature map和本层的13*13的feature map进行连接，有点像ResNet。当时这么操作也是为了加强YOLO算法对小目标检测的精确度。这个思想在YOLO v3中得到了进一步加强，在YOLO v3中采用类似FPN的upsample和融合做法（最后融合了3个scale，其他两个scale的大小分别是26*26和52*52），在多个scale的feature map上做检测，对于小目标的检测效果提升还是比较明显的。前面提到过在YOLO v3中每个grid cell预测3个bounding box，看起来比YOLO v2中每个grid cell预测5个bounding box要少，其实不是！因为YOLO v3采用了多个scale的特征融合，所以boundign box的数量要比之前多很多，以输入图像为416*416为例：（13*13+26*26+52*52）*3和13*13*5相比哪个更多应该很清晰了。

关于bounding box的初始尺寸还是采用YOLO v2中的k-means聚类的方式来做，这种先验知识对于bounding box的初始化帮助还是很大的，毕竟过多的bounding box虽然对于效果来说有保障，但是对于算法速度影响还是比较大的。作者在COCO数据集上得到的9种聚类结果：(10*13); (16*30); (33*23); (30*61); (62*45); (59*119); (116*90); (156*198); (373*326)，这应该是按照输入图像的尺寸是416*416计算得到的。

网络结构（Darknet-53）

一方面基本采用全卷积（YOLO v2中采用pooling层做feature map的sample，这里都换成卷积层来做了），另一方面引入了residual结构（YOLO v2中还是类似VGG那样直筒型的网络结构，层数太多训起来会有梯度问题，所以Darknet-19也就19层，因此得益于ResNet的residual结构，训深层网络难度大大减小，因此这里可以将网络做到53层，精度提升比较明显）。Darknet-53只是特征提取层，源码中只使用了pooling层前面的卷积层来提取特征，因此multi-scale的特征融合和预测支路并没有在该网络结构中体现，

类别预测方面主要是将原来的单标签分类改进为多标签分类

因此网络结构上就将原来用于单标签多分类的softmax层换成用于多标签多分类的逻辑回归层。首先说明一下为什么要做这样的修改，原来分类网络中的softmax层都是假设一张图像或一个object只属于一个类别，但是在一些复杂场景下，一个object可能属于多个类，比如你的类别中有woman和person这两个类，那么如果一张图像中有一个woman，那么你检测的结果中类别标签就要同时有woman和person两个类，这就是多标签分类，需要用逻辑回归层来对每个类别做二分类。逻辑回归层主要用到sigmoid函数，该函数可以将输入约束在0到1的范围内，因此当一张图像经过特征提取后的某一类输出经过sigmoid函数约束后如果大于0.5，就表示属于该类。

K8S之QoS详解 RedCong 云原生 k8s Openshift kubernetes 容器云原生
PodQoS类服务质量（QualityofService，QoS）类，阐述Kubernetes如何根据为Pod中的容器指定的资源约束为每个Pod设置QoS类。Kubernetes依赖这种分类来决定当Node上没有足够可用资源时要驱逐哪些Pod。QoS类（QualityofServiceclasses）Kubernetes对你运行的Pod进行分类，并将每个Pod分配到特定的QoS类中。Kuberne
k8s系统学习路径 LCY133 kubernetes 学习容器
学习Kubernetes（K8s）需要循序渐进，结合理论知识和实践操作。以下是学习Kubernetes的推荐步骤：1.先决条件•掌握容器基础：先学习Docker，理解容器化概念（镜像、容器、仓库）、Dockerfile编写和容器生命周期管理。•熟悉Linux基础：了解Linux命令行操作、网络、文件系统等。•了解云计算概念：如虚拟化、负载均衡、服务发现、分布式系统等。2.Kubernetes核心概
【esp32】VSCODE + esp-idf 使用记录 zscredstone vscode ide 编辑器
旨在进行学习使用过程中的问题记录。esp已经把vscode插件做的不错了，可以直接进行编译调试。使用的是esp32S3内置的usb/jtag主要参考：https://blog.csdn.net/weixin_50993868/article/details/136498570https://blog.csdn.net/weixin_43842462/article/details/12329584
如何实现重试机制以增加代码的健壮性 ~请叫我小祸害~ .NET/C#c#.net .netcore
实际的软件开发中，我们经常会遇到需要处理连接失败、网络超时或其他临时性问题的情况。为了增加代码的健壮性和可靠性，我们可以使用重试机制来自动重新尝试操作，直到成功或达到最大重试次数。在.net中有一个NutGet包库：Policy。这是一个功能比较强大的重试机制库。贼牛。搜索NuGet包管理器安装Polly库一、重试策略~他有好多重试策略针对不同的类型，如：文件上传：、Sql操作、Http操作等等等
.NET/C# 生成二维码 ~请叫我小祸害~ .NET/C#.net c#开发语言 javascript
大家好，在本章是如何通过.net/C#来生成二维码首先大家还是需要仔细阅读这篇文档有小细节就需要注意大家需要生成一些类，把我的方法复制进去，如果不想添加类的话，大家需要再主代码上更改引用信息找到我们所添加的方法不适用于零基础的朋友，适用于有点经验的懂一点代码的就行1、首先我们新建一个自己的项目.netcore或其他项目新建好后新建一个控制器我们需要在里面写自己的代码，在控制器里面生成一个index
CTP开发爬坑指北（四）开心秋水 CTP c++金融网络协议
CTP开发中有很多需要注意的小细节，稍有不慎就会出问题，不然，轻则表现与预期不符，重则程序崩溃影响策略盈利。本系列将容易遇到的坑列出来，以供开发时参考，如有疑义之处，欢迎指正。三人行，必有我师焉。欢迎加入QQ群736174420，一起讨论交易CTP的使用！~01哪些报单状态是最终状态？我们先来看CTP中有哪些报单状态：/*报单状态*////全部成交#defineTHOST_FTDC_OST_All
使用Dapper和FastExcel在.NET中将SQL Server数据导出到Excel Tnp____ .net excel oracle .NET
在许多应用程序中，将数据库中的数据导出到Excel是一项常见的需求。在.NET开发中，使用Dapper和FastExcel库可以方便地实现这一目标。Dapper是一个轻量级的ORM（对象关系映射）工具，可以简化数据库访问。而FastExcel是一个高性能的Excel读写库，可以快速地生成Excel文件。本文将介绍如何使用Dapper和FastExcel库从SQLServer数据库中检索数据，并将其
京准电钟分享：水利系统NTP网络时间服务器应用北京华人开创公司时钟系统北斗卫星授时 NTP时间同步网络服务器运维时间同步时钟同步 NTP服务器网络时间服务器
京准电钟分享：水利系统NTP网络时间服务器应用京准电钟分享：水利系统NTP网络时间服务器应用1.项目背景水利控制系统涵盖水文监测、闸门控制、泵站调度、数据采集与传输等多个子系统，设备分布广泛且需协同工作。系统内各设备（如PLC、RTU、SCADA服务器、传感器等）的时间一致性直接影响数据记录的准确性、事件报警的时序性以及故障分析的可靠性。为实现全系统高精度时间同步，需部署NTP（NetworkTi
京准电钟推荐：智能交通系统NTP时间同步服务设计方案北京华人开创公司时钟系统 NTP时间同步卫星同步时钟 ntp 时钟同步时间同步网络授时网络校时
京准电钟推荐：智能交通系统NTP时间同步服务设计方案京准电钟推荐：智能交通系统NTP时间同步服务设计方案针对智能交通系统的NTP（NetworkTimeProtocol）时间同步方案设计，需确保交通设备（如信号灯、摄像头、传感器、服务器等）的时间高度一致，以提高系统协同效率和数据分析准确性。以下是完整的方案框架：一、需求分析同步精度核心设备（如信号控制机、边缘服务器）需达到**毫秒级（1-10ms
MobileNet家族：从v1到v4的架构演进与发展历程彩旗工作室人工智能架构人工智能机器学习 cnn 卷积神经网络
MobileNet是一个专为移动设备和嵌入式系统设计的轻量化卷积神经网络（CNN）家族，旨在在资源受限的环境中实现高效的图像分类、对象检测和语义分割等任务。自2017年首次推出以来，MobileNet经历了从v1到v4的多次迭代，每一代都在计算效率、模型大小和准确性上取得了显著进步。本文将详细探讨MobileNetv1、v2、v3和v4的原理、架构设计及其发展历程，并分析其关键创新和性能表现。Mo
Adaptive AUTOSAR之状态管理模块（STM） weixin_42130902 Adaptive AUTOSAR 架构
1.STM简介状态管理（STM）负责根据从其他AUTOSAR自适应平台应用程序或自适应应用程序接收的信息确定其任何内部状态机的状态。STM使用提供的网络管理字段（NetworkHandle）控制（部分网络）的状态。STM与执行管理（EXM）交互，以请求功能组和机器状态，以输入由项目需求确定的特定状态。功能组状态可能还依赖于网络管理（NM）状态。STM通过ara::com服务提供对其内部状态的访问。
python调用数据库存储过程_python连接mysql调用存储过程示例 weixin_39806948 python调用数据库存储过程
复制代码代码如下:#!/usr/bin/envpython#-*-coding:utf8-*-importMySQLdbimporttimeimportos,sys,stringdefCallProc(id,onlinetime):'''调用存储过程，输入参数：编号，在线时间，输出：帐号，密码;使用输出参数方式'''accname=''accpwd=''conn=MySQLdb.connect(h
kubernetes集群监控 Kube-Prometheus-Stack xiaojinran k8s prometheus docker 运维 kubernetes prometheus 容器 grafana
kubernetes集群监控概述Kubernetes（K8s）集群监控是指对Kubernetes集群中的各个组件和资源进行实时监测和数据收集，以获取对集群健康状态、性能指标和事件的可视化和告警。Kubernetes集群监控的内容通常包括以下几个方面：基础设施监控：监控物理服务器、虚拟机或云实例的资源使用情况，包括CPU、内存、磁盘和网络等指标。这可以帮助确保集群的底层基础设施正常运行，并及时发现资
uniapp报毒刘登辉 uni-app
uniapp打包的apk，装机量多了就开始报毒，尝试了多种解决办法都无解！！去某宝，解决一次50-100不等，并且没有售后，掉了重新做包，很是无解，包月价格更是离谱。为此自行测试找到了合适的办法。一、上架二、改包修改uniapp的包名，重新生成证书，为此做了一个一件生成证书的脚本，配合开发者中心【https://dev.dcloud.net.cn/】生成新的包名即可@echooffrem设置JDK
树莓派搭php,Raspberry Pi 树莓派搭LAMP服务器平平无奇的美女树莓派搭php
目录：为什么要用树莓派?DebianLinux安全性操作系统性能优化配置网络开启sshMakingtheserveravailableontheInternetDNS安装apache安全MySQL安装PHP配置完成本文将会介绍如何把树莓派配置为一台LAMP服务器.这和把XUbuntu配成LAMP服务器有些相似,但是针对树莓派有些需要特殊处理的地方.下面是LAMP服务器的最通用配置:Linux–操作
如何测试模型的推理速度想要躺平的一枚 AI图像算法计算机视觉
前言模型的推理速度测试有两种方式：一种是使用python的时间戳time函数来记录，另一种是使用Pytorch里的Event。同时，在进行GPU测试时，为减少冷启动的状态影响，可以先进行预热。代码如下（示例）：if__name__=="__main__":model=BiSeNet(backbone='STDCNet813',n_classes=2,export=True)model.cuda()
树莓派raspberry搭建web服务(基于LAMP) 最古琴
撸了今年阿里、头条和美团的面试，我有一个重要发现.......>>>本文永久地址：https://my.oschina.net/bysu/blog/15502121.安装apachesudoapt-getinstallapache2php-gdphp安装完之后，怎么确认是否安装成功了呢？可以通过以下几种方式确认。a.可以查看是否已有相应的服务ps-ef|grepapache会看到4条服务，其中主进
kubeadm安装k8s v1.20集群小腿乱蹬~ k8s 学习 kubernetes docker
kubeadm安装kubernetesv1.20环境准备安装Docker安装kubeadm,kubectl,kubelet部署master向集群添加节点部署容器网络环境准备角色IPk8s-master172.16.10.50k8s-node1172.16.10.51k8s-node2172.16.10.52关闭防火墙：$systemctlstopfirewalld$systemctldisable
C# WebAPI的几种返回类型方式她说彩礼65万 c#http
在ASP.NETCore中有三种返回数据和HTTP状态码的方式，最简单的就是直接返回指定的类型实例，如下代码所示：[ApiController][Route("[controller]")]publicclassWeatherForecastController:ControllerBase{[HttpGet]publicIEnumerableGet(){varrng=newRandom();re
Linux命令学习笔记之 network NetworkManager kfepiza OS操作系统 Windows Linux 等 #Linux CentOS Ubuntu 等 linux 学习 centos
networkNetworkManager前言CentOS7最小安装下的测试220511心得:启动network能打开网络,关闭network能关闭网络启动NetworkManager能打开网络,关闭不会关闭网络在两者都启动的情况下,单停network会断网,单停NetworkManager不会一些摘抄前言这两个东西在centOS7最小安装无勾选附加时就存在Ubuntu20.04中只有Networ
Windows 下 MySQL 命令行操作全指南：端口修改、服务管理与实用技巧 mysql后端命令行
引言MySQL作为最流行的关系型数据库之一，在Windows环境下的配置与管理是开发者必备技能。本文将以命令行操作为核心，详解如何通过命令修改MySQL端口号、启停服务、自定义服务名等实用操作，并结合常见问题解决方案，帮助用户快速掌握MySQL在Windows中的高效管理方法。一、MySQL服务启停1.通过命令行启停启动MySQL服务：netstartmysql8#根据实际服务名调整（如mysql
【图像分割】Labelme JSON标注转换为TXT代码详解唐king json python
书接上文：https://blog.csdn.net/qq_49092686/article/details/145114987?spm=1001.2014.3001.5502这里给出更细致的json2txt代码，同时考虑了circle、rectangle这两种情况各位朋友，在使用前，你一定要注意你的json格式是不是跟我的一致，不一致的话是用不了的（是不是也用的labelme制作的数据集）imp
FFMPEG实现音频重采样 QQ_1695710968 音频重采样 FFMPEG PCM
技术在于交流、沟通，转载请注明出处并保持作品的完整性。原文：https://blog.csdn.net/hiwubihe/article/details/81259134[音频编解码系列文章]音频编解码基础FFMPEG实现音频重采样FFMPEG实现PCM编码(采用封装格式实现)FFMPEG实现PCM编码(不采用封装格式实现)FAAC库实现PCM编码FAAD库实现RAW格式AAC解码FAAD库实现R
ZYNQ-7000 平台LwIP RAW Socket 模式下 TCP速率测试（Jperf） WILLFr tcp/ip 网络服务器
在ZYNQ-7000平台下，使用Jperf测试LwIPRAWSocket模式下的TCP速率，工程代码适配到Vivado2018.2SDK版本，并在zynq-7000平台验证测试。LwIPRAWsocket模式下,TCP速率大于900Mbps,Jperf测试结果如下：工程文件：https://download.csdn.net/download/csdn6403/90482672?spm=1011.
[Skynet 基础】(二) 创建日志服务 OSwich skynet基础 ubuntu 开发语言
文章目录概述基本配置使用Lua定制日志服务概述日志模块主要用于格式化输出程序日志，方便后续从日志中定位程序运行过程中出现的问题。当然日志除了日志内容本身之外，还应该包括文件名、行号、时间戳、线程、协程号、日志级别等信息。在输出错误日志时，还应附加程序的函数调用栈信息，便于后续分析和排查问题。日志系统一般分为5个等级：DEBUG：调试用的日志，线上运行时屏蔽不输出INFO：普通日志，线上运行时输出，
C# 项目常用库 OSwich wpf
1.MVVM框架(CommunityToolkit.Mvvm)平台和运行时库相独立-.NET2.0标准和.NET5（与UI框架无关）简单易用-在程序结构和编码范式上没有严格要求，即使用灵活自由组件-自由选择要使用的组件参考实现-精炼且性能好，提供了基础库的接口实现，但缺乏直接使用它们的具体类型这个包针对是.NET标准的，所以它能应用于任何平台：UWP，WinForms，WPF，Xamarin，Un
C# 通过chrome插件将HTML网页转换为PDF Eiceblue C#.NET PDF c#chrome html
将HTML网页内容转换为PDF格式能方便文档的后续打印、存档和分享等。之前介绍过如何通过QT插件将HTML转为PDF文件，本文将介绍另一个新的转换方法，通过谷歌浏览器Chrome插件将HTML网页转PDF文件。首先需要安装Spire.PDFfor.NET库（10.7.21版本及以上）。可以通过此链接下载产品包后手动添加引用，或者直接通过NuGet安装。https://www.e-iceblue.c
Mina 框架武涛的技术博客 java 框架技术服务器 netty
java服务器端开发。J2SE、TCP/UDP协议。mina与netty都是TrustinLee的作品，异步的NIO框架,将UDP当成"面向连接"的协议一、组件管理Mina的底层依赖的主要是JavaNIO库，上层提供的是基于事件的异步接口(1)IoService(最底层[起点])作用：隐藏底层IO的细节，对上提供统一的基于事件的异步IO接口IOSocketAcceptor和IOSocketChan
Kubernetes 认证授权实验总结 π大星星️ kubernetes 容器云原生
实验目标通过一系列实验步骤，深入理解Kubernetes中的认证和授权机制，包括用户账户和服务账户的创建、RBAC（基于角色的访问控制）的配置与应用，以及如何通过这些机制实现对Kubernetes资源的安全访问控制。实验环境Kubernetes集群（已部署并运行）kubectl命令行工具（已配置并连接到集群）一台具有管理员权限的主机（用于执行命令）实验一：创建用户账户并进行认证实验目的创建一个用户
【科研绘图系列】R语言绘制网络相关图（cor network plot）生信学习者1 SCI科研绘图系列 r语言数据分析数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理画图1画图2组合图形输出图片系统信息介绍【科研绘图系列】R语言绘制网络相关图（cornetworkplot）加载R包library(tidyverse)library(ggraph)library(igraph)library(patchwork)conflicted::
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。