weixin_40008033

如何使用CNN进行物体识别和分类_[论文笔记] R-CNN

[论文笔记] R-CNN：Rich feature hierarchies for accurate object detection and semantic segmentation

说在前面

个人心得：

1. 流程：输入图像，产生2k个候选区域，输入CNN，得到特征向量输入SVM进行分类

2. CNN的输入是固定的（因为全连接的尺寸），但是候选区域的尺寸不固定了，所以要resize

3. 需要思考3个问题，为什么要用SVM分类？如何NMS？如何BB regression？

CVRP 2014，原文链接：http://xxx.itp.ac.cn/abs/1311.2524

原文代码，基于Caffe：https://github.com/rbgirshick/rcnn

有人居庙堂，有人守边疆

同友同行，为太平故，为逝者祈福

愿疫过民安，合家团圆

本文作于2020年4月4日。

1、摘要

Object detection performance, as measured on the canonical PASCAL VOC dataset, has plateaued in the last few years. The best-performing methods are complex ensemble systems that typically combine multiple low-level image features with high-level context.

目标检测的性能是用经典的PASCAL VOC数据集来衡量的，在近几年里都停滞不前。之前最好性能的方法是复杂的集成系统，通常将多个低级图像特征与高级上下文结合在一起。

In this paper, we propose a simple and scalable detection algorithm that improves mean average precision (mAP) by more than 30% relative to the previous best result on VOC 2012—achieving a mAP of 53.3%.

在本文中，我们提出了一个简易的、可扩展的检测算法，其将VOC 2012的mAP提高了超过30%，达到了53.3%。

Our approach combines two key insights: (1) one can apply high-capacity convolutional neural networks (CNNs) to bottom-up region proposals in order to localize and segment objects and (2) when labeled training data is scarce, supervised pre-training for an auxiliary task, followed by domain-specific fine-tuning, yields a significant performance boost.

我们的方法结合了2个重要的想法：（1）可以将大型卷积神经网络（CNN）应用于自下而上的区域候选，以便对目标进行定位和分割；（2）当标记的训练数据稀少，有监督的预训练时当做一个辅助任务，进行特定于域的微调，可以显著提高性能。

Since we combine region proposals with CNNs, we call our method R-CNN: Regions with CNN features. We also compare R-CNN to OverFeat, a recently proposed sliding-window detector based on a similar CNN architecture. We find that R-CNN outperforms OverFeat by a large margin on the 200-class ILSVRC2013 detection dataset.

因为我们使用基于CNN的区域候选，因此我们把这个方法称为R-CNN：Regions with CNN features。我们也将R-CNN和OverFeat（基于相似的CNN架构的滑动窗口目标检测框架）进行比较，我们发现在ILSVRC2013上R-CNN的性能超过了OverFeat一大截。

2、引言

特征很重要。在过去的十年中，各种视觉识别任务的进展都很大程度上取决于SIFT和HOG的使用。但是，如果我们查看经典的视觉识别任务PASCAL VOC目标检测的性能变化，通常会发现到在2010-2012年间进展缓慢，可以说，通过构建集成系统和采用一些较成功方法的较小改变的变体获得的收益很小。

SIFT和HOG是块状方向直方图，可以大致与V1（灵长类动物视觉通路的第一个皮质区域）中的复杂细胞相关联。但是我们也知道，识别发生在下游的几个阶段，这表明可能存在用于计算特征的层次化、多阶段的过程，这些过程对于视觉识别来说甚至更有意义。

Fukushima的“neocognitron”，一种受生物学启发用于模式识别的层次化、移动不变性模型，算是这方面最早的尝试。然而，neocognitron缺乏监督学习算法。Lecun等人的工作表明基于反向传播的随机梯度下降(SGD)对训练卷积神经网络（CNNs）非常有效，也可以说CNN是被认为是继承neocognitron的一类模型。

CNN在1990年代被广泛使用，但是因为支持向量机的出现而退出了研究领域。2012年，Krizhevsky等人在ILSVRC上的出色表现（AlexNet）重新燃起了世界对CNNs的兴趣。他们的成功在于在120万的标签图像上使用了一个大型的CNN，并且对LeCun的CNN进行了一些改造（比如ReLU和Dropout）。

这个ImangeNet的结果的重要性在ILSVRC2012 workshop上得到了热烈的讨论。中心的议题可以被归纳为，ImageNet上的CNN分类结果可以多大程度的推广到目标检测的PASCAL VOC上？

我们将图像分类和目标检测连接在一起，回答了这个问题。这篇文章第一次表明了CNN可以显著地在PASCAL VOC上提高目标检测的性能，相比于之前基于HOG特征的系统。我们主要关注了2个问题：使用深度网络定位目标和只用一小部分标注的数据来训练一个大型的模型。

和图像分类不同的是，检测要求在图像中确定目标的位置。一种方法是把定位当做一个回归问题。然而，Szegedy等人成果说明这个idea其实不是很行（效果远低于R-CNN）。另一个替代的方法是使用滑动窗口。CNN被用于滑动窗口有起码20年的历史了，特别是在特定目标的中，如人脸、行人。为了保持高空间分辨率，CNN通常只有2层卷积和池化。我们也考虑过使用滑动窗口，但是由于网络层次更深（有5层），输入图片有非常大的感受野（195×195）和stride（32×32），这使得采用滑动窗口的方法是一个开放的技术挑战。

相比之下，我们使用“recognition using regions”的方法解决了CNN的定位问题，这个方法在目标检测和语义分割领域都很成功。在测试时，我们会为输入的图像生成近2000个类别无关的候选区域，然后对每个候选区域使用CNN来提取一个固定长度的特征向量，最后使用线性支持向量机对每个候选区域进行分类。我们可以不管区域的尺寸，使用仿射图像变形的方法来对每个不同形状的候选区域产生一个固定长度的作为CNN输入的特征向量。下图是我们的方法的流程，由于结合区域候选和CNN，因此我们的方法取名为R-CNN。

在本文的更新版本中，我们通过在200类ILSVRC2013检测数据集上运行R-CNN，提供了R-CNN与最近提出的OverFeat检测系统的直接对比。OverFeat使用滑动窗口CNN进行检测，到目前为止，这是ILSVRC2013检测中性能最好的方法。我们显示，R-CNN明显优于OverFeat，mAP达到了31.4%。

检测中面对的第二个挑战是标签数据太少，现在可获得的数据远远不够用来训练一个大型卷积网络。传统的方法使用无监督预训练，然后在监督学习微调。本文第二个核心贡献是在辅助数据集（ILSVRC）进行监督训练，然后再针对小数据集进行特定地微调，这是在数据稀少的情况下一个非常有效的训练大型卷积神经网络的网络。在我们的实验中，对检测的微调使mAP增加了8%。在经过微调后，我们的系统在VOC 2010达到了54%的mAP，远远超过高度优化的deformable part model（DPM）。我们还向读者指出Donahue等人的同期著作，Krizhevsky的CNN可以用作黑箱特征提取器（无需微调），从而在包括场景分类，细粒度分类和域自适应在内的多种识别任务上表现出出色的性能。

我们的系统是相当高效的。唯一的特定于类的计算是一个相当小的矩阵向量乘积和贪婪的非极大抑制。此计算属性源自所有类别之间共享的特征，并且维数也比以前使用的区域特征低两个数量级。

了解我们的方法的失败模式对于改进它也是至关重要的，因此我们报告了Hoiem等人的检测分析工具的结果。作为此分析的直接结果，我们证明了一种简单的边界框回归方法可以显着减少误定位，这是主要的误差模式。

在描述技术细节之前，我们注意到，由于R-CNN在区域上运行，因此很自然地将其扩展到语义分割的任务。稍作修改，我们在PASCAL VOC分割任务上也取得了竞争性结果，在VOC 2011测试集上，平均细分精度为47.9％。

3、用R-CNN来目标检测

我们的物体检测系统由三个模块组成。第一个模块生成与类别无关的区域候选框。这些候选框定义了我们的检测器可用的一组候选检测区域的集合。第二个模块是一个大型卷积神经网络，它从每个区域提取一个固定长度的特征向量。第三个模块是一组特定于类别的线性SVM。在本节中，我们介绍每个模块的设计决策，描述测试阶段的用法，详细了解如何学习其参数以及显示PASCAL VOC 2010-12和ILSVRC2013上的检测结果。

模块设计 Module design

区域候选：近来有很多研究都提出了产生类别无关区域候选的方法。由于R-CNN对特定区域算法是不关心的，所以我们采用了选择性搜索（selective search）以方便和前面的工作进行可控的比较。

特征提取：会从

的图像中，利用CNN（AlexNet）前向传播，得到一个4096维的向量。为了计算候选区域的特征，我们必须将将候选区域的图像数据变换成可以输入CNN（CNN的固定输入为

）。变形的方法我们采用最简单的，不管候选区域的长宽比，直接把候选框变形成想要的尺寸。在进行变换之前，我们会把边界框扩展16个像素（padding=16）。

测试阶段的目标检测 Test-time detection

在测试时，我们对测试图像进行selective search，以提取大约2000个候选区域（我们在所有实验中均使用selective search的“快速模式”）。我们对每个候选区域进行变形，然后依次通过CNN进行传播以计算特征。然后，对于每个类别，我们使用针对该类别训练的SVM对每个提取的特征向量进行评分。给定图像中所有计分的区域，我们应用贪婪的非极大抑制（每个类别都是独立进行），如果该区域的交叉重叠（IoU）重叠且评分较高的选定区域大于a，则抛弃掉该区域。

运行分析：有2个特性会让检测变得很效率。（1）所有的CNN参数都是共享的；（2）过CNN计算的特征向量相比其他通用方法（spatial pyramids with bag-of-visual-word encodings）维度是很低的。UVA检测系统的特征比我们的要多两个数量级(360k vs 4k)。

这种共享的结果就是计算候选区域的特征的耗时可以分摊到所有类别的头上（GPU：每张图13s，CPU：每张图53s）。唯一的和具体类别有关的计算是特征向量和SVM权重和点积，以及非极大抑制。实践中，所有的点积都可以批量化成一个单独矩阵间运算。特征矩阵的典型大小是2000×4096，SVM权重的矩阵是4096xN，其中N是类别的数量。

实验分析表明，R-CNN可以扩展到上千个类别，而不需要借用近似技术（如hashing）。即使有10万个类别，矩阵乘法在现代多核CPU上只需要10s而已。但这种高效不仅仅是因为使用了区域候选和共享特征。由于较高维度的特征，UVA系统存储100k linear predictors需要134GB的内存，而我们只要1.5GB，比我们高了两个数量级。

有趣的是，R-CNN和最近Dean等人使用DPMs和hashing做检测的工作相比，他们用了1万个干扰类，每五分钟可以处理一张图片，在VOC 2007上的mAP能达到16%。我们的方法1万个检测器，由于没有做近似，可以在CPU上一分钟跑完，达到59%的mAP。

训练 Training

监督预训练：我们仅使用图像级注释在大型辅助数据（ILSVRC2012分类）上有区别地预训练了CNN（边界框标签不适用于此数据）。使用开源Caffe CNN库进行预训练。简而言之，我们的CNN几乎与Krizhevsky等人的表现相当，在ILSVRC2012分类验证集上获得了最高2.2个百分点的top-1错误率，这种差异是由于训练过程的简化。

特定领域的微调：为了让我们的CNN适应新的任务（检测）和新的领域（变形后的候选窗口）。我们只使用变形后的候选区域对CNN参数进行SGD训练。我们替换掉了ImageNet的1000类分类层，换成了一个随机初始化的21类分类层（其中20是VOC的类别数，1代表背景），而卷积部分都没有改变。我们对待所有的候选区域，如果其和真实标注的框的IoU>= 0.5就认为是正例，否则就是负例。SGD开始的learning_rate为0.001（是初始化预训练时的1/10），这使得调优得以有效进行而不会破坏初始化的成果。每轮SGD迭代，我们统一使用32个正例窗口（跨所有类别）和96个背景窗口，即每个mini-batch的大小是128。另外我们倾向于采样正例窗口，因为和背景相比它们很稀少。

目标类别分类器：思考一下检测汽车的二分类器。很显然，一个图像区域紧紧包裹着一辆汽车应该就是正例。同样的，没有汽车的就是背景区域，也就是负例。较为不明确的是怎样标注哪些只和汽车部分重叠的区域。我们使用IoU重叠阈值来解决这个问题，低于这个阈值的就是负例。这个阈值我们选择了0.3，是在验证集上基于

通过网格搜索得到的。我们发现认真选择这个阈值很重要。如果设置为0.5，可以降低mAP5个点，设置为0，就会降低4个点。正例就严格的是标注的框。

一旦特征提取出来，并应用标签数据，我们优化了每个类的线性SVM。由于训练数据太大，难以装进内存，我们选择了标准的hard negative mining method。高难负例挖掘算法收敛很快，实践中只要在所有图像上经过一轮训练，mAP就可以基本停止增加了。附录B中，我们讨论了，为什么在fine-tunning和SVM训练这两个阶段，我们定义得正负样例是不同的。我们也会讨论为什么训练一个分类器是必要的，而不只是简单地使用来自调优后的CNN的最终fc8层的输出。

在PASCAL VOC 2010-12上的结果

下图展示了在VOC 2010的结果，我们将自己的方法同四种先进的基准方法作对比，其中包括SegDPM，这种方法结合了DPM检测器和语义分割系统的输出，并使用了附加的检测器间上下文和图像分类器记录。更加恰当的比较是同Uijling的UVA系统比较，因为我们的方法同样基于候选框算法。对于候选区域的分类，他们通过构建一个4层的金字塔，并且将之与SIFT模板结合，SIFT为扩展的OpponentSIFT和RGB-SIFT描述子，每一个向量被量化为4000-word的codebook。分类任务由一个直方图交叉核的SVM承担，对比这种方法的多特征方法，非线性内核的SVM方法，我们在mAP达到一个更大的提升，从35.1%提升至53.7%，而且速度更快。我们的方法在VOC2011/2012测试集上达到了相似的检测效果mAP53.3%。

- Results on ILSVRC2013 detection

我们使用与用于PASCAL VOC相同的系统超参数在200类ILSVRC2013检测数据集上运行R-CNN。我们仅遵循两次将测试结果提交到ILSVRC2013评估服务器的相同协议，一次带有边界框回归，一次带有边界框回归。

下图将R-CNN与ILSVRC 2013竞赛中的参赛的model以及竞赛后的OverFeat结果进行了比较。R-CNN的mAP达到31.4％，大大超过了OverFeat的24.3％。大多数竞争者（OverFeat，NEC-MU，UvA-Euvision，Toronto A和UIUC-IFP）都使用了卷积神经网络，这表明在如何将CNN应用于对象检测方面存在很大的细微差别，从而导致结果差异很大。

4、可视化、对比实验和模型误差

可视化学到的特征 Visualizing learned features

第一层过滤器可以直接可视化并且易于理解。它们捕获定向的边缘和对手的颜色。了解后续图层更具挑战性。Zeiler和Fergus提出了一种视觉上有吸引力的反卷积方法。我们提出一种简单（且互补）的非参数方法，该方法直接显示网络学到的知识。

想法是挑选出网络中的特定单元（功能），并像使用它本身就是对象检测器一样使用它。就是说，我们根据一大批保留候选区域（大约1000万）计算单位的激活，将候选区域从最高激活排序到最低激活，执行非极大抑制，然后显示得分最高的区域。我们的方法通过确切显示触发的输入，让选定的单元“为自己说话”。我们避免求平均值，以便看到不同的视觉模式并深入了解由设备计算出的不变性。

我们将第5层（即网络的第五个也是最后一个卷积层）的最大池化输出可视化。pool5特征图为6×6×256 = 9216维。忽略边界效应，每个pool5单元在原始227×227像素输入中具有195×195像素的接收场。一个中央游泳池5的单位几乎具有全局视野，而靠近边缘的单位则具有较小的固定支持。

上图中的每一行显示了CNN的pool5单元的前16个激活区域，我们在VOC 2007训练中对其进行了微调。可视化256个功能独特的单元中的六个。选择这些单元以显示网络学习内容的代表性示例。在第二行中，我们看到一个在狗脸和点阵列上触发的单元。与第三行相对应的单位是红色斑点检测器。还有用于人脸和更抽象的图案的检测器，例如带有窗口的文本和三角形结构。该网络似乎正在学习一种表示形式，该表示形式将少量的类调整特征与形状、纹理、颜色和材料属性的分布式表示形式结合在一起。后续的完全连接层fc6具有对这些丰富特征的大量组合进行建模的能力。

对比实验 Ablation studies

主要比较了没有微调的各层性能和调优后的各层性能。

Network architectures

本文的大多数结果使用Krizhevsky等人的网络体系结构。但是，我们发现架构的选择对R-CNN的检测性能有很大的影响。在表3中，我们显示了Simonyan和Zisserman最近提出的使用16层深度网络（VGG）进行VOC 2007测试的结果。在最近的ILSVRC 2014分类挑战中，该网络是表现最好的网络之一。该网络具有一个均匀的结构，该结构由13层3×3的卷积核组成，其中散布了五个最大池化层，并在其上放置了三个完全连接的层。对于牛津网络（VGG），我们将此网络称为“ O-Net”；对于多伦多网络（AlexNet），我们将其基准称为“ T-Net”。

为了在R-CNN中使用O-Net，我们从Caffe Model Zoo下载了VGG ILSVRC 16层模型的公开可用的预训练网络权重。然后，我们使用相同的方法对网络进行了微调，用于T-Net。唯一的区别是根据需要使用较小的批处理（24），以适合GPU内存。结果表明，带有O-Net的R-CNN明显优于带有T-Net的R-CNN，mAP从58.5％增加到66.0％。但是，在计算时间方面存在很大的缺陷，O-Net的前向传递比T-Net花费大约7倍的时间。

Detection error analysis

为了揭示出我们方法的错误之处，我们使用Hoiem提出的优秀的检测分析工具，来理解调参是怎样改变他们，并且观察相对于DPM方法，我们的错误形式。这个分析方法全部的介绍超出了本篇文章的范围，笔记就不做介绍了。

Bounding-box regression

基于错误分析，我们使用了一种简单的方法减小定位误差。受到DPM中使用的约束框回归训练启发，我们训练了一个线性回归模型在给定一个选择区域的pool5特征时去预测一个新的检测窗口。详细的细节参考附录。该方法修复了大量的错位检测，提升了3-4个百分点。

Qualitative results

主要是一些图片展示检测性能的。

5、ILSVRC 2013 检测数据集

主要是在ILSVRC 2013的竞赛细节。

6、语义分割

区域分类是语义分割的一种标准技术，使我们能够轻松地将R-CNN应用于PASCAL VOC分割挑战。为了和当前主流的语义分割系统（称

，second-order poolin）做对比，我们使用了一个开源的框架。

使用CPMC（？）针对每张图片产生150个区域候选，并预测每个区域的品质，对于每个类别，进行支持向量回归（support vector regression，SVR）。们的方法很高效，主要得益于CPMC区域的品质和多特征类型的强大二阶池化（second-second pooling，SIFT和LBP的增强变种）。我们也注意到Farabet等人将CNN用作多尺度逐像素分类器，在几个高密度场景标注数据集（不包括PASCAL）上取得了不错的成绩。

我们将Hariharan等人提供的额外标注信息补充到PASCAL分割训练集中。设计选择和超参数都在VOC 2011验证集上进行交叉验证。最后的测试结果只执行了一次。

用于分割的CNN特征

为了计算CPMC区域上的特征，我们执行了三个策略，每个策略都先将矩形窗口变形到227×227大小。第一个策略完全忽略区域的形状(full ignore)，直接在变形后的窗口上计算CNN特征，就和我们检测时做的一样。但是，这些特征忽略了区域的非矩形形状。两个区域也许包含相似的约束框却几乎没有重叠。因此，第二个策略(fg，foreground)只计算前景遮罩（foreground mask）的CNN特征，我们将所有的背景像素替换成平均输入，这样减除平均值后他们就会变成0。第三个策略(full+fg)，简单的并联全部（full）特征和前景（fg）特征；我们的实验验证了他们的互补性。

在VOC 2011上的结果

我们给出了VOC 2011测试集上的结果。比较我们的最佳执行方法，fc6（full+fg），对抗两个强大的baselines。我们的方法在21个类别中的11个达到最高的分割精度，最高的总体分割精度为47.9%，平均跨类别（但可能与O2P结果在任何合理的误差范围内）。通过微调可能会取得更好的成绩。

7、总结

最近几年，目标检测陷入停滞，表现最好的检测系统是复杂的将多个低层级的图像特征与高层级的物体检测器环境与场景识别相结合。本文提出了一种简单并且可扩展的物体检测方法，达到了VOC 2012数据集相对之前最好性能的30%的提升。

我们取得这个性能主要通过两个方面：第一是应用了自底向上的候选框训练的大型卷积神经网络进行定位和分割物体。另外一个是使用在标签数据匮乏的情况下训练大规模神经网络的一个方法。我们展示了在有监督的情况下使用丰富的数据集（图片分类）预训练一个网络作为辅助性的工作是很有效的，然后采用稀少数据（检测）去微调定位任务的网络。我们猜测“有监督的预训练+特定领域的调优”这一范式对于数据稀少的视觉问题是很有效的。

最后，我们注意到能得到这些结果，将计算机视觉中经典的工具和深度学习(自底向上的区域候选框和卷积神经网络）组合是非常重要的。而不是违背科学探索的主线，这两个部分是自然而且必然的结合。

8、参考文献

部分翻译参考自：https://blog.csdn.net/zkddt/article/details/100713823

什么是 Paxos和Raft MonkeyKing.sun paxos raft
Raft和Paxos是两种经典的分布式一致性算法（ConsensusAlgorithms），广泛应用于数据库、分布式系统、微服务架构中，用来确保在多个节点中即使有部分节点故障，系统仍然可以就“某一值”达成一致（即：分布式共识）。它们不是区块链专属，但在联盟链、私有链或数据库复制系统中常被用来替代PoW、PBFT等共识机制。一、什么是Paxos？定义：Paxos是一种保证在部分节点失效或网络延迟时，
什么是DPoS（Delegated Proof of Stake，委托权益证明） MonkeyKing.sun DPoS
DPoS（DelegatedProofofStake，委托权益证明）是一种基于PoS（权益证明）演进而来的共识算法，设计初衷是提高性能、增强治理效率、实现社区自治。一、什么是DPoS（委托权益证明）？DPoS是一种将记账权“委托给投票选出的代表节点”的共识机制。普通用户不直接参与出块，而是通过投票选出“代表人”代为记账和验证交易。可以理解为：“股东大会投票选董事会代表他们管理公司”。二、DPoS的
Ehcache、Caffeine、Spring Cache、Redis、J2Cache、Memcached 和 Guava Cache 的主要区别 MonkeyKing.sun spring redis memcached
主流缓存技术Ehcache、Caffeine、SpringCache、Redis、J2Cache、Memcached和GuavaCache的主要区别，涵盖其架构、功能、适用场景和优缺点等方面：Ehcache类型:本地缓存（JVM内存缓存）特点:轻量级，运行在JVM内部，易于集成到Java应用中。支持堆内、堆外和磁盘缓存，适合处理中小型数据集。提供丰富的缓存配置，如TTL（生存时间）、TTI（空闲时
默克树技术原理 MonkeyKing.sun guava 缓存
“默克树”（MerkleTree，有时也译作“梅克尔树”）是一种树形数据结构，在区块链、分布式系统等领域广泛使用，目的是为了高效且安全地验证数据的完整性和存在性。一、什么是默克树技术原理？MerkleTree的核心原理如下：将一组数据（如交易、文件、记录等）进行哈希处理，得到数据的哈希值作为叶子节点；将相邻两个哈希值再做一次哈希，生成其父节点；不断两两组合哈希直到构造出一个最终的根哈希值（Merk
SQLserver数据库学习笔记溪衡学习
小记1：1.newid()我觉得是一个生成唯一键的好方法，不用自增控制主键，可以用这个试试，注意不做处理的话，需要36位。例如：在数据库中直接使用语句selectnewid()2.nolock按我的理解是“不上锁的”，所谓的脏读，大多用的都是这个东西，据说可以提高查询速度。3.go批处理语句，将前面的代码作为一批处理。4.内连接与简单多表在数据量少的时候查询速度差距并不明显。5.删除和更新数据时，
DAY 26 函数专题1
函数定义与参数知识点回顾：1.函数的定义2.变量作用域：局部变量和全局变量3.函数的参数类型：位置参数、默认参数、不定参数4.传递参数的手段：关键词参数5题目1：计算圆的面积任务：编写一个名为calculate_circle_area的函数，该函数接收圆的半径radius作为参数，并返回圆的面积。圆的面积=π*radius²(可以使用math.pi作为π的值)要求：函数接收一个位置参数radius
DAY 10 机器学习建模与评估心落薄荷糖 Python训练营机器学习人工智能
知识点：1.数据集的划分2.机器学习模型建模的三行代码3.机器学习模型分类问题的评估今日代码比较多，但是难度不大，仔细看看示例代码，好好理解下这几个评估指标。作业：尝试对心脏病数据集采用机器学习模型建模和评估#一、导入库importpandasaspdimportpandasaspd#用于数据处理和分析，可处理表格数据。importnumpyasnp#用于数值计算，提供了高效的数组操作。impor
SQL学习笔记1
1.数据库1、什么是数据库数据库（DB）即用于存放数据的服务器，如MySQL等软件是数据库管理系统（DBMS），用于管理存放在数据库中的数据，SQL是用于操作DBMS的标准语言。2、数据库的类型数据库分为关系型数据库和非关系型数据库；关系型数据库是指用建立在关系模型上互相关联的二维表组成的数据库，MySQL是用于管理关系型数据库的数据库管理系统2.MySQL启动与连接1、MySQL启动安装好MyS
探索Java性能优化的利器：Java Microbenchmark Harness（JMH）柯茵沙
探索Java性能优化的利器：JavaMicrobenchmarkHarness（JMH）jmhhttps://openjdk.org/projects/code-tools/jmh项目地址:https://gitcode.com/gh_mirrors/jm/jmhJavaMicrobenchmarkHarness（简称JMH）是一个用于构建、运行和分析Java以及其他在JVM上运行的语言的微基准测
Spring Boot 项目分层架构详解 damnItHUA 后端 spring boot 架构后端
在现代SpringBoot项目中，Controller、Service、Mapper和Entity四层架构能够有效提升代码可维护性、可测试性与团队协作效率。下面以“商品管理（Product）”为例，系统梳理这四层的职责分工与协作关系。一、Controller层作为Springboot应用程序的入口点，Controller层主要负责接收来自前端或其他系统的HTTP请求，校验输入参数，将业务委托给Se
39. 组合总和
题目：给你一个无重复元素的整数数组candidates和一个目标整数target，找出candidates中可以使数字和为目标数target的所有不同组合，并以列表形式返回。你可以按任意顺序返回这些组合。candidates中的同一个数字可以无限制重复被选取。如果至少一个数字的被选数量不同，则两种组合是不同的。对于给定的输入，保证和为target的不同组合数少于150个。解题思路：总体上这道题采用
22. 括号生成
题目：数字n代表生成括号的对数，请你设计一个函数，用于能够生成所有可能的并且有效的括号组合。解题思路：我觉得本质上来说，就是从数组中[‘(’,‘)’]可重复地选择元素，生成一个长度为2n的括号组合。为了使这个括号组合是有效的，那么在选择的过程中就有一些约束：1、左括号的数量不能超过n。2、左括号的数量不能小于有括号的数量。3、当左括号和有括号的数量都等于n时，就是收获结果的时候。4、因为我们的pa
基于MFC的遥感图像匹配程序设计 HH予嵌入式驱动工程项目开发 mfc c++
基于MFC的遥感图像匹配程序设计下面我将为你设计一个使用MFC实现的遥感图像匹配程序，能够显示图片并在图上标注匹配点位置，支持地面点坐标的输入和输出。程序框架设计1.创建MFC项目使用VisualStudio创建一个MFC应用程序项目选择"单文档"界面勾选"文档/视图体系结构支持"2.主界面设计//在CMainFrame中添加以下成员变量classCMainFrame:publicCFrameWn
AT7456E视频字符叠加OSD芯片 Kandiy18025398187 人工智能经验分享单片机
AT7456E视频字符叠加OSD芯片,集成了EEPROM的单通道、单色随屏显示器AT7456E是一款集成了EEPROM的单通道、单色随屏显示发生器，集成了视频驱动器、同步分离器、视频分离开关以及EEPROM，提高了系统的集成度，有效降低了系统成本。优势1.采用符合NTSC和PAL制式的512个用户可编程字符，适合于全球市场。2.能够方便地以任意字符、尺寸显示各种信息，例如公司标识、常用图形、时间、
SX1268低功耗sub-1g芯片支持lora和GFSK调制 Kandiy18025398187 物联网 iot 人工智能硬件工程
SX1268射频收发器是长距离无线应用的理想设备，支持410-810MHZ。它专为长电池寿命而设计，仅消耗4.2mA的主动接收电流。SX1268可以使用高效的集成功率放大器在490MHz传输高达+22dBm的信号。在780MHZ时，SX1268在天线端口传输+10dBm的信号时消耗不到20mA的电流。SX1268支持用于LPWAN用例的LoRa@调制和用干遗留用例的(G)FSK调制。它高度可配置，
DPU02完全替代GP2102是一个USB转UART串口芯片超低成本国产方案 Kandiy18025398187 嵌入式硬件
简介CP2102的替代方案DPU02是一个USB转UART串口芯片，低成本国产芯片PIN对PINDPU02是一个高度集成的USB转UART的桥接控制器，该产品提供了一个简单的解决方案，可将RS232设计更新为USB设计，并简化PCB组件空间。该DPU02包括了一个USB2.0全速功能控制器、USB收发器、振荡器、EEPROM和带有完整调制解调控制信号的异步串行数据总线（UART）控制器，集成在一个
ZCC5050是一款高性能的高侧 OR-ing FET 控制器替代LM5050 2501_92222359 嵌入式硬件
一产品概述ZCC5050-1是一款高性能的高侧OR-ingFET控制器，适用于冗余电源系统。它通过外部N沟道MOSFET实现理想的二极管整流功能，可显著降低传统二极管整流器带来的功率损耗和电压降。ZCC5050-1提供了快速的电流反转响应能力，能够在50ns内关闭MOSFET，确保系统的稳定性和可靠性。ZCC5050-1isahigh-performancehighsideORingFETcont
ZCC5050是一款高性能的高侧 OR-ing FET 控制器替代LM5050 2501_92222359 嵌入式硬件
一产品概述ZCC5050-1是一款高性能的高侧OR-ingFET控制器，适用于冗余电源系统。它通过外部N沟道MOSFET实现理想的二极管整流功能，可显著降低传统二极管整流器带来的功率损耗和电压降。ZCC5050-1提供了快速的电流反转响应能力，能够在50ns内关闭MOSFET，确保系统的稳定性和可靠性。ZCC5050-1isahigh-performancehighsideORingFETcont
Python实例之十大歌手评分 *濒危物种* 算法前端 python
实例背景：十大歌手，为丰富校园文化生活，学校拟组织一场歌手大赛，从参赛选手中选拔出十名相对突出的学生，授予“校园十大歌手”称号。比赛之中设置有评委组，每名选手演唱完毕之后会由评委组的十名评委打分。为保证比赛公平公正、防止作弊和恶意打分，计算得分(即平均分)时会先去掉最高分和最低分要求实现：根据每位评委的输入分数，实现计算每位选手得分的功能。【重要步骤提示】定义列表放评委给分找出列表的最高分和最低分
JMH (Java Microbenchmark Harness) 阙芸 python 测试工具开发语言
JMH是Java的微基准测试工具，由OpenJDK团队开发，专门用于编写、运行和分析Java代码的微基准测试（microbenchmark）。为什么需要JMH普通的基准测试方法（如多次循环调用方法并计时）存在很多问题：JVM的JIT编译优化（方法内联、死代码消除等）预热效应（JVM需要"热身"才能达到最佳性能）垃圾回收的干扰操作系统调度的影响JMH解决了这些问题，提供了准确的基准测试环境。基本使用
Linux内核启动：深入理解Initramfs与Initrd机制 CClaris linux 服务器嵌入式嵌入式操作系统操作系统
在Linux系统启动过程中，内核需要访问根文件系统来继续启动过程。然而，根文件系统可能位于内核无法直接访问的存储设备上，这就产生了一个"鸡生蛋，蛋生鸡"的问题：内核需要驱动程序来访问存储设备，而驱动程序又存储在这些设备上。为了解决这个问题，Linux引入了initrd和initramfs机制。本文将深入探讨这两种机制的工作原理、区别以及实际应用。问题的由来早期Linux系统的局限性在Linux系统
Python机器学习元学习库higher 音程机器学习人工智能 python 机器学习
higher是一个用于元学习（Meta-Learning）和高阶导数（Higher-ordergradients）的Python库，专为PyTorch设计。它扩展了PyTorch的自动微分机制，使得在训练过程中可以动态地计算参数的梯度更新，并把这些更新过程纳入到更高阶的梯度计算中。一、主要用途higher主要用于以下场景：元学习（Meta-Learning）比如MAML（Model-Agnosti
Learning PostgresSQL读书笔记: 第8章 Triggers and Rules dingdingfish PostgresSQL postgresql database architecture tutorial
本章将讨论以下内容：•探索PostgreSQL中的规则•管理PostgreSQL中的触发器•事件触发器探索PostgreSQL中的规则文档中的这段话阐述了rule和trigger的区别：PostgreSQL规则系统允许定义在数据库表中插入、更新或删除时执行的替代操作。粗略地说，当对给定表执行给定命令时，规则会执行其他命令。或者，INSTEAD规则可以用另一个命令替换给定命令，或者导致命令根本不执行
NRF52810-CAAA/QFAA/QCAA低功耗蓝牙5.0支持2.4G私有协议是NRF52832的低成本方案 Kandiy18025398187 物联网 iot
NRF52810简介nRF52810系统级芯片（SoC）是nRF52系列的基准成员，是NRF52832的低成本方案。它满足了将高级低功耗蓝牙功能和协议并发性引入应用的挑战，其价位使得向应用添加低功耗蓝牙连接极具吸引力。它是不太复杂的应用的理想选择，也是大型应用中的低功耗蓝牙连接处理器的理想选择。nRF52810支持低功耗蓝牙协议，包括2Mbps的高速传输特性。它还支持ANT和2.4GHz私有协议。
Go中interface接口的设计理念 Code季风 golang 开发语言学习 rpc
Go语言中的接口（interface）是一种非常强大的抽象机制，它允许开发者定义行为的集合，而不必关心这些行为是如何具体实现的。接口在Go中扮演着核心角色，尤其是在实现多态性和代码解耦方面。以下是对Go中接口设计理念的深入讲解：接口的基本概念在Go中，接口是一组方法签名的集合。一个类型如果实现了某个接口中的所有方法，则称该类型实现了这个接口。值得注意的是，Go中的接口是隐式实现的，这意味着你不需要
Nagios监控系统插件套装：1.4.13版本深入解析 Kiki-2189
本文还有配套的精品资源，点击获取简介：Nagios是一款开源系统监控工具，用于实时监控网络服务、系统状态和IT基础设施，确保IT环境的稳定运行。本文详细解析了"Nagios-plugins-1.4.13.tar.gz"这个插件包，涵盖了Nagios核心功能、插件工作原理、安装配置、常见插件、自定义插件制作、故障报警与通知、性能数据记录以及扩展集成等方面。通过解压、编译安装和配置插件包中的内容，用户
前端 E2E 测试实践：打造稳定 Web 应用的利器！朱公子的Note 编程语言前端端到端E2E测试
在现代Web开发中，端到端（E2E）测试就像为应用程序配备了一面“照妖镜”，它模拟真实用户的操作流程，从用户点击到获得反馈的每一步都进行验证。想象一下，你刚刚完成了一个完美的登录功能，结果用户反馈“点了登录按钮没有反应”——这种“我以为OK其实不行”的问题，正是E2E测试要解决的。E2E测试并不止于前端界面，它涵盖了前端、后端及数据库等所有环节，确保每个节点都能正常工作。历史经验也提醒我们其重要性
taro开发钉钉小程序，打包后真机测试tabbar丢失解决方案，以及在小程序上使用路由守卫 Miong学不会前端小程序 taro 钉钉前端
吐槽一下，最近公司让我搞钉钉小程序，因为公司用的是taro框架，本来这个框架的社区人就比较少，taro开发钉钉小程序的人更少，以致于遇到的bug和坑在网上都找不到解决方案，挺难受的。今天搞定taro编译钉钉小程序真机测试时底部tabbar丢失问题，分享一下解决方案。在taro编译成小程序的时候，在开发工具的模拟器里面，通过配置app.config.ts文件配置tabbar，是可以正常显示的,配置如
《高并发系统性能优化三板斧：缓存 + 异步 + 限流》猕员桃 10篇关于分布式和高并发性能优化缓存
高并发系统性能优化三板斧：缓存+异步+限流引言在互联网应用的高并发场景下，系统性能面临巨大挑战。以某电商平台会员活动为例，活动期间瞬时QPS可达10万+，若未进行有效优化，服务器将迅速崩溃。本文从缓存、异步、限流三个核心维度，结合实际案例详细解析高并发系统的性能优化策略，并分享全链路压测与问题定位的实战经验。一、缓存策略分层：从本地到分布式的立体防护1.1本地缓存选型与实战（Caffeine）本地
OpenCV CUDA模块设备层-----线性插值函数log() 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述该函数用于创建线性插值访问器，支持对GPU内存中的图像数据进行双线性插值采样。主要应用于图像缩放、旋转等几何变换中需要亚像素级精度的场景。为输入图像构造一个基于“双线性插值”的访问器对象LinearInterPtrSz，可以在CUDA核函数中按需访问缩放后的像素值
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户