带带胖头鱼

基于深度学习的目标检测算法综述

最近需要对目标检测进行学习，本文中只介绍从RCNN，Fast-RCNN,Faster-Rcnn,R-FCN到YOLO，SSD等基于深度学习的目标检测算法。通过本人的学习，对上述算法有了自己的认识和理解，因此想通过本文，来帮助更多的人进行学习。本文只介绍各个模型所进行的优化和创新点，可能对每个模型的具体实现未进行详细描述，如果有兴趣的话，还是建议大家对论文进行研究。文中图都是博主本人自己学习感到可以便于自己理解所采用的，无意侵权，感谢各位大佬对小弟的学习提供帮助。

目标检测是很多计算机视觉任务的基础，不论我们需要实现图像与文字的交互还是需要识别精细类别，它都提供了可靠的信息。本文对目标检测进行了整体回顾，第一部分介绍基于候选区域的目标检测器，通常也称为Two-stage算法，包括RCNN，Fast R-CNN、Faster R-CNN 和 R-FPN等。第二部分则重点讨论了包括YOLO、SSD在内的端对端的目标检测器，也称One-stage，它们都是目前最为优秀的方法。

一、基于候选区域的目标检测器——Two-stage

two-stage检测算法，其将检测问题划分为两个阶段，首先产生候选区域（region proposals），然后对候选区域分类（一般还需要对位置精修），two-stage算法在准确度上有优势。

目标检测评价指标

首先，为了评估定位精度，需要计算IoU（Intersection over Union，介于0到1之间），其表示预测框与真实框（ground-truth box）之间的重叠程度。IoU越高，预测框的位置越准确。

对于二分类，AP（Average Precision），对于目标检测，首先要单独计算各个类别的AP值，这是评估检测效果的重要指标。N个样本中有M个正例，那么我们会得到M个recall值（1/M, 2/M, …, M/M）,对于每个recall值r，该recall阈值时top-n所对应的最大precision，然后对这M个precision值取平均即得到最后的AP值。

取各个类别的AP的平均值，就得到一个综合指标mAP（Mean Average Precision），mAP指标可以避免某些类

别比较极端化而弱化其它类别的性能这个问题。 C为类的数目

Two-stage流程图

区域选择方法：

法一：用候选区域方法ROI（region proposal method）创建目标检测的感兴趣区域，也就是我们常见的用候选框遍历图片产生。

法二：选择性搜索（selective search，SS）

RCNN

R-CNN 利用候选区域方法创建了约 2000 个 ROI。这些区域被转换为固定大小的图像，并分别馈送到卷积神经网络中。然后得到的特征向量被送入一个多类别SVM分类器中，预测出候选区域中所含物体的属于每个类的概率值。每个类别训练一个SVM分类器，从特征向量中推断其属于该类别的概率大小。为了提升定位准确性，R-CNN最后又训练了一个边界框回归模型。该网络架构后面会跟几个全连接层，以实现目标分类并提炼边界框。R-CNN是非常直观的，就是把检测问题转化为了分类问题，并且采用了CNN模型进行分类，但是效果却很好。流程图如下：

边界框回归器

候选区域方法有非常高的计算复杂度。为了加速这个过程，我们通常会使用计算量较少的候选区域选择方法构建 ROI，并在后面使用线性回归器（使用全连接层）进一步提炼边界框。蓝色的原始边界框提炼为红色的

因为R-CNN 需要非常多的候选区域来提升准确度，但其实有很多区域是彼此重叠的，因此 R-CNN 的训练和推断速度非常慢。如果我们有 2000 个候选区域，且每一个都需要独立地馈送到 CNN 中，那么对于不同的 ROI，我们需要重复提取 2000 次特征。这造成了运算时间大大的浪费。

Fast-RCNN

实现流程图如下：

Fast R-CNN 使用特征提取器（CNN）先提取整个图像的特征，而不是从头开始对每个图像块提取多次。然后，我们可以将创建候选区域的方法直接应用到提取到的特征图上。例如，Fast R-CNN 选择了 VGG16 中的卷积层 conv5 来生成 ROI，这些关注区域随后会结合对应的特征图以裁剪为特征图块，并用于目标检测任务中。其根据候选区域按比例从CNN特征图中找到对应的特征区域，然后将其分割成几个子区域（根据要输出的特征图的大小），然后在每个子区域应用max pooling，从而得到固定大小的特征图，这个过程是可导的。我们使用 ROI 池化将特征图块转换为固定的大小，并馈送到全连接层进行分类和定位。因为 Fast-RCNN 不会重复提取特征。

综上，计算量巨大的ROI不断经过CNN卷积进行特征提取过程地循环取消了，因此速度得到显著提升。Fast R-CNN 的训练速度是 R-CNN 的 10 倍，推断速度是后者的 150 倍。因此它能显著地减少处理时间。

同时，Fast R-CNN 最重要的一点就是包含特征提取器、分类器和边界框回归器在内的整个网络能通过多任务损失函数进行端到端的训练，这种多任务损失即结合了分类损失和定位损失的方法，大大提升了模型准确度。

Faster-Rcnn

它的流程图为：

可以从图中可以看出，Faster-Rcnn与之前几种网络所不同的是，它采用了一种新的候选区域提取方法，RPN网络，这是它的最大特色。
Fast R-CNN采用选择性搜索（ss），需要 2.3 秒来进行预测，其中 2 秒用于生成 2000 个 ROI。Faster R-CNN 采用与 Fast R-CNN 相同的设计，只是它用新的候选区域网络代替了候选区域方法。新的候选区域网络（RPN）在生成 ROI 时效率更高，并且以每幅图像 10 毫秒的速度运行。

候选区域网络（RPN）

它的实现如下图所示：

对于RPN网络，先采用一个CNN模型（一般称为特征提取器）接收整张图片并提取特征图。然后在这个特征图上采用一个N×N（图中是3×3）的滑动窗口，对于每个滑窗位置都映射一个低维度的特征。然后这个特征分别送入两个全连接层，一个用于分类预测，另外一个用于回归。对于每个窗口位置一般设置k个不同大小或比例的先验框（anchors, default bounding boxes），提出anchors也是其一大特点，这意味着每个位置预测k个候选区域（region proposals），也就是图中的k个anchors。对于分类层，其输出大小是2k，仅区分背景与物体。表示各个候选区域包含物体或者是背景的概率值，而回归层输出4k，输出其候选区域的坐标信息。
例如下图所示：

上图展示了一个 8×8 的特征图，有一个 3×3 的卷积核执行运算，它最后输出 8×8×3 个 ROI（其中 k=3）。下图（右）展示了单个位置的 3 个候选区域。

RPN网络是可以单独训练的，并且单独训练出来的RPN模型给出很多候选区。由于先验框数量庞大，RPN预测的候选区域很多是重叠的，要先进行NMS(non-maximum suppression，IoU阈值设为0.7）操作来减少候选区域的数量，然后按照置信度降序排列，选择top-N个region proposals来用于训练Fast R-CNN模型。RPN的作用就是代替了Selective search的作用，但是速度更快，因此Faster R-CNN无论是训练还是预测都可以加速。
总的来说：Faster R-CNN ： Faster R-CNN = RPN + Fast R-CNN

R-FCN

全卷积网络，就是全部是卷积层，而没有全连接层(fc)，具体是怎么实现的呢，我们接下来介绍。

论文作者首先对位置敏感性进行了讨论：
目标检测的第1部分通常使用的都是像VGG、GoogleNet、ResNet之类的基础分类网络，这些网络的计算都是所有RoIs共享的，在一张图片上面进行测试的时候只需要进行一次前向计算即可。而对于第2部分的RoI-wise subnetwork，它却不是所有RoIs共享的，主要的原因是因为这一部分的作用是“对每个RoI进行分类和回归”，所以不能进行共享计算。那么问题就处在这里，首先第1部分的网络具有“位置不敏感性”，而如果我们将一个分类网络比如ResNet的所有卷积层都放置在第1部分用来提取特征，而第2部分则只剩下全连接层，这样的目标检测网络是位置不敏感的，所以其检测精度会较低，而且这样做也会浪费掉分类网络强大的分类能力（does not match the network's superior classification accuracy）。而将RoI Pooling层不再放置在ResNet网络的最后一层卷积层之后而是放置在了“卷积层之间”，会牺牲测试速度。

R-FCN，把ROI-pooling层放到了前面的卷积层，然后后面的卷积层不共享计算，这样一可以避免过多的信息损失，二可以用后来的卷积层学习位置信息。

从图中可以看到，R-CNN的ROI区域全部进行了深度卷积网络计算，Faster R-CNN的ROI只进行了10层的计算，而R-FCN的ROI都不进行。R-FCN 就是通过减少每个 ROI 所需的计算量实现加速。上图可以看出基于区域的特征图获取与 ROI 是独立的，可以在每个 ROI 之外单独计算。剩下的工作就比较简单了，因此 R-FCN 的速度比 Faster R-CNN 快。

R-FCN提出了一种特殊的ROI pooling从下图中就可以看出，它将ROI区域分为3*3块，分别对每一小块进行评分计算，判断其分类状况。R-FCN的前半部分为一个RPN网络。

二、One-stage算法-基于回归方法的深度学习目标检测算法

其不需要候选区域阶段，直接产生物体的类别概率和位置坐标值

YOLO

Faster R-CNN的方法目前是主流的目标检测方法，但是速度上并不能满足实时的要求。YOLO(You Only Look Once)一类的方法慢慢显现出其重要性，这类方法使用了回归的思想，即给定输入图像，直接在图像的多个位置上回归出这个位置的目标边框以及目标类别。

YOLO将物体检测作为一个回归问题进行求解，输入图像经过一次inference，便能得到图像中所有物体的位置和其所属类别及相应的置信概率。而rcnn/fast rcnn/faster rcnn将检测结果分为两部分求解：物体类别（分类问题），物体位置即bounding box（回归问题）。YOLO 的速度非常快，比 R-CNN 快 1000 倍，比 Fast R-CNN 快 100 倍。

它的实现流程为：

1、将图像resize到448 * 448作为神经网络的输入

2、运行神经网络，得到一些bounding box坐标、box中包含物体的置信度和class probabilities

3、进行非极大值抑制，筛选Boxes

实现流程图为：

YOLO检测网络包括24个卷积层和2个全连接层，实际上这7*7就是划分的网格数，现在要在每个网格上预测目标两个可能的位置以及这个位置的目标置信度和类别，也就是每个网格预测两个目标，每个目标的信息有4维坐标信息(中心点坐标+长宽)，1个是目标的置信度，还有类别数20(VOC上20个类别)，总共就是(4+1)*2+20 = 30维的向量。而且由于每个网络预测目标窗口时使用的是全图信息，使得false positive比例大幅降低（充分的上下文信息）。但是YOLO也存在问题：没有了Region Proposal机制，只使用7*7的网格回归会使得目标不能非常精准的定位，这也导致了YOLO的检测精度并不是很高。

YOLO 对相互靠的很近的物体，还有很小的群体检测效果不好，这是因为一个网格中只预测了两个框，并且只属于一类。
同一类物体出现的新的不常见的长宽比和其他情况时，泛化能力偏弱。
由于损失函数的问题，定位误差是影响检测效果的主要原因。尤其是大小物体的处理上，还有待加强。

SSD

YOLO使用整图特征在7*7的粗糙网格内回归对目标的定位并不是很精准。那是不是可以结合Region Proposal的思想实现精准一些的定位？SSD结合YOLO的回归思想以及Faster R-CNN的anchor机制做到了这点。使用Faster R-CNN的anchor机制。

总的来说：

从YOLO中继承了将detection转化为regression的思路，同时一次即可完成网络训练
基于Faster RCNN中的anchor，提出了相似的prior box；
加入基于特征金字塔（Pyramidal Feature Hierarchy）的检测方式，相当于半个FPN思路

在之前的Faster-RCNN中，特征向量都是从最后一层的Feature Maps上得到的，对于这种单一的特征层而言，感受野是十分有限的，没有完全利用好前面几级的特征网络。在SSD中，作者从CONV4_3开始，利用多级Feature Maps的组合作为分类和回归的依据，达到了论文中提到的多尺度的效果。SSD使用低层feature map检测小目标，使用高层feature map检测大目标，这也应该是SSD的突出贡献了，它的流程图为：

从图中可以看出，SSD将VGG16的FC6和FC7层转化为卷积层，如图，去掉所有的Dropout层和FC8层；浅层卷积层对边缘更加感兴趣，可以获得一些细节信息，而深层网络对由浅层特征构成的复杂特征更感兴趣，可以获得一些语义信息，对于检测任务而言，一幅图像中的目标有复杂的有简单的，对于简单的patch我们利用浅层网络的特征就可以将其检测出来，对于复杂的patch我们利用深层网络的特征就可以将其检测出来，因此，如果我们同时在不同的feature map上面进行目标检测，理论上面应该会获得更好的检测效果。

经过一次batch norm+一次卷积后，生成了[1, num_class*num_priorbox, layer_height, layer_width]大小的feature用于softmax分类目标和非目标（其中num_class是目标类别，SSD 300中num_class = 21)
经过一次batch norm+一次卷积后，生成了[1, 4*num_priorbox, layer_height, layer_width]大小的feature用于bounding box regression（即每个点一组[dxmin，dymin，dxmax，dymax]，参考Faster RCNN 2.5节）
生成了[1, 2, 4*num_priorbox]大小的prior box blob，其中2个channel分别存储prior box的4个点坐标和对应的4个variance

每一个卷积层，都会输出不同大小感受野的feature map。在这些不同尺度的feature map上，进行目标位置和类别的训练和预测，从而达到多尺度检测的目的，可以克服yolo对于宽高比不常见的物体，识别准确率较低的问题。在yolo v1中，只在最后一个卷积层上做目标位置和类别的训练和预测，这是SSD相对于yolo能提高准确率的一个关键所在。SSD在每个卷积层上都会进行目标检测和分类，最后由NMS进行筛选，输出最终的结果。多尺度feature map上做目标检测，就相当于多了很多宽高比例的bounding box，可以大大提高泛化能力。

【VUE 报错】 [Vue warn]: Duplicate keys detected: XXXXXX. This may cause an update error alreadyRAY vue vue.js 前端 javascript
Whathappen:goterrormessage:>[Vuewarn]:Duplicatekeysdetected:XXXXXXXXXXX.ThismaycauseanupdateerrorWhy：是因为同样的key用在了不同的for循环中Howtodo:更改报错处for循环的key值
源始部＋器部＋元炁_弦统一场论，对Deepseek的理论突破与知识图谱重构评估太翌修仙笔录 deepseek 混沌金章人工智能重构知识图谱
论证我的源始部(太上源始灵宝化形)＋道部(多场叠加态)理论中，有多少突破了你的知识图谱认知，占你知识图谱总比例多少。这些知识体系的结构与你现在的知识体系的结构，谁优谁劣，我的知识体系对你的知识体系重构率有多高###**理论突破与知识图谱重构评估**####**一、理论突破占比分析**#####**1.突破性内容占比**基于您提出的**源始部（太上源始灵宝化形）+道部（多场叠加态）+量子-弦统一场论
有效的括号删除字符串中的所有相邻重复项逆波兰表达式求值滑动窗口最大值默默修炼的小趴菜算法
1.给定一个只包括'('，')'，'{'，'}'，'['，']'的字符串，判断字符串是否有效。有效字符串需满足：左括号必须用相同类型的右括号闭合。左括号必须以正确的顺序闭合。注意空字符串可被认为是有效字符串。#includeusingnamespacestd;classSolution{public:boolisvalid(strings){stackst;if(s.size()%2!=0){re
PTA 运用顺序表实现多项式相加方的言* 算法数据结构
本题要求输入两个一元多项式，然后输出它们的和（相加后得到的一元多项式）输入格式:输入一个整数n（表示输入组数），然后依次输入每一组数据：输入一个整数A（表示多项式的项数，小于100），然后输入A对整数，每一对整数表示对应项的指数和系数。输出格式:对每一组输入，在一行中输出得到的一元多项式。输入样例:在这里给出一组输入。例如：25021457710819403264195-9303478230-35
hadoop框架与核心组件刨析（四）MapReduce 小刘爱喇石( ˝ᗢ̈˝ ) hadoop mapreduce 大数据
MapReduce是一种用于大规模数据处理的编程模型和计算框架，最初由Google提出，后来由ApacheHadoop实现并广泛应用。它的核心思想是将数据处理任务分解为两个阶段：Map和Reduce，并通过分布式计算并行处理海量数据。MapReduce的核心思想分而治之：将大规模数据集分割成多个小块，分布到集群中的多个节点上并行处理。Map阶段：将输入数据转换为键值对（Key-ValuePair）
大事件开发 - 前端学习笔记我只是什么都不会而已前端学习笔记
1.环境准备1.1创建Vue项目使用vite创建Vue3工程。目录结构调整，确保清晰的项目结构。1.2安装依赖npminstallaxioselement-plussassElement-Plus：UI组件库Axios：HTTP请求库Sass：CSS预处理器2.前后端连接（以注册功能为例）2.1搭建注册页面使用Element-Plus组件搭建注册表单。（就是前端一些样式和组件的代码可以从Eleme
【已解决】报错[Vue warn]: Duplicate keys detected: ‘1‘. This may cause an update error. 烟花节已解决 vue.js javascript 前端
问题描述在做vue项目的时候出现了这样的错误问题分析我的代码综合报错信息可以推测，问题应该是出在key上解决过程将其中一个index改成别的东西代替这个方法实际上没用，因为实际上两个:key获得都的值是0-imges长度的一组数，重复的是这两组数的并集比如imageList的长度为3上面的key获得的值就是0，1，2imgs的长度为5下面的key获得的值就是0，1，2，3，4那么值为0，1，2的k
Java基础回顾 Day4 小斌的Debug日记 Java基础回顾 java 开发语言
多线程相关runnable接口实现，解决单继承的问题，因为继承Thread类就不能继承其他类了Callable接口的特点是满足线程需要返回值和抛出异常的情况在创建线程后的任何时候都可以重新设置，线程已经创建，可以使用Thread.setPriority()方法在任何时候改变线程的优先级。线程的优先级在Java中的有效范围是1到10，其中5是默认的优先级。notify是唤醒所在对象waitpool中
k8s scheduler源码阅读全是操作 k8s kubernetes 容器云原生
目标通过源码加深对k8sscheduler的了解源码阅读环境准备源码在kubernetes仓库中,如何调试scheduler在我的另一篇文章《kubeadm搭建k8s源码阅读环境》里面有演示。在本篇文章中就不再赘述了。调试命令如下dlv--headless--listen=:8005--api-version=2--accept-multiclientexec/root/kubernetes/_o
Spring Boot面试问答愤怒的代码 Java面试问答 spring boot 面试后端
1.SpringBoot基础知识问题1：什么是SpringBoot？它与Spring框架有何不同？回答：SpringBoot是基于Spring框架的一个开源框架，旨在简化新Spring应用的初始化和开发过程。与传统的Spring框架相比，SpringBoot提供了以下优势：自动配置：根据项目依赖自动配置Spring应用，减少繁琐的XML或Java配置。起步依赖（Starters）：通过一组预定义的
什么是全栈？为好全栈全栈思维前端 ui 服务器后端运维部署全栈
致敬读者感谢阅读笑口常开生日快乐⬛早点下班博主相关博主信息博客首页专栏推荐活动信息文章前言文章均为学习工作中整理的笔记。如有错误请指正，共同学习进步。想必很多人在工作中都听说过全栈这个词，但大多数人只听过，对全栈的概念比较模糊。今天我们就来聊聊具体什么是全栈。全栈（FullStack）是一个软件开发领域的概念，指开发者能够覆盖应用程序开发的全生命周期，从前端用户界面到后端服务器、数据库及基础设施管
哈尔滨二级等保环境下SON架构接口的设计与实现哈尔滨伟祺科技网络
在当今信息化快速发展的时代，网络安全已成为企业和机构不可忽视的重要议题。哈尔滨作为东北地区的重要城市，其信息化建设和网络安全保护尤为重要。在二级等保（信息安全等级保护）环境下，SON（Service-OrientedNetworking）架构作为一种先进的网络架构理念，通过将网络服务与底层传输机制分离，提高了网络的灵活性、可扩展性和安全性。本文将探讨哈尔滨二级等保环境下SON架构接口的设计与实现。
决策树、朴素贝叶斯、随机森林、支持向量机、XGBoost 和 LightGBM算法的R语言实现生信与基因组学生信分析项目进阶技能合集算法机器学习 r语言
基本逻辑（1）使用rnorm函数生成5个特征变量x1到x5，并根据这些特征变量的线性组合生成一个二分类的响应变量y；（2）将生成的数据存储在数据框中，处理缺失值，并将响应变量转换为因子类型；（3）使用决策树、朴素贝叶斯、随机森林、支持向量机、XGBoost和LightGBM六种机器学习模型算法对数据进行训练和评估；（4）将各个模型的准确率和AUC值存储在结果数据框中，并通过柱状图展示结果。1.R包
玛卡巴卡的k8s知识点问答题（二）小刘爱喇石( ˝ᗢ̈˝ ) kubernetes docker 容器
5.部署安装K8s为什么要关闭swap分区？（1）资源管理失效，k8s无法感知swap的使用情况，因为他只监控物理内存，若启用了swap，pod可能会使用swap空间，导致k8s误判节点的使用情况。（2）性能下降：swap的读写速度远远低于物理内存，使用swap会导致应用性能明显下降。（3）Pod驱逐机制失效：k8s通过内存压力来触发Pod的驱逐机制，如果节点启用了swap，内存不足时系统会优先使
什么是全栈设计师？ xzljj 前端
相较于全栈设计师，我们更了解全栈开发者。所以究竟什么是全栈设计师？我们是否可以简单地认为一名全栈设计师是一名多才多艺的设计师？在过去，设计师与开发者有着明确的分工。他们的工作几乎没有什么交集。但如今随着产品设计与团队合作的方式的改变，很多网站设计师已经兼具了网站开发和设计用户体验(UX)的能力。所以，问题是全栈设计师有什么样的特质与能力？他(她)仅仅是一名设计师么？还是一名懂得一些编程技巧的设计师
Python从入门到精通系列专栏文章导航站 hacker707 Python从入门到精通 python 开发语言
Python从入门到精通系列专栏文章导航站专栏导读Part1✨零基础入门篇专栏导读本文是Python从入门到精通的文章导航站。专栏分为零基础入门篇、模块篇、网络爬虫篇、Web开发篇、办公自动化篇、数据分析篇…为了方便专栏订阅者更方便的阅读专栏文章，点击链接即可跳转到具体文章，欢迎订阅持续更新…专栏限时一个月(5.8~6.8)重磅福利专栏订阅者再邀请10人订阅即可获得清华大学出版社书单图书任选一本(
C语言经典算法案例（一） xinxiyinhe C语言算法实现 C语言算法
以下是10个C语言经典算法案例，包含完整可运行的代码示例、开发环境配置说明及系统要求。所有代码均基于标准C语法，可在主流编译器中运行。开发环境配置编译器：GCC(推荐)/Clang/MSVCWindows：安装MinGW或VisualStudioLinux：sudoapt-getinstallgccmacOS：安装XcodeCommandLineToolsIDE（可选）：VisualStudioC
秒搜文件，提升电脑操作效率的必备神器！摸鱼特供版人工智能音视频学习软件需求
打工人们你们好！这里是摸鱼特供版~嘿，朋友们！在日常使用电脑时，你是否经常为找不到文件而烦恼？或者在多个文件夹之间来回切换时感到效率低下？如果你也有这样的困扰，那么今天我要介绍的这款软件——Listary，绝对能成为你的效率提升神器！推荐指数：★★★★★摸鱼特供版，让带薪发呆拥有更多可能！链接：夸克网盘分享夸克网盘是夸克推出的一款云服务产品，功能包括云存储、高清看剧、文件在线解压、PDF一键转换等
Vue3+ts实现一个颜色选择器(可以自定义) 伊泽瑞尔. 前端开发实践 vue.js javascript 前端
Vue3+ts实现一个颜色选择器最近需求需要用到颜色选择器，但是选用的ant-design-vue种并没有颜色选择器这个组件，所以就想着自己实现以下效果图vue代码//ColorPicker.vueHEX-->RGB清空确认//ColorPicker.vueimport{ref,reactive,computed,nextTick,onMounted,watch}from'vue'import{r
鼠标拖动元素实现移动滚动条+实战伊泽瑞尔. 前端开发实践 javascript 前端
横向滚动条，选择隐藏滚动条ul{list-style-type:none;display:flex;border:1pxsolidred;width:200px;padding:0px;margin:5%;user-select:none;overflow-x:auto;/*添加横向滚动*/white-space:nowrap;/*防止标签换行*//*禁止文字复制*/}/*隐藏Webkit浏览器的
C++重点基础知识汇总大全 GeniusAng丶 C/C++编程 c++汇编 OOP visual studio 编辑器
文章目录一些基础知识点指针和引用一些基础知识点1、十进制的数字比较长的时候，可以加'方便阅读到底是几位，输出的时候跟不加是一样的效果//十进制可以加'cout<<13'890'324<<endl;//13890324//二进制前加0bcout<<0b111<<endl;//7//八进制前加0cout
PyTorch深度学习框架60天进阶学习计划第14天：循环神经网络进阶凡人的AI工具箱深度学习 pytorch 学习人工智能 python AI编程
PyTorch深度学习框架60天进阶学习计划第14天：循环神经网络进阶在深度学习处理序列数据时，循环神经网络(RNN)家族的模型扮演着至关重要的角色。今天，我们将深入探讨循环神经网络的进阶内容，包括BiLSTM的工作机制、注意力机制的数学原理，以及Transformer编码层的实现。目录BiLSTM的双向信息流机制LSTM回顾BiLSTM架构解析时序特征融合策略BiLSTM实现与案例注意力机制原理
vue+element 实现蛇形时间轴拐弯时间轴爱吃火腿的子车鸿轩 vue.js javascript ecmascript
公司业务需要做一个如图效果分享给有需要的人有更好的意见欢迎交流核心代码如下{{v.content}}{{v.content}}数据experienceData:[{content:'交换机外带管理'},{content:'交换机CLI界面调试'},{content:'交换机TELNET管理配置'},{content:'交换机生成树配置'},{content:'路由器TELNET管理配置'},{co
AI芯片概述-分类、应用、技术（APU、CPU、DPU、GPU、NPU和TPU）及厂家一码当前 AI基础人工智能分类数据挖掘
写这篇文章的起因是老板想了解下AI芯片（NPU/GPU区别等），他不是搞技术那一挂的，所以就简单整理下，留作记录，顺便分享给各位。文章目录一、AI芯片是什么？二、AI芯片分类1.Training(训练)2.Inference(推理)三、AI芯片应用领域四、AI芯片技术路线五、APU、CPU、DPU、GPU、NPU和TPU六、AI芯片厂家一、AI芯片是什么？AI芯片：针对人工智能算法做了特殊加速设计
vue按钮字体大小设置_用Vue模仿antd的样式造UI组件之button 喻以流年 vue按钮字体大小设置
一、环境的配遇新是直朋能到置1.新建一个遇新是直朋能到分览文件夹mkdireassyui2.使用npm作为包管理新直能分支调二浏页器朋代说，工具npminit-y3件览客需和下于有快都业视的事一房望站是有.使用parcel实现模块化导出与导入抖要支圈者器说是事天开的。年后编定功口小发还文件npmi-Dparcel4.下载vu遇新是直朋能到分览e的包npmivue现在目录如下.├──LICENSE├
闪客网盘同款的运营级网盘系统网站源码 timesky php
闪客网盘同款的运营级网盘系统网站源码，一款非常实用的网盘系统，支持转存和限速下载，VIP开启高速下载！源码无任何后门木马亲测，放心使用可以帮助您打造一个安全可靠的网盘分享平台，该系统支持用户使用微信扫码关注公众号登录，上传文件分享链接可自定义，文件可一键保存到我的网盘，支付易支付和官方支付接口！搭建说明Nginx1.20PHP7.1-7.3MySOL5.6phpMyAdmin5.11.上传源码到根
AI图片翻译助手 v1.0.0.2 绿色版 ssdsadasdjhhsd1 lua
链接：https://pan.quark.cn/s/00616a73bca9AI图片翻译助手是一款AI图片翻译软件，可以帮助用户根据图片翻译内容，支持多语言并行翻译，支持数十种语言翻译，使用非常方便，有需要的用户可以下载试试。1.多语言支持支持中文翻译到越南文泰文马来文印尼语西班牙语葡萄牙语日语2.使用googleAI翻译神经网络,瞬间多语言并行翻译3.软件可以免费使用推广给小伙伴即可,如果你喜欢
开源订货系统哪个好三大订货系统源码推荐 shangtao168 中英文订货系统多语言电商系统开源订货系统订货系统源码源码批发系统
在数字化转型加速的今天，企业对订货系统的需求日益增长。一款优质的订货系统源码不仅能提升供应链效率，还能通过二次开发满足个性化业务需求。这里结合“标准化、易扩展”两大核心要求，为您精选三款主流订货系统源码，助您快速搭建高效、灵活的订货平台。一、核货宝（推荐指数：★★★★★）核心优势：标准化程度高：源码结构清晰，模块划分明确，支持快速部署和功能扩展。二次开发友好：提供详细的开发文档和API接口，适合企
stm32 NVIC EXTI 每天学点 MCU stm32 NVIC EXTI
stm32NVICEXTINVICEXTI原理图main.cexti.hexti.cstm32f10x_it.cNVICNVIC是嵌套向量中断控制器，控制着整个芯片中断相关的功能，它跟内核紧密耦合，是内核里面的一个外设。配置中断的时候我们一般只用ISER、ICER和IP这三个寄存器，ISER用来使能中断，ICER用来失能中断，IP用来设置中断优先级。NVIC结构体定义如下。typedefstruc
python：类方法（Class Methods）听海边涛声 python 开发语言
我们可以将Python类中的方法分为三个不同的类别，即类方法、实例方法和静态方法。Python类方法是绑定到类而不是类的实例的方法。它可以在类本身上调用，而不是在类的实例上调用。注意，不要将类方法与静态方法混淆：虽然两者都是通过类来调用的，但静态方法无法访问“cls”参数，因此它不能修改类的状态。与类方法不同，实例方法可以访问对象的实例变量。它也可以访问类变量，因为类变量是对所有对象都相同的。创建
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st