Hejie Cui

faster rcnn准确率_目标检测方法以及Faster-RCNN学习

最近在进行视频行人检测优化的课题，需要进行相关领域的技术和背景调研，完成开题同时，了解相关技术，为后面的队伍的proposal和项目做准备，技术调研报告如下：

一、目标检测发展

1、概述

faster rcnn准确率_目标检测方法以及Faster-RCNN学习_第1张图片

Faster-RCNN相关技术发展简图

所谓目标检测，实则是从属于计算机视觉中的一项任务。它的目标是定位出图像中的物体，并且给出其具体类别。在自动驾驶车辆，智能监控中，目标检测的意义十分重大。而作为评判一个目标检测系统的标准，我们有三个重要的指标。

第一，IOU，也即判别预测的方框和真实的方框有多接近的一个指标。

第二，是 mAP(mean Average Presion)，在多个类别的检测中，每一个类别都可以调整阈值，算出召回率从0到1时的准确率（同一召回率取最高的准确率），计算准确率的平均值，而后再对于所有类求平均得到 mAP。这个值介于0到1之间，且越大越好。

第三，是 fps，用于评判系统速度有多快。

目标检测算法的目标即为：定位更准、速度更快、分类更精确。有了这些指标，还需要有数据集来对算法进行评估。这里介绍一下两类最常用的通用数据集：

1、PASCAL VOC 数据集。这个数据集中有20个类别，如person，bird，cat，bicycle等。

2、微软的 COCO 数据集，这个数据集中一共有80个类别，面向于室内，室外。

它们大多面向于这类生活中的场景。在目标检测的特定领域应用中，也有特定的数据集。如，加州理工行人检测数据集，KITTI 自动驾驶算法数据集，可以看到它们的场景都是用车辆在实际的路口中拍摄的。

faster rcnn准确率_目标检测方法以及Faster-RCNN学习_第2张图片

左为加州理工行人数据集，右为KITTI

丰富而巨大的数据集极大地推动了目标检测领域的发展。与之对应的，还有不停提升的计算力和算法的更新。随着 2012 年 AlexNet 卷积神经网络赢得 ImageNet 分类赛的冠军，应用了深度学习的计算机视觉取得了一系列重大突破，其中最亮眼之一目标检测领域，一系列优秀的框架被提出，不少已经投入商用。

从图像识别的任务本质上就是两个问题：一：图像识别，二：定位。整个的目标检测框架也分为两大类。第一是 two-stage 两步走的框架，先进行区域推荐，再进行目标分类；另一个是 one-stage 端到端的框架，应用一个网络把所有事情都做了，一步输出结果。除此之外，还有free anchor，联级分类等。

faster rcnn准确率_目标检测方法以及Faster-RCNN学习_第3张图片

目标检测框架的两种分类

2、one_stage框架

2014 年 R-CNN 框架的提出是最早将卷积网络应用到目标检测上的方法之一。R-CNN 首先利用选择性搜索这类图像分割的算法进行区域推荐，而后将这些区域分别裁剪下来，缩放送入卷积网络，来做判定。在 VOC 数据集上，它一下就提升了 20% 多的 mAP。但是这样就会造成速度慢，因为给出的推荐区域通常有 2000 多个。

faster rcnn准确率_目标检测方法以及Faster-RCNN学习_第4张图片

RCNN相关技术发展图示

其基础上改进的 Fast R-CNN 通过在卷积层的最后一层添加一个区域池化层，使得推荐区域能够直接映射到这里来提取特征，减少了数千次重复的卷积运算，大大提升了速度。但它的区域推荐方法还是使用的选择性搜索，不能和 CNN 共享计算，速度瓶颈仍然存在。而 Faster R-CNN 则推出了区域建议网络 RPN，将这一步也用 CNN 来做，并且让区域建议网络和分类网络共享卷积特征，使得目标检测框架几乎达到实时，并且 mAP 达到了极高。还有2018年的mask R_CNN，把原有的Faster-RCNN进行扩展，添加一个分支（FPN）使用现有的检测对目标进行并行预测，可以有效地目标检测的同时完成了高质量的语义分割，但是速度较慢，在现实应用方面还需要优化。

2、one_stage框架

faster rcnn准确率_目标检测方法以及Faster-RCNN学习_第5张图片

两种one_stage目标检测方法

在YOLO中，它将图像分成 S*S 个单元，每个单元分别去预测方框，利用网络对这些方框直接去学习真实方框和所属类别。YOLO 非常快，小型的模型可以达到 155 fps ，但是随之而来的是 mAP 的降低，以及定位不准的问题。而 SSD 则有点像 Faster R-CNN 中的多类别 RPN 网络，是一个十分成功的检测框架。它采用特征金字塔的多层预测方法，在不同的卷积层上设置前景方框，在不同大小的特征图上考虑不同的尺度，相当于每个层分开预测，最后一起得到结果。

二、faster-RCNN形成相关学习

1、基于候选窗和深度学习的目标检测方法发展，即one-stage

RCNN

(1).在图像中确定约1000-2000个候选框 (使用选择性搜索Selective Search)

(2).每个候选框内图像块缩放至相同大小，并输入到CNN内进行特征提取

(3).对候选框中提取出的特征，使用分类器判别是否属于一个特定类

(4).对于属于某一类别的候选框，用回归器进一步调整其位置

许多候选框（如两千个）-->CNN-->得到每个候选框的特征-->分类+回归

Fast R-CNN

(1).在图像中确定约1000-2000个候选框 (使用选择性搜索)

(2).对整张图片输进CNN，得到feature map

(3).找到每个候选框在feature map上的映射patch，将此patch作为每个候选框的卷积特征输入到SPP layer和之后的层

(4).对候选框中提取出的特征，使用分类器判别是否属于一个特定类

(5).对于属于某一类别的候选框，用回归器进一步调整其位置

一张完整图片-->CNN-->得到每张候选框的特征-->分类+回归

Faster R-CNN

(1).对整张图片输进CNN，得到feature map

(2).卷积特征输入到RPN，得到候选框的特征信息

(3).对候选框中提取出的特征，使用分类器判别是否属于一个特定类

(4).对于属于某一类别的候选框，用回归器进一步调整其位置

一张完整图片-->CNN-->RPN-->得到候选框的特征-->分类+回归

Mask R-CNN

(1).对整张图片输进CNN，得到feature map

(2).卷积特征输入到RPN，得到候选框的特征信息

(3).对候选框中提取出的特征(通过ROI)，使用分类器判别是否属于一个特定类，进一步调整候选框位置。

（4）与第（3）步同时进行，利用FPN，输出物体掩膜(object mask)，完成语义分割。

2、算法比较

Faster-RCNN通过交叉训练方式，共享卷积特征，从而大幅缩减了训练参数，除了CNN网络架构本身具有的权值共享，通过交替训练两个类型的网络达到cost free。

首先，Fast-RCNN:与典型的RCNN不同的是，典型的RCNN使用Selective Search;而Fast-RCNN使用EdgeBoxes。直接取得性能上的优势,论文给出的数据是,Selective Search:2 seconds per image,而使用EdgeBoxes是0.2 seconds per image,也就是Fast-RCNN提高了十倍的速度。

然后，Faster-RCNN( 可以看做是对 Fast-RCNN 的再次改进版):主要解决的是如何在RPN网络中快速获得 proposal,卷积后的特征图其实是可以用来生成 region proposals 。所以,作者通过增加两个独立平行的全连接层来实现 Region Proposal Networks (RPN) , 一个用来以回归方式生成推荐区域(region bounds)，另一个则是objectness score。为了面对平移(缩放)不变性,经典做法有:对输入图片或者卷积网络里的滤波器进行整体尺度矩形长宽比例的采样;而作者的做法是:对推荐区域(novel “anchor” boxes)进行尺度矩形比例的采样.结果是,对推荐区域采样的模型,不管是速度还是准确率都取得很好的性能.

最后,为了将fully-convolutional network (FCN)的RPN 与 Fast-RCNN 相结合，用一种简单的训练方法：固定 proposals数目，为训练RPN和Fast-RCNN, 这两个训练的task交替微调网络 ,交替过程实现卷积特征共享。因此不需要重复的卷积计算, 共享卷积特征也让两个网络快速地收敛,所以,大幅地提高了网络的训练和测试(应用)速度。

三、faster-RCNN过程结构分析学习

从上面的过程总结可以看出faster-RCNN的优势在于在候选框的生成方面使用RPN(Region Proposal Networks)代替Selective Search算法。有了一个大致了解后，再根据下图，我们可以将其过程分成几个部分：

(1)、特征提取(CNN)：用一串卷积和池化从原图中提取出feature map；

(2)、RPN网络：通过网络训练的方式从feature map中获取多个候选框的大致位置；

(3)、ROI Pooling部分：利用前面获取到的精确位置，从feature map中抠出要用于分类的目标，并pooling成固定长度的数据(将不同大小的输入转换为固定大小的输出);

(4)、分类和回归：这一层的输出是最终目的，输出候选区域所属的类，候选区域在图像中的精确位置。

faster rcnn准确率_目标检测方法以及Faster-RCNN学习_第6张图片

Faster R-CNN大体结构

faster rcnn准确率_目标检测方法以及Faster-RCNN学习_第7张图片

Faster R-CNN详细结构

下面主要分析RPN网络部分和ROI pooling部分

1、 Region Proposal Networks(RPN)

faster rcnn准确率_目标检测方法以及Faster-RCNN学习_第8张图片

RPN网络结构

上图展示了RPN网络的具体结构。可以看到RPN网络实际分为2条线，上面一条通过softmax分类anchors获得positive和negative分类，下面一条用于计算对于anchors的bounding box regression偏移量，以获得精确的proposal。而最后的Proposal层则负责综合positive anchors和对应bounding box regression偏移量获取proposals，同时剔除太小和超出边界的proposals。其实整个网络到了Proposal Layer这里，就完成了相当于目标定位的功能。

1.1、Anchor

在RPN中，作者提出了anchor。Anchor是大小和尺寸固定的候选框。论文中用到的anchor有三种尺寸和三种比例，如下图所示，三种尺寸分别是小（蓝128）中（红256）大（绿512），三个比例分别是1:1，1:2，2:1。3×3的组合总共有9种anchor。

faster rcnn准确率_目标检测方法以及Faster-RCNN学习_第9张图片

各种形式anchor

然后用这9种anchor在特征图（feature）左右上下移动，每一个特征图上的点都有9个anchor，最终生成了 (H/16)× (W/16)×9个anchor. 对于一个512×62×37的feature map，有 62×37×9~ 20000个anchor。也就是对一张图片，有20000个左右的anchor，基本是cover了800x600的各个尺度和形状。

1.2、训练RPN

RPN的总体架构如下图所示：

faster rcnn准确率_目标检测方法以及Faster-RCNN学习_第10张图片

RPN架构

anchor的数量和feature map相关，不同的feature map对应的anchor数量也不一样。RPN在Extractor输出的feature maps的基础之上，先增加了一个卷积，然后利用两个1x1的卷积分别进行二分类（是否为正样本）和位置回归。进行分类的卷积核通道数为9×2（9个anchor，每个anchor二分类，使用交叉熵损失），进行回归的卷积核通道数为9×4（9个anchor，每个anchor有4个位置参数）。RPN是一个全卷积网络（fully convolutional network），这样对输入图片的尺寸就没有要求了。

接下来RPN做的事情就是利用（AnchorTargetCreator）将20000多个候选的anchor选出256个anchor进行分类和回归位置。选择过程如下：

1）对于每一个ground truth bounding box (gt_bbox)，选择和它重叠度（IoU）最高的一个anchor作为正样本。

2）对于剩下的anchor，从中选择和任意一个gt_bbox重叠度超过0.7的anchor，作为正样本，正样本的数目不超过128个。

3）随机选择和gt_bbox重叠度小于0.3的anchor作为负样本。负样本和正样本的总数为256。如下图所示。

softmax判定positive与negative

其实RPN最终就是在原图尺度上，设置了密密麻麻的候选Anchor。然后用cnn去判断哪些Anchor是里面有目标的positive anchor，哪些是没目标的negative anchor。所以，仅仅是个二分类而已

对于每个anchor, gt_label 要么为1（前景），要么为0（背景），而gt_loc则是由4个位置参数(tx,ty,tw,th)组成，这样比直接回归座标更好。

计算分类损失用的是交叉熵损失，而计算回归损失用的是Smooth_l1_loss. 在计算回归损失的时候，只计算正样本（前景）的损失，不计算负样本的位置损失。

1.3、RPN生成RoIs

Proposal Layer负责综合所有候选框变换量和positive anchors，计算出精准的proposal，送入后续RoI Pooling Layer。RPN生成RoIs的过程(ProposalCreator)如下：

1）对于每张图片，利用它的feature map，计算 (H/16)× (W/16)×9（大概20000）个anchor属于前景的概率，以及对应的位置参数。

2）选取概率较大的12000个anchor

3）利用回归的位置参数，修正这12000个anchor的位置，得到RoIs

4）利用非极大值（(Non-maximum suppression, NMS）抑制，选出概率最大的2000个RoIs

注意：在inference的时候，为了提高处理速度，12000和2000分别变为6000和300。RPN的输出：RoIs（形如2000×4或者300×4的tensor）

RPN网络结构总结起来就是：

生成anchors -> softmax分类器提取positvie anchors -> bbox reg回归positive anchors -> Proposal Layer生成proposals

2、RIO pooling

而RoI Pooling层则负责收集proposal，并计算出proposal feature maps，送入后续网络。从图2中可以看到Rol pooling层有2个输入：

原始的feature maps

RPN输出的proposal boxes（大小各不相同）

由于RoIs给出的2000个候选框，分别对应feature map不同大小的区域。首先利用ProposalTargetCreator 挑选出128个sample_rois, 然后使用了RoIPooling 将这些不同尺寸的区域全部pooling到同一个尺度（7×7）上。下图就是一个例子，对于feature map上两个不同尺度的RoI，经过RoIPooling之后，最后得到了3×3的feature map。

RoI Pooling 是一种特殊的Pooling操作，给定一张图片的Feature map (512×H/16×W/16) ，和128个候选区域的座标（128×4），RoI Pooling将这些区域统一下采样到（512×7×7），就得到了128×512×7×7的向量。可以看成是一个batch-size=128，通道数为512，7×7的feature map。

如图所示：

faster rcnn准确率_目标检测方法以及Faster-RCNN学习_第11张图片

3、分类

Classification部分利用已经获得的proposal feature maps，通过full connect层与softmax计算每个proposal具体属于那个类别（如人，车，电视等），输出cls_prob概率向量；同时再次利用bounding box regression获得每个proposal的位置偏移量bbox_pred，用于回归更加精确的目标检测框。结构流程如下图所示：

faster rcnn准确率_目标检测方法以及Faster-RCNN学习_第12张图片

暂时粗浅认知，需要继续深入细节以及代码实践。

参考博客：

目标检测参考博客：http://bbs.cvmart.net/articles/238/hou-r-cnn-shi-dai-faster-r-cnn-ssd-yolo-ge-lei-bian-ti-tong-zhi-xia-de-mu-biao-jian-ce-zong-shu-faster-r-cnn-xi-lie-sheng-le-ma

文章标题：从编程实现角度学习Faster R-CNN（附极简实现）；文章地址：https://zhuanlan.zhihu.com/p/32404424

https://zhuanlan.zhihu.com/p/31426458

文章标题：从结构、原理到实现，Faster R-CNN全解析；文章地址：https://www.jianshu.com/p/ab1ebddf58b1

参考论文：

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks：

https://web.cs.hacettepe.edu.tr/~aykut/classes/spring2016/bil722/slides/w05-FasterR-CNN.pdf

github相关代码地址链接：

https://github.com/endernewton/tf-faster-rcnn

https://github.com/hoya012/deep_learning_object_detection

[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
月之暗面对谈 Zilliz：长文本和 RAG 如何选择？冻感糕人~ 人工智能大数据算法自然语言处理 ai大模型 RAG 机器学习
01长文本与RAG通用对比准确率：通常情况下长文本优于RAG长文本：可更加综合的去分析所有相关的内容，提取相关数字，生成图表，效果尚可。RAG：更适合找到一段或者是几段可能相关的段落。如果希望大模型能够对问题有全局的认识，比较困难。如，根据上市公司的2020年财务报表，绘制图表，直接用RAG可能效果就不是很好。长文本在准确性上表现好的原因，以及长度与准确性选择长文本处理之后，会做对齐和专门的Ben
深度学习之基于Tensorflow卷积神经网络水果蔬菜分类识别系统 qq1744828575 python python plotly
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景与目标背景：在现代农业、智能零售等领域，自动化分类与识别技术对于提高效率、优化供应链管理具有重要意义。为了响应这一需求，本项目旨在构建一个基于深度学习技术的水果蔬菜分类识别系统。目标：构建一个准确率高、性能稳定的水果蔬菜分类识别模型，利用Tensorflow框架
十大机器学习算法-梯度提升决策树（GBDT） zjwreal 机器学习 GBDT 机器学习梯度提升提升树梯度提升决策树
简介梯度提升决策树（GBDT）由于准确率高、训练快速等优点，被广泛应用到分类、回归合排序问题中。该算法是一种additive树模型，每棵树学习之前additive树模型的残差。许多研究者相继提出XGBoost、LightGBM等，又进一步提升了GBDT的性能。基本思想提升树-BoostingTree以决策树为基函数的提升方法称为提升树，其决策树可以是分类树或者回归树。决策树模型可以表示为决策树的加
基于Pytorch框架的CIFAR-10图像分类任务（附带完整代码）难得北窗高卧 pytorch 人工智能 python 深度学习
本文主要实现在pytorch框架下，训练CIFAR数据集，通过观察训练和验证的误差、准确率图像来进一步改善。保存最好的模型。测试集打印整体准确率和每一类别的准确率，并生成混淆矩阵，将其中每一个错误的图片并保存下来。语言：python实现方式：pytorch框架,CPU关键词:CIFAR-10数据集、Dataset和Dataloader、SummaryWriter画图、网络模型搭建、混淆矩阵、统计所
论文阅读笔记（十九）：YOLO9000: Better, Faster, Stronger __Sunshine__ 笔记 YOLO9000 detection classification
WeintroduceYOLO9000,astate-of-the-art,real-timeobjectdetectionsystemthatcandetectover9000objectcategories.FirstweproposevariousimprovementstotheYOLOdetectionmethod,bothnovelanddrawnfrompriorwork.Theim
【机器学习】Python与深度学习的完美结合——深度学习在医学影像诊断中的惊人表现空白诗机器学习深度学习人工智能 python
个人主页：空白诗文章目录一、引言二、深度学习在医学影像诊断中的突破1.技术原理2.实际应用3.性能表现三、深度学习在医学影像诊断中的惊人表现1.提高疾病诊断准确率2.辅助制定治疗方案四、深度学习对医疗行业的影响和推动作用一、引言随着人工智能技术的不断发展，深度学习在医学影像诊断领域的应用日益广泛，其强大的特征提取能力和高效的学习机制为医学影像诊断带来了革命性的突破。本文将深入探讨深度学习在医学影像
JSON parse error: Illegal character ((CTRL-CHAR, code 31)): only regular white space (\r, \n, \t) Chen__Wu java java json
JSONparseerror:Illegalcharacter((CTRL-CHAR,code31)):onlyregularwhitespace(\r,\n,\t)isallowedbetweentokens;nestedexceptioniscom.fasterxml.jackson.core.JsonParseException:Illegalcharacter((CTRL-CHAR,cod
人生跃迁记录史～2019.8.30 小米兮
复习，检测：1.资分（考察耐心，细心，核心是认真踏实）：3篇资分，用时约23分钟，准确率87%。还是不够细心和耐心，又掉陷阱里去了。今天开始重复知识框架时，把注意的出题陷阱也回顾一遍，不断提醒自己要注意的地方。粗心还是源于傲慢，不屑。要尊重知识，尊重细节。图片发自App2.言语（逻辑关系）：每天刷题15道，一并解析。其他了15道但是都是做过的，存在背答案的嫌疑，要找出逻辑关系，知道是怎么选出来的。
java xml 转json json 转 json对象在下，杨江河遇到的问题 java xml json
xml转json在Java中将XML转换为JSON是一个常见的需求，尤其是在处理Web服务或数据交换时。有多种库可以帮助你完成这项任务，但其中最流行和广泛使用的一个是org.json（虽然它本身不直接支持XML到JSON的转换，但可以通过解析XML然后构建JSON来实现）和com.fasterxml.jackson.dataformat.xml（Jackson库的一个扩展，可以直接从XML解析到J
Pinterest：从 Druid 到 StarRocks，实现 6 倍成本效益比提升 StarRocks_labs 数据库大数据
导读：开源无国界，StarRocks自开源以来，近3年的时间里已在全球数据技术领域崭露头角。我们欣喜地发现，越来越多的海外用户正在使用并积极推广着StarRocks。为了促进知识共享，StarRocks中文社区将精选优秀文章与大家共享。本篇文章摘自PinterestEngineering撰写的《DeliveringFasterAnalyticsatPinterest》，欢迎阅读原文深入了解：htt
身份证二要素实名认证-身份证二要素实名认证接口-身份证二要素接口挖数据实名认证身份证生活人工智能大数据 python
接口简介：输入姓名和身份证号，通过官方权威核查，实时校验此二要素是否一致，同时返回生日、性别、籍贯等信息官方权威渠道，精准核验，校验100%可靠;高准确率-实时查询零缓存，毫秒级响应，准确率99.99%;专业服务-7*24小时服务，极速响应，为用户保驾护航;支持批量核验功能为保护个人信息，相同姓名或者号码不允许频繁核验接口地址：https://www.wapi.cn/api_detail/62/1
选择输入法的竖排排列，保证让你的速度飞起来 | 第0017问林广军
别小看两者之间这个小小的不同，对于依赖文字为生的律师群体，符合人性的输入法完全就是刚需。今天说个超级冷⻔却与律师实务息息相关的小技巧，超级冷⻔。大部分律师几乎每天都在使用，但可能从未意识到这个问题。搜狗拼音的一个设置小技巧。如果设置得当，能极大提高输入速度及输入的准确率。日常，大部分律师在使用搜狗拼音输入法的时候是这样的:第一张第二张而我的搜狗输入法是这样设置的:第一张第二张第三张看到有什么不同?
Top-K准确率代码实现友人Chi python 机器学习开发语言
文章目录Top-K准确率Top-K准确率的代码实现多标签分类准确率的代码实现Top-K准确率Top-K准确率就是用来计算预测结果中概率最大的前K个结果包含正确标签的占比。换句话说，平常我们所说的准确率其实就是Top-1准确率。下面我们还是通过一个例子来进行说明。假如现在有一个用于手写体识别的分类器（10分类），你现在将一张正确标签为3的图片输入到分类器中且得到了如下所示的一个概率分布：logits
Tensorflow2 如何扩展现有数据集(缩放、随机旋转、水平翻转、平移等)，从而提高模型的准确率 -- Tensorflow自学笔记14 青瓷看世界 tensorflow 人工智能 python
实际生活中的数据集，往往不是标准的数据，而是有倾斜角度、有旋转、有偏移的数据，为了提高数据集的真实性，提高模型预测的准确率，可以用ImageDataGenerator函数来扩展数据集importtensorflowastffromtensorflow.keras.preprocessing.imageimportImageDataGeneratorimage_gen_train=ImageData
后端处理前端NaN导致报错旋转跳跃闭着眼
用实体接参数时，属性类型是Double，前端传NaN会报错，做了简单处理，记录一下，当然前端不传NaN就更好了…packagecn.edu.oa.jsonSerializer;importcn.micro.framework.exception.BusinessException;importcom.fasterxml.jackson.core.JsonParser;importcom.faste
目标检测-YOLOv2 wydxry 深度学习目标检测 YOLO 人工智能
YOLOv2介绍YOLOv2（YouOnlyLookOnceversion2）是一种用于目标检测的深度学习模型，由JosephRedmon等人于2016年提出，并详细论述在其论文《YOLO9000:Better,Faster,Stronger》中。YOLOv2在保持高速检测的同时，显著提升了检测的精度和泛化能力，成为实时目标检测领域的重要算法之一。核心原理YOLOv2的核心原理是将目标检测问题转化
高考理综怎么复习？就还有100多天了。潇湘剑儿
理综考试的时间只有两个半小时，而分数有300分题量比较大。虽然体量大，但是分数很多，哪怕是一道填空题，两分也能决定你的以后的命运，所以填空题可能不止两分。这个是需要重视的。并且存在一些前后相关的题目。因此为了提高理综的分数和成绩，主要要重点抓住两个方面：做题速度和准确率。一方面要尽快做完，这是提升成绩的关键，另一方面要尽可能保证做的题目都对，这是保证成绩下限，同时也是获得高分的基础。接下来我主要从
（二）十分简易快速自己训练样本 opencv级联lbp分类器车牌识别 Sisphusssss opencv 人工智能计算机视觉笔记 python 学习
强烈建议先阅读上一篇博文，此篇博文是上一篇的拓展目录1、haar与lbp分类器的对比2、使用工具对LBP特征类型进行训练3、LBP分类器现象展示4、完整代码贴出5、更新后的工程贴出6、结语1、haar与lbp分类器的对比Haar特征分类器的优缺点：优点：准确性：在训练数据充足且质量高的情况下，Haar分类器可以达到很高的检测准确率。成熟稳定：Haar特征分类器是较早使用的特征检测方法之一，经过多年
训练过程训练集的准确率都低于验证集和测试集的准确率可能的原因 Wils0nEdwards python 人工智能深度学习
每一个epoch训练集的准确率都低于验证集和测试集的准确率，这种现象不太常见，可能有以下几个原因：1.数据增强过强如果你在训练集上使用了较强的数据增强（如随机翻转、ColorJitter等），而验证集和测试集仅进行了基础的预处理。这会导致训练集的样本更具挑战性，模型在训练集上的表现不如在验证集和测试集上的表现。2.训练和验证集分布差异训练集、验证集和测试集的分布可能存在差异。如果训练集包含更多的噪
平均精度（Average Precision，AP）以及AP50、AP75、APs、APm、APl、Box AP、Mask AP等不同阈值和细分类别的评估指标说明 fydw_715 深度学习基础分类数据挖掘人工智能
平均精度（AveragePrecision，AP）是信息检索领域和机器学习评价指标中常用的一个衡量方法，特别广泛用于目标检测任务。它在评估模型的表现时结合了准确率（Precision）和召回率（Recall），为我们提供一个综合性的评估指标。关键概念Precision（准确率）：精确率表示在模型预测为正例的所有样本中，实际上为正例的比例。它的计算公式为：Precision=TruePositive
only regular white space (\r, \n, \t) is allowed between tokens 梦昼初PurpleShell 经验分享 java springcloud feign
Causedby:com.fasterxml.jackson.core.JsonParseException:Illegalcharacter((CTRL-CHAR,code31)):onlyregularwhitespace(\r,\n,\t)isallowedbetweentokensat[Source:(PushbackInputStream);line:1,column:2]该异常是由于S
【李尚政轩】功夫不负有心人李尚政轩
最近我回家就开始写作业，之后上课的听讲状态也比以前好了许多，俗话说得好：“功夫不负有心人。”说的正是为了学习之后成绩提高上来的，经过我的好几次的努力，终于每次每日一练几乎都能达到100分左右，最差的也就是98分，所以我要争取回回都100分，英语当然也不能差，虽然我听讲的状态好，可是有一些问题我还是答不上来，在我思考的时候别的同学都已经答上来了，所以我的答题速度喝准确率还有待提高。有的时候，老师发大
【pytorch】TensorBoard的使用 hhhhhhkkkyyy pytorch 人工智能 python
TensorBoardTensorBoard是TensorFlow提供的一个可视化工具，用于实时监控、调试和可视化深度学习模型的训练过程和性能指标。虽然它是为TensorFlow设计的，但也可以与其他深度学习框架（如PyTorch）一起使用。下面是一些关于TensorBoard的详细知识和使用方法：可视化功能：Scalars（标量）：用于显示训练过程中的标量数据，比如损失和准确率的变化趋势。Gra
DNN学习平台（GoogleNet、SSD、FastRCNN、Yolov3）吾名招财人工智能 MFC界面应用 dnn opencv 神经网络
DNN学习平台（GoogleNet、SSD、FastRCNN、Yolov3）前言相关介绍1，登录界面：2，主界面：3，部分功能演示如下（1）识别网络图片（2）GoogleNet分类（3）人脸识别（4）SSD目标检测（5）FasterRCNN目标检测资源链接（含源码）前言还记得上学那会儿刚学完几个深度学习模型的C++简单部署应用，当时特别兴奋，外加那会儿还能自己写界面生成应用程序了，就想着做一个
文字模型训练分析评论（算法实战）富士达幸运星算法人工智能机器学习
文字模型训练，尤其是在自然语言处理（NLP）领域，是构建能够理解、解释、生成人类语言系统的核心步骤。这类模型广泛应用于文本分类、情感分析、机器翻译、聊天机器人、摘要生成等多个方面。针对文字模型训练后的分析评论，可以从以下几个方面进行：1.性能评估准确率/错误率：评估模型在测试集上的准确率或错误率是最直接的方式，这能反映模型的基本性能。混淆矩阵：对于分类任务，混淆矩阵可以详细展示模型在各个类别上的表
《642件可写的事》苗_4f9b
16、描述一件诞生在未来，你不知道怎么用的电子产品在2219年的时候，人类的寿命可以计算，准确率高达90％。这是一台类似电脑大小的机器，基本上每个三甲医院都有一台，他们还为此专门设了一个特别的门诊，名为人类寿命咨询门诊，就同现在的生殖中心一样，虽然不是人人需要去看，但需要这方面咨询的人还是不少，往往都是夫妻双方都去，毕竟伴侣是我们生活最久的人，或是为自己的子女的寿命来咨询，爱子之心人皆有之嘛。咨询
第T10周：数据增强 OreoCC 深度学习人工智能 tensorflow2
>-**本文为[365天深度学习训练营]中的学习记录博客**>-**原作者：[K同学啊]**第10周：数据增强难度：夯实基础⭐⭐语言：Python3、TensorFlow2要求：学会在代码中使用数据增强手段来提高acc请探索更多的数据增强手段并记录在本教程中，你将学会如何进行数据增强，并通过数据增强用少量数据达到非常非常棒的识别准确率。我将展示两种数据增强方式，以及如何自定义数据增强方式并将其放到
【法学笔记】2017.6.10 O_榨菜Chris
来源：《DueSouth正南方season1·1-2》加拿大骑警维护加拿大北部地区，原住民、移民安定生活秩序的警察组织道德风貌对法治环境的影响影片中，faster所表现出的温良谦逊，正直诚恳，认真且有风度的性格，提供了一个正向的鲜活形象。同时，一个来自北方小镇的骑警，来到了人情冷漠的大都会，侧面反映出的城市问题，这个现代罕见的正派而传统的小伙子正在以自身的真诚善良潜移默化的感染着每个身边的人。人人
AI手写文字识别+签字+合同打印茂密的软件制作语音识别中文分词全文检索 java python
可识别各种不规则手写字体，并对字迹潦草、模糊等情况进行专项优化，手写中文识别提供各类文字识别的在线服务接口，可直接调用API或使用HTTPSDK对图片中的文字进行多场景、高精度的手写文字识别服务，支持中、英、日、韩、法等20+语言类型，识别准确率可达90%以上；支持涂改痕迹识别与候选字输出，可适用于手写作文、签名等多种场景，使用AI扩散模型推理识图
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置