不知道叫啥好一点

FCOSR: A Simple Anchor-free Rotated Detector for Aerial Object Detection阅读笔记

FCOSR论文阅读笔记

- (一) Title
- (二) Summary
- (三) Method
- - 3.1 网络输出
  - 3.2 椭圆中心采样
  - 3.3 Fuzzy sample label assignment
  - 3.4 多阶段采样
  - 3.5 损失函数
- (四) Experiments
- - 4.1 实验设置
  - 4.2 消融实验
  - 4.3 精度和速度
  - 4.5 公开数据集上的对比实验
- (五) Conclusions
- (六) Notes
- - 8.1 主流的旋转框目标检测算法

(一) Title

论文地址:https://arxiv.org/abs/2111.10780
项目地址:https://github.com/lzh420202/FCOSR

(二) Summary

研究背景:

现有的基于anchor-based方法的旋转框检测算法需要手动设置预设框,引入了额外的超参数和计算。基于anchor-free的方法通常具有复杂的体系结构,不容易部署。

本文方法:

本文提出了一个一阶段的带有角度旋转的检测框架FCOSR,一看就是基于FCOS架构,并且将二维高斯分布也引入进来了。这个工作主要关注的是在训练过程中的label assignment策略，包括：

采用ellipse center sampling方法来给旋转框(oriented bounding boxes)定义一个合适的采样区间

对于overlapping的目标区域，通过fuzzy sample assignment提供了一个更加合理的标签。

通过multi-level sampling模块解决了不充分采样的问题。

实验效果:

算法在DOTA1.0，DOTA1.5以及HRSC2016数据集上的map分别为79.27,75.41以及90.15。FCOSR在one-stage中优于其他的目标检测器。
将一个轻量网络转换成TensorRT格式,在Jetson Xavier NX上进行部署，在DOTAv1上10.68FPS,实现了73.93的mAP.

(三) Method

网络基于FCOS架构，直接预测中心点,长宽以及旋转角度。通过label assignment module定义特征图的输出，去掉了centerness分支。

3.1 网络输出

输出两个分支，分类分支是一个 $C$ 维的类别向量，回归分支包括一个5维的向量，这个5维向量的符号表示为 $(Reg_x,Reg_y,Reg_w,Reg_h,Reg_\theta)$ ,需要经过变换得到最终边界框 $offset_x,offset_y,w,h,angle)$ ，并且对边界框的要求是偏移量可以是负数，宽和高必须是正数，角度范围必须限制在0-90。将回归分支输出变换到最终边界框的计算公式为：
$\begin{array}{l} \text { offset }_{x y}=\operatorname{Reg}_{x y} \cdot k \cdot s \\ w h=\left(\operatorname{Elu}\left(\operatorname{Reg}_{w h} \cdot k\right)+1\right) \cdot s \\ \theta=\operatorname{Mod}\left(\operatorname{Reg}_{\theta}, \pi / 2\right) \end{array}$

3.2 椭圆中心采样

Center Sampling是将采样点集中到目标中心附近,有助于减少低质量预测,提高模型性能。在FCOS以及YOLOX中都采用该策略提升了精度。然而将水平中心采样策略直接迁移到旋转框中存在着两个问题：

水平框的采样区域通常为 $\times 3$ 或者 $\times 5$ 的正方形,旋转框的角度会影响采样范围

对于长宽比较大的边界框来说，短边限制了中心采样的范围，这里我觉得是中心采样范围过大，会超出边界框。

为了解决上面两个问题，本文提出了基于二维高斯分布的椭圆中心采样方法,基于旋转框参数定义一个二维的高斯分布：
$\begin{aligned} \Sigma &=R_{\theta} \cdot \Sigma_{0} \cdot R_{\theta}^{I} \\ \mu &=(c x, c y) \\ R_{\theta} &=\left[\begin{array}{cc} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \end{array}\right], \Sigma_{0}=\frac{1}{12}\left[\begin{array}{cc} w^{2} & 0 \\ 0 & h^{2} \end{array}\right] \end{aligned}$
其中 $\Sigma$ 是协方差矩阵,当角度为0时 $\Sigma_0$ 也是协方差矩阵， $\mu$ 是均值, $R_\theta$ 是旋转变换矩阵。正常情况下的二维高斯分布概率密度函数为：
$f(X)=\frac{1}{2 \pi|\Sigma|^{1 / 2}} \exp \left(-\frac{1}{2}(X-\mu)^{T} \Sigma^{-1}(X-\mu)\right)$
$X$ 表示二维坐标,将归一化项去掉得到：
$g(X)=\exp \left(-\frac{1}{2}(X-\mu)^{T} \Sigma^{-1}(X-\mu)\right)$
椭圆的2D高斯分布表示为 $g (X) = C$ 进行表示,当 $C=C_{0}=\exp (-1.5)$ 时,椭圆的等高线刚刚好能够切到旋转框上，也就是如下图中 $(c)$ 所示。随着 $C$ 的减小,椭圆曲线的范围将扩大。
当 $C$ 的范围在 $C_0,1]$ 直接时,就是一个缩放的椭圆核，这个椭圆核不超过边界框的范围 $C = 1$ 时就是中心点。此时不再采用图 $(a)$ 中的方式来确定正样本,而是通过判断点是否在椭圆内,在椭圆内的话就是正样本，不在椭圆内的话就是负样本。
接着解决第二个问题，长宽比较大时,二维高斯核的长边部分会距离图像中心很远，此时样本的可信度也比较小,通过调整长边高斯核方差来实现椭圆在长边方向上的收缩，也就是如上图中的 $(d)$ 所示。这里通过调整协方差矩阵来实现对长边的收缩：
$\Sigma_{0}=\frac{\min (w, h)}{12}\left[\begin{array}{ll} w & 0 \\ 0 & h \end{array}\right]$
也就是将椭圆的长轴收缩成 $\sqrt{wh}$ ,短边保持不变。博主认为这个椭圆中心采样方法就是TTFNet中的一种特例。

3.3 Fuzzy sample label assignment

FCOS中将不同尺度的目标分配给具有不同步长的特征图来减少ambiguous样本。对于尺度相近的目标，FCOS将ambiguous样本标签设置成smaller targets,也就是较小的目标(这里的大小说的是面积)，但是这种方式很难处理航空场景。这里将二维高斯分布的值看成是采样点到目标中心的距离度量，中心距离的度量通过下式表示：
$J(X)=\sqrt{w h} \cdot f(X)$
对于任何一个采样点,计算每一个采样点的 $J (X)$ 值,这个值越大表示越接近目标。按照当前的分配方式可以表述成：

3.4 多阶段采样

对于大长宽比目标,按照上述方式,采样数量主要受短边的影响，当feature map的步长比采样区域更大时(受短边影响,虽然边界框很大,但是采样区域面积比较小,当比特征图的步长还小时就没法分配到特征点来回归边界框了),为了解决这个问题,本文通过比较短边和步长来决定是否在低层特征图中分配标签，满足下面两个条件的话就分配：

目标的短边同feature map步长的比值小于2,也就是在特征图上不超过4个点来回归目标。

旋转框最小的外界轴对齐矩形的长边超过了特征图的范围。
Multi-level sampling strategy允许我们将一些无法有效采样的目标添加到底层特征图上。在底层特征图上进行密集采样。

这里没说明是怎么将分配到下面的特征图上的，只说了什么情况下分配给下面的特征图。

3.5 损失函数

在分类损失中使用QFL,同时引入IoU来关联类别和边界框的质量：
$L(\sigma)=-|y-\sigma|^{\beta}((1-y) \log (1-\sigma)+y \log (\sigma))$
上式中 $y$ 表示IoU
回归损失使用ProbIoU loss。总损失表示为：
$\begin{aligned} L o s s &=\frac{1}{N_{p o s}} \sum_{z} Q F L+\\ & \frac{1}{\sum_{z} \mathbf{1}_{\left\{c_{z}^*>0\right\}} I o U} \cdot \sum_{z} \mathbf{1}_{\left\{c_{z}^*>0\right\}} I o U \cdot \operatorname{Loss}_{P r o b l o U} \end{aligned}$
其中 $N_{pos}$ 表示正样本数量， $\mathbf{1}_{\left\{c_{z}^*>0\right\}}$ 表示示性函数,博主觉得这里指的应该是在椭圆采样区域内的为1，不在这个区域的为0.

(四) Experiments

4.1 实验设置

数据集采用DOTA1.0，DOTA1.5以及HRSC2016,使用随机翻转+随机旋转增强数据。

使用ResNext50+FPN作为骨干,在DOTA上训练36个epoch，在HRSC2016上训练40k迭代。DOTA上使用SGD学习器，初始学习率0.01(感觉挺大的啊),学习率在24和33个epoch降低10倍。HRSC2016上使用SGD,学习率0.001在30K和36K学习率下降10倍。动量为0.9，权重衰减为0.0001.

提出使用两步旋转,第一步等概率旋转0，90，180，270.第2步以50%的概率旋转30和60度。这种两步旋转相比于随机旋转更好嘛？

4.2 消融实验

4.3 精度和速度

4.5 公开数据集上的对比实验

(五) Conclusions

本文将二维高斯分布引入到FCOS中，主要工作包括 ellipse center sampling, fuzzy sample label assignment, and multi-level sampling。椭圆中心采样为旋转对象提供了更合适的采样区域。模糊样本标签分配方法更合理地划分了重叠目标的采样区域。多层次抽样方法解决了大长宽比目标抽样不足的问题。

(六) Notes

8.1 主流的旋转框目标检测算法

带锚框的方法

ROI transformer:看着像Transformer,但是并不是基于Transformer架构的方法,主要是通过将ROI输出的水平proposals转变成OBB(旋转边界框),提取旋转proposal的特征用于后续的分类和回归。
ReDet中引入了一个rotation invariant卷积(e2cnn)到整个模型中,并且通过RiROI alignment提取了rotation invariant features
Oriented R-CNN中将ROI Transformer中的RROI learning 模块用一个轻量化，简单的oriented region proposal network(orientation RPN)进行替换
R3Det中通过Feature innovation module(FRM)模块水平的anchor进行微调得到旋转anchor
S2ANet由feature Alignment module(FAM)模块以及Oriented detection module(ODM)模块组成。FAM用于生成高质量的旋转anchor。ODM采用active filters来产生方向敏感和方向不变的特征，缓解分类分数同localization精度不一致的问题。
CSL将角度预测转换成分类任务,解决了discontinuous rotation angles的问题。
DCL中在CSL的基础上采用了密集编码来提高训练速度，同时采用角度距离和长宽比加权来改善性能。

无锚框方法

IENet采用了一个带有注意力机制的branch interactive module，能够融合分类和回归分支的特征。
GWD,KLD,ProbIoU使用两个二维高斯分布之间的距离度量来表示损失，给基于anchor-free的方式提供了一种新的回归损失方案。这个需要后面看看
PIoU定义了用于旋转框的能够梯度反向传播的损失函数
BBAVectors和PolarDet分别使用bbav vector以及polar coordinates定义旋转框
CenterRot使用可变形卷积来融合多尺度特征。
AROA采用了注意力机制。

你可能感兴趣的:(anchor,free目标检测,目标检测)

【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
linux 发展史种树的猴子内核 java 操作系统 linux 大数据
linux发展史说明此前对linux认识模糊一知半解，近期通过学习将自己对于linux的发展总结一下方便大家日后的学习。那Linux是目前一款非常火热的开源操作系统，可是linux是什么时候出现的，又是因为什么样的原因被开发出来的呢。以下将对linux的发展历程进行详细的讲解。目录一、Linux发展背景二、UINIX的诞生三、UNIX的重要分支-BSD的诞生四、Minix的诞生五、GNU与Free
C++八股 Petrichorzncu 八股总结 c++开发语言
这里写目录标题C++内存管理C++的构造函数，复制构造函数，和析构函数深复制与浅复制：构造函数和析构函数哪个能写成虚函数，为什么？C++数据结构内存排列结构体和类占用的内存：==虚函数和虚表的原理==虚函数虚表（Vtable）虚函数和虚表的实现细节==内存泄漏==指针的工作原理函数的传值和传址new和delete与malloc和freeC++内存区域划分C++11新特性C++常见新特性==智能指针
Day_11 ROC_bird.. 算法
面试题16.15.珠玑妙算-力扣（LeetCode）/***Note:Thereturnedarraymustbemalloced,assumecallercallsfree().*///下标和对应位置的值都一样，answer[0]+1,对应位置的值猜对了，但是下标不对，answer[1]+1int*masterMind(char*solution,char*guess,int*returnSiz
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
101个浪漫的点子..哈哈有需要可以试试...中英对照~ Hecks 学习心得 IDEA UP Go 音乐网页游戏
Thisisafreebonusversionof101RomanticIdeas.Feelfreetoforwardtoormakecopiesforyourfriends.下面是101个浪漫的点子。可随意转发给你的朋友们IDEA#1点子1Ifyourpartnerisgoingawayforafewdays,tellherthatyouareworriedabouthersoyouhaveor
STM32 HAL freertos零基础（九）任务通知啥也不会的小白研究生零基础学习Freertos stm32 嵌入式硬件单片机
1、任务通知任务通知用于任务之间同步和通信。任务通知允许一个任务向另一个任务发送一个32位的值，并可以选择是否唤醒正在等待通知的任务。这使得任务之间的同步更加简单和灵活。任务通知功能：发送通知：一个任务可以向另一个任务发送一个32位的值。接收通知：接收任务可以根据接收到的通知来决定何时执行某些操作。通知状态：可以检查任务的当前通知状态。2、相关APIxTaskNotify()//发送通知，带有通知
CISSP考点拾遗——软件保障SwA 我全家都是CISSP
说明：“考点拾遗”系列基于日常为学员和网友做的答疑整理，主要涉及教材中没有完全覆盖到的知识点。Softwareassuranceisthelevelofconfidencethatsoftwareisfreefromvulnerabilities,eitherintentionallydesignedintothesoftwareoraccidentallyinsertedatanytimedur
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
通过C# 裁剪PDF页面 Eiceblue C#.NET PDF c#pdf 开发语言 visual studio
在处理PDF文档时，有时需要精确地裁剪页面以适应特定需求，比如去除广告、背景信息或者仅仅是为了简化文档内容。本文将指导如何使用免费.NET控件通过C#实现裁剪PDF页面。免费库FreeSpire.PDFfor.NET支持在.NET(C#,VB.NET,ASP.NET,.NETCore)程序中实现创建、操作、转换和打印PDF文档等操作。可以从以下链接下载产品包后手动添加引用，或者直接通过NuGet安
【Python】离线/无网/内网安装第三方库的一种方法 qilei2010 Python python 开发语言后端
有时候，我们使用的电脑没有接入互联网，或者是内部网络电脑，又或者是单机无网络，这时候使用Python，就不能自由的使用pipinstall命令了。下面是一种比较简单的无互联网安装第三方Python库的方法。此方法利用pipfreeze命令从已安装第三方库的电脑上移植库到内网电脑上。注意：以下命令中的D:\pkg文件夹需要自己提前创建。1.准备互联网电脑，优盘，无互联网电脑（下称无网电脑）无网电脑要
FloatActionButton 使用 yuzhiyi_宇
FloatActionButton(简称FAB)是负责显示界面基本操作的圆形按钮，其提供的最好是高频率的操作。使用FloatActionButton继承自ImageView，具备ImageView的全部属性。xml布局代码属性作用android:srcFAB中显示的图标app:layout_anchor设置FAB的锚点，即以该控件为参考app:layout_anchorGravityFAB相对锚点
猿创征文｜【FreeSwitch开发实践】使用sipp对FreeSwitch进行压力测试一马途追 FreeSwitch开发实践 sipp 压力测试 FreeSwitch 压测
✨博客主页：小小马车夫的主页✨所属专栏：FreeSwitch开发实践✨专栏介绍：主要介绍博主在实际项目中使用FreeSwitch开发外呼类项目的一些经验心得，主要涉及FreeSwitch的基本安装编译、基本配置、ESL、WSS、录音、自定义模块、mediabug、语音播放、MRCP及对接AI机器人等内容。内容在持续更新中，如果感兴趣可以对专栏进行订阅~文章目录前言1、sipp编译安装2、sipp命
FreeRTOS操作系统（详细速通篇）——— 第十五章（完结）给生活加糖！快速通关FreeRTOS stm32 FreeRTOS 单片机嵌入式嵌入式软件 c语言操作系统
本专栏将对FreeRTOS进行快速讲解，带你了解并使用FreeRTOS的各部分内容。适用于快速了解FreeRTOS并进行开发、突击面试、对新手小白非常友好。期待您的后续关注和订阅！目录软件定时器和低功耗模式1软件定时器1.1什么是定时器？1.2软件定时器的优缺点1.3FreeRTOS软件定时器特点1.4软件定时器的状态及转换1.4.1定时器状态1.4.2定时器周期1.5结构体及API函数1.5.1
React Native动画的锚点anchorPoint 沉默的依恋 React Native
在RN动画开发的过程中,有需求让图片绕中心点以外的其它点旋转,本以为是一个简单的问题,猜想Facebook应该有提供类似的API.然而在官网找了一圈没有anchorPoint这个API,后来想了想,RN与H5非常像,应该有transformOrigin这个属性,然而,还是没有,在github的issues中有人提问过什么时候更新这个属性,但是官网仍旧没有计划;为了达到这种效果,其实有一种间接的方法
C++17 非类型模板参数的auto 和 DevC++ 支持C++17 bcbobo21cn VC++C++11 C++17 auto 类型模板参数非类型模板参数
模板参数分为两种，一种是类型模板参数，也是我们用得最多的一种：templateautoadd(Tt,Uu){returnt+u;}里面的T和U都是类型模板参数。另一种是非类型模板参数，它可以让不同的字面量成为模板的参数：templateclassbuffer_t{public:T&alloc();voidfree(T&item);private:Tdata[BufSize];}buffer_tbu
一蛙有一蛙的世界恐怖猪
么么哒的蛙仔不也在静悄悄的安静的吃着饭吗？不争不闹，因为她是一只蛙！世界多美呀！吃饱饱，去工作，去游山玩水，风景多么美好，别管那么多跟人有关的事！只要能在自己选择的世界安心的过着，在人之间，又能做到不被他人影响，自由快乐的生活，体验人世间，算是对自己最大的责任了！自由快乐，又像是遥不可及的远方。Freedom!勇敢的心主角尚且要付出被掏肠的代价才最终喊出他的绝望，生活在少有的和平年代的我，居然还有
freeswitch模块的介绍系列【codecs】【mod_ilbc】黄宝良 freeswitch 学习 linux 视频编解码音视频
ffreeswitch模块的介绍系列【编解码】【mod_ilbc】mod_ilbc文章目录ffreeswitch模块的介绍系列【编解码】【mod_ilbc】一、mod_ilbc是什么？二、使用步骤1.引入模块环境2.安装mod_ilbc模块2.FS导入模块总结一、mod_ilbc是什么？“mod_ilbc”是freeswitch忠低比特率编解码器（iLBC）模块，通常在电信和互联网协议语音（VoI
FreeSWITCH入门到精通系列（三）：FreeSWITCH基础概念与架构黄宝良 freeswitch 实时音视频 freeswitch
FreeSWITCH入门到精通系列（三）：FreeSWITCH基础概念与架构前言在前两篇博客中，我们介绍了FreeSWITCH的基本概念和安装与配置。本篇文章将深入探讨FreeSWITCH的基础概念和架构，帮助您更好地理解这个强大的通信平台的工作原理。FreeSWITCH基础概念1.什么是FreeSWITCH？FreeSWITCH是一个开源的实时通信平台，提供了创建VoIP（VoiceoverIP
【目标检测数据集】番茄叶片病害数据集13940张9类VOC+YOLO格式熬夜写代码的平头哥∰ 数据集目标检测 YOLO 目标跟踪
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：13946标注数量(xml文件个数)：13946标注数量(txt文件个数)：13946标注类别数：9标注类别名称:["EarlyBlight","Healthy","LateBlight","LeafMiner","Le
嵌入式八股文(一) C语言篇云雨歇学习笔记 c语言
文章目录前言一、指针和变量二、关键字1.volatile2.const3.static4.extern三、数据结构1.结构体1.1结构体基本内容1.2通过指针对结构体赋值1.3结构体指针2.联合体3.链表3.1基本概念3.2链表的插入和删除4.栈（Stack）5.堆（Heap）6.队列四、内存1.内存分配的方法2.malloc和free3.内存泄漏4.内存溢出前言笔者在学习时发觉自己的C语言很久没
FreeRTOS学习笔记＞内存管理 HKElec FreeRTOS学习笔记学习笔记
1.内存的概念与分类在计算系统中，内存用于存储变量和中间数据。系统的内存可以分为两种：内部存储空间（RAM）：通常指随机存储器，数据存取速度快，可以随机访问，但掉电后数据会丢失。外部存储空间：例如硬盘或闪存，数据即使在掉电后也能保存。在嵌入式系统中，我们主要关注内部存储空间（RAM）的管理，这就是内存管理的核心内容。2.FreeRTOS内存管理的设计理念FreeRTOS操作系统将内核与内存管理功能
纪录片《徒手攀岩》安利水墨静影
凭借《徒手攀岩》，华裔摄影师金国威和妻子伊丽莎白首次获提名就斩获最佳纪录长片奖。影片还原了亚历克斯·霍诺尔德FreeSolo登顶酋长岩的过程。《徒手攀岩》全程真实记录了这一挑战人类心理与体能极限的壮举。徒手攀岩（FreeSolo）就是不借助绳索、安全带等机械类辅助攀登装备，无保护徒手攀爬岩壁。除了攀登鞋和防滑的镁粉，攀登者完全依赖个人的身体。亚历克斯·霍诺德就是如此。在徒手攀酋长岩之前，他有近六十
[数据集][目标检测]血细胞检测数据集VOC+YOLO格式2757张4类别 FL1623863129 数据集目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：2757标注数量(xml文件个数)：2757标注数量(txt文件个数)：2757标注类别数：4标注类别名称:["Platelets","RBC","WBC","sicklecell"]每个类别标注的框数：Platelet
目标检测YOLO系列从入门到精通技术详解100篇-【目标检测】工业相机格图素书数码相机目标检测人工智能
目录知识储备深度相机1TOF2双目视觉3结构光4智能门锁应用5手机应用算法原理相机的成像与标定模型相机标定的实施·标定过程的算法实施相机标定的扩展CCD工业相机、镜头倍率及相关参数计算方法知识储备深度相机1TOF1.1Kinectv2Kinectv2是Microsoft在2014年发售的，如图1-1所示。相比于Kinectv1在硬件和软件上作出了很大的进化，且在深度测量的系统和非系统误差方面表现出
java实现将数据生成图表至excel导出 AdoredU
1.目的根据已有数据，手动（java后台）生成图表至excel并导出。用于后台查询到数据后直接创建图表，可以代替直接使用图表信息字符串。2.说明使用jfree图表绘制类库绘制图表，并生成到本地或读取至输出流用于在excel中生成；使用poi操作excel；3.使用jar包使用maven管理jar包，主要包含poi和jfree：3.11org.apache.poipoi${poi-version}o
STM32 HAL freertos零基础（六）计数型信号量啥也不会的小白研究生零基础学习Freertos stm32 嵌入式硬件单片机
1、计数型信号量计数型信号量（CountingSemaphore）是另一种类型的信号量，它可以保持一个大于等于0的整数值，这个值表示可用资源的数量。本质上相当于队列长度大于1得队列。经典问题就是剩余车辆统计，出入车辆，车辆数据可以实时更新。2、相关API函数xSemaphoreCreateCounting()//使用动态方法创建计数型信号量。xSemaphoreCreateCountingStat
Python依赖包安装海... Python python pycharm 开发语言
打包当前依赖环境到requirements.txtpipfreeze>requirements.txt安装依赖包pipinstall-rrequirements.txt制定源命令-i阿里云http://mirrors.aliyun.com/pypi/simple/中国科技大学https://pypi.mirrors.ustc.edu.cn/simple/豆瓣(douban)http://pypi.
STM32 HAL freertos零基础（七）互斥量啥也不会的小白研究生零基础学习Freertos stm32 嵌入式硬件单片机
1、互斥量互斥量主要用于保护共享资源的访问，确保在同一时刻只有一个任务可以访问该资源。互斥性：当一个任务获取了一个互斥量后，其他任务将无法再获取同一个互斥量，直到原始任务释放该互斥量。优先级继承：为了防止优先级反转问题，FreeRTOS的互斥量支持优先级继承机制。当一个高优先级任务被低优先级任务阻塞时，低优先级任务会暂时提升自己的优先级，以尽快释放互斥量，让高优先级任务继续执行。递归锁定：互斥量支
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他