Clichong

论文阅读笔记 | 目标检测算法——Libra R-CNN算法

如有错误，恳请指出。

文章目录

1. Introduction
- 1.1 Sample level imbalance
- 1.2 Feature level imbalance
- 1.3 Objective level imbalance
2. Libra R-CNN Methodology
- 2.1 IoU-balanced Sampling
- 2.2 Balanced Feature Pyramid
- 2.3 Balanced L1 Loss
3. Result

paper：Libra R-CNN: Towards Balanced Learning for Object Detection

摘要：

相比于模型结构，相比之下如何对模型进行训练这一方面受到的关注比较少，但是其对于目标检测任务来说同样的重要。作者回顾了检测器的标准训练过程，发现了检测性能往往受到训练过程中不平衡的限制，而这种不平衡一般由三个层次组成：样本层（sample level）、特征层（feature level）和目标层（objective level）。

为了解决这个问题，作者提出了Libra R-CNN，用来平衡训练过程。Libra R-CNN由三个新组建构成：IoU平衡采样（IoU-balanced sampling）、平衡特征金字塔（balanced feature pyramid）和平衡L1损失（balanced L1 loss），分别用于降低采样、特征和目标三个层次的不平衡。

1. Introduction

不断涌现的网络结构推动了目标检测的发展，但尽管流水线架构（例如单阶段与两阶段）中存在明显的差异，但现代检测框架大多遵循共同的训练流程：即采样区域，从中提取特征，然后在标准多任务目标函数的指导下共同识别类别并细化位置。

基于这种训练流程，目标检测器训练的成功取决于三个关键方面：
1）所选区域样本是否具有代表性
2）提取的视觉特征是否被充分利用
3）设计的目标函数是否最优

作者的研究表明，典型的训练过程在所有这些方面都明显不平衡。这种不平衡问题阻碍了设计良好的模型体系结构的能力被充分利用，从而限制了整体性能，如图所示：

1.1 Sample level imbalance

当训练对象检测器时，困难样本特别有价值，因为它们对提高检测性能更有效。然而，随机抽样方案通常导致所选择的样本被容易样本所支配。如图1中的（a）所示，正负样本的数量之间存在严重的不平衡问题，负样本要比正样本要多得多。常用的提高困难样本关注的方法：

OHEM
OHEM有助于提高对困难样本的关注。然而它们通常对噪声标签很敏感，并导致相当大的内存和计算成本。
Focal loss
Focal loss也缓解了One-step检测器中的这个问题，但是当扩展到R-CNN时发现几乎没有改善，因为大多数容易样本被two-stage检测器中的两个挑选流程过滤掉。（yolov4中也发现Focal loss没有起到效果）

在我另外一篇笔记中有详细说明一些数据分布不均衡所采取的方法：YOLOv4中的tricks概念总结——Bag of freebies，其中的第五点有介绍到。

因此，这个问题还有待细致解决。

1.2 Feature level imbalance

主干中的深层高级特征具有更多的语义含义，而浅层低级特征更具内容描述性。FPN和PANet通过横向连接进行的特征集成推动了目标检测的发展。

FPN：提出了横向连接，通过自上而下的途径丰富浅层的语义信息
PANet：引入自下而上的途径，进一步增加深层的低层次信息

这些方法表明低层和高层信息对于目标检测是互补的，如何利用它们来整合金字塔表示的方法决定了检测性能。

但是，将它们集成在一起的最佳方法是什么？作者的研究表明，综合特征应该具有来自每个分辨率的平衡信息。但是上述方法中的顺序方式将使综合特征更多地关注相邻分辨率，而较少关注其他分辨率。在信息流中，非相邻层次的语义信息在每次融合时会被稀释一次。

因此，作者提出的方法依赖于集成的平衡语义特征来增强原始特征。以这种方式，每个分辨率都将信息从其他分辨率中分离出来，从而平衡信息流并使特征更具区别性。

1.3 Objective level imbalance

有研究表明，基于多任务学习的模型的性能强烈依赖于每个任务损失之间的相对权重。而检测器需要执行两个任务，即分类和定位。因此，训练目标包含两个不同的目标。如果它们没有得到适当的平衡，一个目标可能会受到损害，导致整体性能不佳。

训练过程中涉及的样本也是如此。如果它们没有得到适当的平衡，由简单样本产生的小梯度可能会淹没在由硬样本产生的大梯度中，从而限制了进一步的细化。因此，需要重新平衡所涉及的任务和样本，以实现最佳收敛。而作者的方法重新平衡所涉及的任务和样本，以实现更好的收敛。

小结：
为了减轻这些问题造成的不利影响，作者提出了Libra R-CNN算法，明确地在上面讨论的所有三个层次上实施平衡。这个框架集成了三个新组件：
1）IoU-balanced sampling：根据困难样本的与指定ground-truth的IoU来挖掘硬样本，也就是提高注意力。
2） balanced feature pyramid：其使用相同的深度集成的平衡语义特征来加强多级特征。
3）balanced L1 loss：提升关键梯度，以重新平衡所涉及的分类、整体定位和精确定位。

作者的主要贡献：
1）系统地回顾了检测器的训练过程，揭示了限制检测性能的三个层次的不平衡问题。
2）提出了Libra RCNN，这是一个通过结合三个新的组成部分来重新平衡训练过程的框架：IoU平衡采样、平衡特征金字塔和平衡L1损失。
3）在MS COCO上测试了所提出的框架，与最先进的检测器（包括单级和两级检测器）相比，不断获得显著的改进。

2. Libra R-CNN Methodology

Libra R-CNN的目标是使用整体平衡设计来缓解检测器训练过程中存在的不平衡，从而尽可能挖掘模型架构的潜力，其整体架构如下图所示：

2.1 IoU-balanced Sampling

对于RPN网络提供的候选框中仍然存在大量的样本，在这些负样本中有困难的负样本也有简单的负样本。其中困难的负样本就是被判断为假阳性的概率高，所以传统的双阶段的硬样本挖掘需要对这些困难样本进行复杂计算得出结果。而如果是简单对RPN网络提供的候选框进行随机抽样，明显效果不会是最好的，所以希望能够尽量的挑选多一些的困难负样本。

基于这个问题，现在从一个基本问题开始：训练样本与其对应的ground truth之间的重叠是否与其难度相关联？这里主要考虑困难负样本，作者从实验发现，超过60%的困难负样本具有大于0.05的重叠，但是随机采样只为我们提供了大于相同阈值的30%的训练样本，如图所示：

这种极端的样品不平衡将许多困难负样本埋藏在成千上万个简单负样本中。

基于这一观察，作者提出了IoU平衡采样：一种简单但有效的硬挖掘方法，无需额外成本。假设现在需要从 $M$ 个对应的候选中抽取 $N$ 个负样本。随机抽样下每个样本的选择概率为：
$\frac{N}{M}$
为了提高困难负样本的选择概率，作者根据IoU将采样间隔平均分成 $K$ 个区间。所以 $N$ 个要求的负样本被平均分配到每个箱中，然后再统一从中挑选样本。因此，得到了IoU平衡采样下的选择概率为：
$p_{k} = \frac{N}{K}*\frac{1}{M_{k}}，k∈[0,K)$
其中， $M_{k}$ 是由 $k$ 表示的相应区间中的采样候选数，这里作者设置 $K = 3$ ，也就是将IoU采样间隔分为了3个区间。

由上图3可以看出，IoU平衡采样可以引导训练样本的分布接近困难负样本的分布。实验还表明，实验结果对K不敏感，具有更高IoU的样本往往更有可能被选择。可以了解到，通过这种采样方法，明显比随机抽样的结果挑选的困难负样本要好。

此外该方法也适用于困难正样品。然而在大多数情况下并没有足够的候选样本将该程序扩展到正样本中。为了使平衡抽样程序更全面，我们对每个ground truth抽样相等的正样本作为替代方法。

2.2 Balanced Feature Pyramid

与以前使用横向连接集成多级特征的方法不同，作者的关键思想是使用相同的深度集成的平衡语义特征来增强多级特征。它包括四个步骤，重新调整，整合，提炼和加强，具体结构如图所示：

预测特征层为 $l$ 的层级被定义为 $C_{l}$ ，预测特征层总层级数为 $L$ ，其中涉及最高层级与最低层级定义为 $l_{max}$ 与 $l_{min}$ ，如上图中的 $C_{2}$ 具有最大的图片分辨率尺度。为了集成多级特征层并同时保留它们各自的语义层次，作者首先将多级特征 ${C_{2}，C_{3}，C_{4}，C_{5}\}$ 调整到中间大小（Integrate），即与 $C_{4}$ 相同的大小，分别使用插值和最大池化处理，对于小尺寸的特征图可以进行池化处理，而对于大尺度的特征图可以进行双线性插值处理。通过简单的平均获得平衡的语义特征，可以表示为：
$\frac{1}{L}\sum_{l=l_{min}}^{l_{max}}C_{l}$
然后，使用相同但相反的过程对获得的特征进行重新缩放，以增强原始特征。在此过程中，每层预测特征层从其他预测特征层获得相同的信息。请注意，此过程不包含任何参数。作者观察到这种非参数方法的改进，证明了信息流的有效性。

在上诉重新缩放之前，平衡的语义特征可以进一步提炼（Refine），使其更具区别性。作者发现直接使用卷积的提炼和非局部模块（non-local module）都工作良好，但是非局部模块工作更稳定。因此，本文使用嵌入的高斯非局部注意（embedded Gaussian non-local attention）作为提炼步骤，这提炼步骤有助于增强集成特性并进一步改善结果。

通过这种方法，从低级到高级的特征被同时聚集。输出的预测特征层 ${P_{2}，P_{3}，P_{4}，P_{5}\}$ 各自用于目标检测，这与FPN一样。还值得一提的是，平衡特征金字塔（balanced feature pyramid）可以与FPN或者PAFPN互补工作，没有任何冲突。

ps：在这个过程中，设计到non-local module，这个出现在非局部神经网络（Non-local Neural Networks），非局部通用网络结构，由何恺明提出，non-local指的就是感受野可以很大。对于non-local module的说明之后会进行补充。

2.3 Balanced L1 Loss

自Fast R-CNN以来，分类和定位问题在多任务损失的指导下被同时解决，其被定义为：
$L_{p,u,t^{u},v}=L_{cls}(p,u)+\lambda[u≥1]L_{loc}(t^{u},v)$
其中， $L_{cls}$ 与 $L_{loc}$ 分别对应于识别和定位的目标函数。 $L_{cls}$ 中的预测类别和目标类别表示为 $p$ 和 $u$ ， $t^{u}$ 对应的 $u$ 类的预测边界框结果， $v$ 是回归目标边界框， $λ$ 用于调整多任务学习下的损失权重。这里将损失大于或等于1.0的样本称为异常值（outliers），其他样本称为内联值（inliers）。

平衡相关任务的一个自然解决方案是调整它们的损失权重。然而，由于回归目标无界，直接提高局部化损失的权重会使模型对异常值更加敏感。这些异常值可视为困难样本，会产生过大的梯度，对训练过程有害。而与异常值相比，内联值对整体梯度的贡献很小，可以被视为简单样本。更具体地说，与异常值相比，内联值对每个样本平均只贡献30%的梯度。考虑到这些问题，我们提出了平衡L1损耗，表示为 $L_{b}$ 。

Balanced L1 loss源自传统的smooth L1 loss，其中拐点被设置为将内联器与外联器分开，并将1.0设置为异常值outliers产生的最大梯度，如下图(a)所示：

平衡L1损失的关键思想是促进关键的回归梯度，即来自内联器(精确样本)的梯度，以重新平衡所涉及的样本和任务，从而在分类、整体定位和精确定位中实现更平衡的训练。本地化损失 $L_{loc}$ 分配平衡L1损失定义为：
$L_{loc}=\sum_{i∈\{x,y,w,h\}}L_{b}(t^{u}_{i}-v_{i})$
其相应的梯度公式如下：
$\frac{∂L_{loc}}{∂w} ∝ \frac{∂L_{b}}{∂t^{u}_{i}} ∝ \frac{∂L_{b}}{∂x}$
基于上面的公式，作者设计了一个改进的梯度公式：
$\frac{∂L_{b}}{∂x} = \begin{cases} α\ln(b|x|+1),&\text{if |x|<1} \\ γ,&\text{otherwise} \end{cases}$
由上图(a)显示，在 $α$ 因子的控制下，平衡L1损耗增加了inliers的梯度。较小的 $α$ 为inliers增加了更多的梯度，但outliers的梯度不受影响。此外，为了调整回归误差的上界，引入了由 $γ$ 控制的整体提升倍率，这可以帮助目标函数更好地平衡所涉及的任务。控制不同方面的两个因素相互增强，达到更均衡的训练。b用于确保等式中两个公式的 $L_{b}(x = 1)$ 值相同。

通过积分上面的梯度公式，我们可以得到平衡的L1损耗：
$L_{b}(x) = \begin{cases} \frac{α}{b}(b|x|+1)\ln(b|x|+1)-α|x|,&\text{if |x|<1} \\ γ|x|+C,&\text{otherwise} \end{cases}$
其中参数 $γ$ 、 $α$ 和 $b$ 受下列约束：
$α\ln(b+1)=γ$
在实验中，默认参数设置为 $α = 0.5$ 和 $γ = 1.5$

小结：

至于作者如何提出这个改进的梯度公式的，在文中好像没有提及，可能我的数学水平还不够…对于这一点，直观上的小结就是作者将原来的smooth L1 loss改变为Balanced L1 loss。其中：

smooth L1 loss公式为：
$L_{loc}(t^{u},v)=\sum_{i∈\{x,y,w,h\}}smooth_{L_{1}}(t^{u}_{i}-v_{i})$
balanced L1 loss公式为：
$L_{loc}(t^{u},v)=\sum_{i∈\{x,y,w,h\}}L_{b}(t^{u}_{i}-v_{i})$

而其中：

smooth L1定义为：
$smooth_{L_{1}}(x) = \begin{cases} 0.5x^{2},&\text{if |x|<1} \\ |x|-0.5,&\text{otherwise} \end{cases}$
balanced L1定义为：
$L_{b}(x) =balanced_{L_{1}}(x)= \begin{cases} \frac{α}{b}(b|x|+1)\ln(b|x|+1)-α|x|,&\text{if |x|<1} \\ γ|x|+C,&\text{otherwise} \end{cases}$
简单来说，就是将 $balanced_{L_{1}}(x)$ 替换了 $smooth_{L_{1}}(x)$

3. Result

在困难负样本随机挑选时，划分的区间k=3时效果最好：
提出的balanced semantic pyramid的作用：
新定义的balanced L1的作用：
与SOTA的对比：

总结：

相比于网络结构的改变，作者将注意力放在了训练过程的改进上，提出3点改进：
1）通过对随机抽样负样本时设置分区进行抽样，增加了困难样本被挑选的概率。
2）对FPN结构进行改进，提出了Balanced FPN。其过程是对全部的预测特征层直接进行集成并进一步提炼处理，再之后就是池化或者双线性插值变化为FPN的类似输出，这对于性能竟然是有帮助的，证明了信息流的有效性。
3）抛弃传统的smooth L1函数，创造了balanced L1函数，并将其使用在边界框回归损失函数上，同样提高了性能。

探索灵活高效的UI开发新境界：Reflex库荣正青
探索灵活高效的UI开发新境界：Reflex库reflexjsAlibraryforrapidUIdevelopmentwithstyleprops,colormodes,themesandvariants+starterkits,themesandblockstohelpyoubuildGatsbyandNext.jssitesfaster.项目地址:https://gitcode.com/gh_
利用 PyTorch 动态计算图和自动求导机制实现自适应神经网络 drebander AI 编程 pytorch 神经网络人工智能
在深度学习任务中，不同任务的复杂度千差万别。为了解决复杂任务对模型容量的需求，同时避免简单任务因过度拟合导致的性能下降，我们可以构建一个能够根据任务自动调整网络结构的神经网络。在PyTorch中，动态计算图和自动求导机制为实现这一目标提供了强大的工具。动态网络结构设计PyTorch的动态计算图允许我们根据运行时的输入数据或任务复杂度，动态创建和修改网络结构。动态添加/移除层：可以在训练过程中根据需
MGWR运行报错：在模型校准过程中出现了问题，请仔细检查您的设置和数据。（Something went wrong during model calibration ）老襄 arcgis
参考MGWR使用手册，输入的XY数据需要为投影坐标，笔者是直接使用经纬度坐标出现的报错。转换投影坐标后运行成功。
可解释性：走向透明与可信的人工智能一位小说男主人工智能入门深度学习机器学习人工智能神经网络
随着深度学习和机器学习技术的迅速发展，越来越多的行业和领域开始应用这些技术。然而，这些技术的“黑盒”特性也带来了不容忽视的挑战。在许多任务中，尽管这些模型表现出色，取得了相当高的精度，但其决策过程不透明，这对于依赖于机器决策的应用（如金融、医疗、法律等）来说，可能是无法接受的。因此，如何提高模型的可解释性、实现透明和可信的人工智能，成为了当下人工智能领域的重要课题。❤️本文将深入探讨机器学习中的可
Qwen-VL论文解读 dream_home8407 人工智能
Qwen-VL：用于理解、定位、文本阅读等的通用视觉-语言模型摘要在本文中，我们介绍了Qwen-VL系列，这是一组大规模的视觉-语言模型（LVLMs），旨在感知和理解文本和图像。从Qwen-LM开始，我们通过精心设计的（i）视觉受体，（ii）输入-输出接口，（iii）3阶段训练管道，以及（iv）多语言多模态清洗语料库，赋予其视觉能力。除了传统的图像描述和问答，我们还通过图像-标题-框元组的对齐实现
单目测距（yolo-目标检测+标定+深度学习目标检测_测距）计算机C9硕士_算法工程师 YOLO 目标检测深度学习
YOLOv5模型介绍YOLOv5是目前最先进的目标检测算法之一，在多个数据集上取得了优秀的表现。相较于YOLOv4，YOLOv5采用了更深的Backbone网络和更高的分辨率输入图像，以提高检测精度和速度。单目测距实现方法在目标检测的基础上，我们可以通过计算物体在图像中的像素大小来估计其距离。具体方法是，首先确定某个物体的实际尺寸，然后根据该物体在图像中的像素大小计算其距离。这个方法可以应用于各种
Depth Anything V2：单目深度估计的更强基线武朵欢Nerissa
DepthAnythingV2：单目深度估计的更强基线项目地址:https://gitcode.com/gh_mirrors/de/Depth-Anything-V2项目介绍DepthAnythingV2是由HKU与TikTok团队合作开发的单目深度估计算法的升级版本。这个框架显著提升了细节处理能力和鲁棒性，相比于基于深度学习的方法，它提供了更快的推理速度、更少的参数量以及更高的深度预测精度。本项
深度图转点云——从图像到三维场景 MrybHtml 点云
在计算机视觉领域中，深度图转点云是一项重要的任务，它能够将二维深度图像转换为三维点云表示。点云是一种由点构成的数据结构，可以直观地表示三维场景中的物体形状和空间布局。本文将介绍一种常见的方法，并提供相应的源代码，以实现深度图转点云。深度图是一种灰度图像，其中每个像素值代表了该点距离相机的距离。深度图通常使用激光雷达或者结构光等传感器捕捉得到。而点云则是由一系列的三维点组成，每个点都有其在空间中的坐
知网爬虫，作者、摘要、题目、发表期刊等主要内容的获取大懒猫软件爬虫
爬取知网内容的详细过程爬取知网内容需要考虑多个因素，包括网站的结构、反爬虫机制等。以下是一个详细的步骤和代码实现，帮助你使用Python爬取知网上的论文信息，包括作者、摘要、题目、发表期刊等主要内容。1.数据准备首先，需要准备一些基础数据，如知网的URL、请求头等。2.模型构建使用requests库发送HTTP请求，使用BeautifulSoup库解析HTML内容。如果遇到动态加载的内容，可以使用
OpenAI的编程语言和框架，给程序员带来了帮助有哪些 API技术大佬Anzexi58 OpenAI 人工智能人工智能深度学习
OpenAI是一个人工智能开发公司，成立于2015年，总部位于美国旧金山。这家公司致力于研究和开发先进的人工智能技术，旨在将这些技术应用到解决全球一些最棘手的问题上。OpenAI以其卓越的技术和实验室出品的groundbreakingAIpapers而闻名。OpenAI的研究涉及深度学习、自然语言处理、视觉感知、强化学习等多个领域，并已在各种应用中取得了令人瞩目的成果。例如，在机器人领域，Open
ESP32-CAM实验集(WebServer) Android小码家 Linux ESP32
WebServer效果图已连接web端platformio.ini;PlatformIOProjectConfigurationFile;;Buildoptions:buildflags,sourcefilter;Uploadoptions:customuploadport,speedandextraflags;Libraryoptions:dependencies,extralibrarysto
探索OpenAI Python SDK: 智能编程新里程周澄诗Flourishing
探索OpenAIPythonSDK:智能编程新里程openai-pythonTheofficialPythonlibraryfortheOpenAIAPI项目地址:https://gitcode.com/gh_mirrors/op/openai-python如果你对人工智能和自然语言处理有浓厚的兴趣，那么这个项目将为你开启新的探索之门——。这是一个由OpenAI开发的Python库，用于与他们的A
DeepSeek：突破传统的AI算法与下载排行分析 smart_ljh 行业搜索人工智能 AI
DeepSeek的AI算法突破DeepSeek相较于OpenAI以及其它平台的性能对比DeepSeek的下载排行分析（截止2025/1/28AI人工智能相关DeepSeek甚至一度被推上了搜索）未来发展趋势总结在人工智能技术飞速发展的当下，搜索引擎市场也迎来了新的变革。DeepSeek，作为一款基于深度学习技术和大数据算法的搜索引擎，以其独特的优势在国内外市场上引起了广泛关注。下面介绍一下针对De
Synology 群辉NAS安装（4）docker-compose haoyuzsjie NAS docker 容器 NAS
Synology群辉NAS安装（4）docker-composeSynology群辉NAS安装（4）docker-composeerrorwhileloadingsharedlibraries:libz.so.1Synology群辉NAS安装（4）docker-compose1.下载最新版docker-compose|sudocurl-L"https://github.com/docker/com
医学顶会 MICCAI‘24 | LKM-UNet: 大型内核视觉 Mamba UNet 用于医学图像分割小白学视觉医学图像处理论文解读 MICCAI 深度学习医学图像顶会医学图像处理论文解读
本文内容只为星球内部成员学习和学术交流，请勿用作他用本文内容只为星球内部成员学习和学术交流，请勿用作他用论文信息题目：LKM-UNet:LargeKernelVisionMambaUNetforMedicalImageSegmentationLKM-UNet:大型内核视觉MambaUNet用于医学图像分割作者：JinhongWang,JintaiChen,DannyChen,JianWu源码链接：
TwoSampleMR 报错解决：Error in r$status_code : $ operator is invalid for atomic vectors 生信碱移 r语言
运行以下代码的时候报错：library(TwoSampleMR)ao<-available_outcomes()简单看了下available_outcomes()函数的源码，不是TwoSampleMR的问题，应该是ieugwasr::gwasinfo函数的问题：去ieugwasr包github的issue看了看，发现作者5天前就解决了这个问题：好吧，解决方案就是重新安装一下ieugwasr包#删除
【系统架构设计师】论文：论微服务架构及其应用（高分论文3篇）数据知道系统架构设计师(软考高级)架构系统架构微服务软考高级系统架构设计师论文
更多内容请见：备考系统架构设计师-专栏介绍和目录文章目录论文一摘要正文论文二摘要正文论文三摘要正文论文一摘要我作为系统分析师兼任系统架构师参与了××航空公司物流综合平台4.0的建设工作。该物流平台旨在整合该公司航空物流、仓储、冷链运输、快递、支付、信用等多个相关业务，提供统一的点到点的综合物流配送服务。该综合平台采用了微服务的系统架构进行开发。平台最终在2021年6月初步上线运行，后又陆续进行了4
DeepSeek--通向通用人工智能的深度探索者油泼辣子多加专业名词解释人工智能
一、词源与全称“DeepSeek"由"Deep”（深度）与"Seek"（探索）组合而成，中文译名为"深度求索"。其全称为"深度求索人工智能基础技术研究有限公司"，英文对应"DeepSeekArtificialIntelligenceResearchInstitute"。这一命名体现了企业对深度学习技术与未知领域持续探索的双重追求。二、发展历程初创期（2023）公司成立于中国杭州，创始团队汇聚了来自
【计算机视觉】图像滤波油泼辣子多加计算机视觉计算机视觉人工智能 python 神经网络
1.图像滤波定义图像滤波是一种非常重要的图像处理技术，图像平滑、边缘检测、边缘增强、去除噪声都属于图像滤波，图像滤波是一种基于邻域的算法。通过图像滤波，可以实现图像平滑、边缘检测；图像平滑也叫图像模糊，用以去除图像中的噪声、伪影等，它是图像处理和计算机视觉的常见步骤。函数模糊类型特点使用场景cv.blur均值模糊简单快速，所有像素权重相等基础平滑和降噪cv.GaussianBlur高斯模糊中心权重
linux git clone出现fatal: unable to access Failed to connect to github.com port 443: Timed out解决方案 herosunly C/C++/Linux解决方案 linux git github timeout port 443
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了linuxgitclone出现fatal:unabletoaccessF
Jenkins pipeline共享库的最佳实践 DevOps探索者 Jenkins jenkins 运维
Jenkins共享库使用教程Jenkins共享库（SharedLibraries）是一个功能强大的工具，旨在帮助团队在多个Jenkins项目中重用代码。这使得CI/CD流水线能够更加高效、简洁，并减少重复劳动。通过共享库，你可以将常用的Groovy脚本、步骤、函数等提取到一个公共的位置，使得多个项目都能引用它们。1.什么是Jenkins共享库？Jenkins共享库是一个包含可以在多个Jenkins
[论文笔记] llama-factory 微调qwen2.5、llama3踩坑心心喵论文笔记深度学习人工智能
一、bug1、pre-tokenize的时候,会OOM解决：在yaml文件中添加streaming参数#tokenizestreaming:Truemax_steps:10000https://github.com/hiyouga/LLaMA-Factory/blob/3a023bca2a502810a436cfba7708df164754ea62/src/llamafactory/hparams
YOLOv10涨点改进：特征融合创新 | 多层次特征融合（SDI），小目标涨点明显，| UNet v2，比UNet显存占用更少、参数更少 AI小怪兽 YOLOv10魔术师 YOLO 目标检测算法人工智能目标跟踪
本文独家改进：多层次特征融合（SDI），能够显著提升不同尺度和小目标的识别率如何引入到YOLOv10：1)替代原始的Concat；改进结构图如下：《YOLOv10魔术师专栏》将从以下各个方向进行创新：【原创自研模块】【多组合点优化】【注意力机制】【卷积魔改】【block&多尺度融合结合】【损失&IOU优化】【上下采样优化】【小目标性能提升】【前沿论文分享】【训练实战篇】订阅者通过添加WX:AI_C
YOLO11涨点优化：特征融合创新 | 多层次特征融合（SDI），小目标涨点明显| UNet v2，比UNet显存占用更少、参数更少 AI小怪兽 YOLO11魔术师深度学习目标检测计算机视觉目标跟踪神经网络 python
本文独家改进：多层次特征融合（SDI），能够显著提升不同尺度和小目标的识别率如何引入到YOLO11：1)替代原始的Concat；改进结构图如下：《YOLOv11魔术师专栏》将从以下各个方向进行创新：【原创自研模块】【多组合点优化】【注意力机制】【卷积魔改】【block&多尺度融合结合】【损失&IOU优化】【上下采样优化】【小目标性能提升】【前沿论文分享】【训练实战篇】订阅者通过添加WX:AI_CV
2025毕设springboot 猫舍管理系统分析与设计论文+源码 zhihao508 课程设计 spring boot 后端
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景关于猫舍管理系统的研究，现有研究主要集中在宠物店的信息化管理、宠物医院的业务流程优化以及宠物寄养服务的数字化升级等方面。然而，专门针对猫舍管理系统的分析与设计研究相对较少，尤其是针对猫咪养殖、销售、预约及品种管理等综合功能的系统化研究更为稀缺。当前，许多猫舍仍采用传统的手工管理
SalFAU-Net:显著性目标检测的显著性融合注意U-Net 明初啥都能学会目标检测人工智能计算机视觉
SalFAU-Net:显著性目标检测的显著性融合注意U-Net摘要IntroductionRelatedWorksSalFAU-Net:SaliencyFusionAttentionU-NetforSalientObjectDetection摘要显著目标检测（SOD）在计算机视觉中仍然是一个重要的任务，其应用范围从图像分割到自动驾驶。基于全卷积网络（FCN）的方法在过去几十年里在视觉显著性检测方面
人脸识别的经典深度学习方法明初啥都能学会深度学习人工智能
人脸识别的经典深度学习方法引言1.卷积神经网络（CNN）1.1LeNet1.2AlexNet1.3VGGNet1.4ResNet2.人脸检测2.1Viola-Jones算法2.2基于深度学习的人脸检测3.人脸特征提取3.1主成分分析（PCA）3.2人脸对齐3.2.1基于特征点的对齐3.2.2基于深度学习的对齐4.人脸识别模型4.1传统机器学习方法4.2基于深度学习的方法5.公式解读5.1卷积运算5
100个高质量ChatGPT学术论文写作提示词分享--系列（一）迪娜学姐人工智能深度学习论文阅读
我是娜姐@迪娜学姐，一个SCI医学期刊编辑，探索用AI工具提效论文写作和发表。ChatGPT学术论文写作高质量提示词分享，今天先分享50个，涵盖论文写作、文献综述、研究方法设计、数据分析、学术演讲准备等方面。1.论文写作(ThesisWriting)1.为[研究主题]制定一个引人入胜的论文标题，突出其创新性和重要性。Craftanengagingthesistitlefor[researchtop
100个高质量ChatGPT学术论文写作提示词分享--系列（二）迪娜学姐论文阅读论文笔记人工智能 chatgpt
我是娜姐@迪娜学姐，一个SCI医学期刊编辑，探索用AI工具提效论文写作和发表。ChatGPT学术论文写作高质量提示词分享，之前分享过50个，涵盖论文写作、文献综述、研究方法设计、数据分析、学术演讲准备等方面：100个高质量ChatGPT学术论文写作提示词分享--系列（一）今天继续分享50个，包括论文修改与编辑、写作技巧与提升、参考文献引用及编辑、论文投稿和课题申请：6论文修改与编辑(ThesisR
【附源码】基于flask框架奶茶连锁管理系统 (python+mysql+论文) JAVA程序设计 python flask mysql
本系统（程序+源码）带文档lw万字以上文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义选题背景：
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比