bryant_meng

【Noise-Label】《Learning from Noisy Labels with Deep Neural Networks》

arXiv-2014

文章目录

1 Background and Motivation
2 Advantages
3 Innovations
4 Method

4.1 Bottom-up Noise Model
4.2 Estimating Noise Distribution Using Clean Data
4.3 Learning Noise Distribution From Noisy Data
4.4 Training a Bottom-up Model

4.4.1 Noisy labels only
4.4.2 Noisy and clean data

4.5 Top-down Noise Model
4.6 Reweighting of Noisy Data

5 Experiments

5.1 Datasets
5.2 Deliberate Label Noise

5.2.1 SVHN noisy only
5.2.2 CIFAR-10 noisy only
5.2.3 CIFAR-10 clean + noisy

5.3 CIFAR-10 + Tiny Images
5.4 ImageNet + Web Image Search

6 Conclusion（own）

1 Background and Motivation

CNN 在分类任务上很不错！

However, this achievement is only possible because of large amount of labeled images.

大量的无误的 label 的获取 is a laborious task and takes a lot of time and money.

Our goal is to study the effect label noise on deep networks, and explore simple ways of improvement.

2 Advantages

提出了两种解决方法，然后确实 can improve state-of-the-art recognition models

3 Innovations

propose several simple approaches to training deep neural networks on data with noisy labels

4 Method

bottom-up model：在 base model 上 add additional noisy layer，为了 better match to noisy labels
top-down model ：修改 noisy labels，然后再丢入 base model

4.1 Bottom-up Noise Model

noisy layer 即为 Q，定义如下：

Q 是一个 probability matrix，每项都是 positive，each column sums to one，因为是条件概率，比如有猫、狗、老鼠三类， $y^*$ 为老鼠， $y^*$ 转化为猫、狗、老鼠的概率和应该为 1！

用公式表示即为

$\widetilde{y}$ ：noisy label
$y^*$ ：ground truth
$\widetilde{D}$ ：noisy distribution

确认了这种 motivation，……，网络学出来 $y^*$ ，通过 $Q$ 来 better match to the noisy labels，也即 $\widetilde{y}$

没有 noisy label 的时候，可以设置 $Q$ 为 identity matrix，有 noisy label 后 $Q$ 通过 learning 学到，is linear，可以 backpropagation

加了 noisy layer 后，问题转化为求下面的式子，也即最大化释然估计！更细节的分析可以参考【Noise-Label】《Training a Neural Network Based on Unreliable Human Annotation of Medical Images》

4.2 Estimating Noise Distribution Using Clean Data

matrix Q 是 classes 行 classes 列的，当类别很多的时候，很难用 cross-validation 的方法来估计，那么如何求解呢？
作者的方法，用 clean data $D^*$ 训练出来的模型算一个 confusion matrix，然后用 noisy data $\widetilde{D}$ 训练出来的模型算一个 confusion matrix（confusion matrix 可以参考【Keras-CNN】CIFAR-10 中的 2.7 小节，显示混淆矩阵），两者的差值 should be the noise distribution Q.

有点懵？这样可以吗？答案是可以的
误差来自于下面两个方面

model mistakes
noisy label mistakes

model mistakes 在 clean data 和 noisy data 训练出来的模型中都存在，difference 以后抵消了，然而，第二项 noisy label mistakes 仅 noisy data 训练出来的模型中存在！真是妙哉！！！

下面用公式来规范表示下上述作者的解法，The goal is to estimate the noise distribution of $\widetilde{D}$

M：pre-trained model，应该区分 $D^*$ 和 $\widetilde{D}$ 的
$D^*$ ：clean / clear data
$\widetilde{D}$ ：noisy data
$C^*$ ： $D^*$ 在预训练模型 M 下训练出来的模型的 confusion matrix
$\widetilde{C}$ ： $\widetilde{D}$ 在预训练模型 M 下训练出来的模型的 confusion matrix
$j$ ：模型预测出来的类别， $i$ 表示真正的类别
$c_{ij}^*$ ： $D^*$ 中第 $j$ 类转化为第 $i$ 类的概率
$\widetilde{c}_{ij}$ ： $\widetilde{D}$ 中第 $j$ 类转化为第 $i$ 类的概率

其中 $c_{ij}^*$ 和 $\widetilde{c}_{ij}$ 的关系如下：

$r_{ij}$ denotes $p\left ( y^*=i| \tilde{y}=j \right )$

用 matrix form 如下：

然后用 Bayes’ rule ，把 $r_{ij}$ 转化为 $q_{ji}$

$r_{ij}$ 通过 confusion matrix 的 difference 可以求出， $p(\tilde{y}=j)$ 可以通过标签求出，未知变量 $q_{ji}$ 和 $p (y * = i)$ ，一个方程，两个变量无穷解，好在之前有个约束， $\sum_{j}q_{ji} = 1$ ，这样两个方程两个解，可以求出我们需要的 $q_{ji}$ 了

对于上面形式的 R 的求法，作者说出了其弊端，

也即，如果 $R$ 和 $\widetilde{C}$ 的相关性比较小，那么求逆的操作会放大存在的噪声！

作者用如下的形式来求 $R$ ，通过 L1 正则化，来加入 sparsity prior on R

加这种稀疏的先验也是有道理的，因为现实中的数据 are likely only be mislabeled with small set of other classes（医学图像处理领域就不好说咯，标注成本很高，很耗时）

求出了 $R$ ，就可以根据 Baye’s rule 来求 Noisy Distribution Q 了！

4.3 Learning Noise Distribution From Noisy Data

现实生活中，我们基本不可能有 100% clear data，这样的情况下，如何来评估 noisy distribution Q 呢？
我们用 noisy data 求出来的 noise distribution 为 $\hat{Q}$ ，用 clean data 求出来的为 $Q$ ，两者关系如下
$\hat{Q}C = Q$
$\hat{Q},C,Q$ both probability matrix

作者证明，求 minimize $tr(\hat{Q})$ 的最优解，满足 $\hat{Q} = Q$

矩阵A的迹（用 tr(A) 表示）就等于A的特征值的总和，也即矩阵A的主对角线元素的总和！In practice，作者 $tr(\hat{Q})$ 落地方式为对 $\hat{Q}$ 进行 weight decay 约束！（很想看看 code）

这里意思是，约束 tr( $\hat{Q}$ ) 来使得 $\hat{Q}$ 更好的逼近 $Q$ ，作者证明了约束 tr( $\hat{Q}$ ) 会使得 $\hat{Q}$ 向 $Q$ 靠拢，最优解就是 C 为 identity！

4.4 Training a Bottom-up Model

4.4.1 Noisy labels only

这个图是比较晦涩难懂的！也就是承接 4.3 小节的分析！

红色的线是 $\hat{Q}$ 随着 epoch 变化的情况，初始化为 identity
绿色的线是 $C$ 随着 epoch 变化的情况，初始化为 uniform
很粗的橘色线是 $\hat{Q}C$ 变化的情况

一开始固定 $\hat{Q}$ 为 identity，也就相当于不加 noisy layer 层，
训练到一定的阶段（validation error stops decreasing），来训练 weight decay 的 $\hat{Q}$ （开始训练 noisy layer 层）使得 $\hat{Q}$ 向真实的 $Q$ 逼近，使得 $C$ 向 identity 逼近，这样结果能进一步提升！
最后，validation error 不降的时候停止，防止 over-fitting

最后的结果

$\hat{Q}$ 逼近于 $Q$
$\hat{Q}C$ 逼近于 $Q$
$C$ 逼近于 identity

如果测试 clean data 的时候，我们要 remove $\hat{Q}$ 或者设置为 $I$ ，但是验证 noisy label 的时候，还是需要加上 learned $\hat{Q}$ ！

4.4.2 Noisy and clean data

根据 4.2 节的分析，我们可以很容易的看懂这张图，

第一步，用 clear data 和 noisy data 分别 train 出来一个 model
第二步，计算两个模型的 confusion matrix $\widetilde{C}$ 和 $C^*$
第三步，上一步的结果进行 difference，结果为 R，然后通过 Baye’s rule 进行转换，求出 Q
第四步，用学习到的 Q，作为 noisy layer，fix parameters，可以训练新的模型，noisy layer 之前，model 学到的是 $y *$ ，noisy layer 学到的是 $\widetilde{y}$ ！！！

4.5 Top-down Noise Model

不是改变模型去拟合 noisy label，而是改变 noisy label，Given a noisy label is $i$ , we replace it with vector label $s_i$

S be the conversion matrix consisting from column vectors $s_i$

1）Bottom-up Noise Model 的对数最大似然

2）Top-down Noise Model 的对数最大似然

K is the number of classes

不能直接求 S（原因参考原文）作者用如 $\alpha \cdot I +(1-\alpha)/K$ 的形式来处理，也即 label smoothing！（参考【Inception-v3】《Rethinking the Inception Architecture for Computer Vision》）

4.6 Reweighting of Noisy Data

降低 noisy data 的 weight，来结合 clear data 和 noisy data，这种方式在两种模型中都可以使用

$N_c$ ：the number of clean data
$N_n$ ：the number of noisy data
$\gamma$ ：系数，超参数

5 Experiments

实验两个思路展开
一个是在 clean data 的数据集下，人为加噪声来评估 bottom-up（clean、noisy版）和 top-down 两种结构（5.2 小节）
二是在 noisy data 的数据下，也即不晓得 noisy distribution（5.3 小节）

5.1 Datasets

1）SVHN（32x32 images，600k for training，26k for testing）

2）CIFAR-10

all data are clean

3）CIFAR-10 with Tiny Images dataset

4）ImageNet with noisy images download from web search engines
其中1.3 M clean，1.4 noisy images 根据关键字在网上搜索，剔除掉和 imagenet 重合的部分！！！

5.2 Deliberate Label Noise

5.2.1 SVHN noisy only

（a）、（b）从不同的 training size 和 percentage of incorrect labels 两个角度来观测 test error！（a）50%，（b）100k
bottom-up 结果总比 normal model 好，top-down 不尽人意
bottom-up（ground truth）表示Q用gt的 noisy distribution，因为 SVHN 是干净的数据，噪声是自己加的，所以知道 noisy distribution
训练 bottom-up（learned）的时候，前 5 个 epoch fixed，后100个 learned，weight decay 0.05
bottom-up（gt）和（learned）55开，说明作者的这种 idea 是 work 的，下面的图很好说明（estimated $\hat{Q}$ 的介绍请看 5.2.3 小节）

下面一个图尽显 bottom-up 模型的优势（颜色越深，error 越高）

从我画的红线中可以看出，

correct 50k 和 incorrect 40k 时（两条横线），明显 bottom-up 好
bottom-up 在 correct 30k 和 incorrect 50k 时，能达到 normal correct 50k 和 incorrect 40k 同样的正确率！

5.2.2 CIFAR-10 noisy only

前 50 epoch fixed $\hat{Q}$ ，后 70 epoch update $\hat{Q}$ ，weight decay 0.05 or 1

5.2.3 CIFAR-10 clean + noisy

20 k clean data estimate Q
30 k noisy data 来 train final model

1）用 20 k 中的 10 k clean data 来 train 一个 model，30% test error，这就是 model mistakes
2）在 model 上，用剩下的 10 k clean data 和 30 k noisy data 来算 two confusion matrix，difference 以后的结果为 R，然后计算出Q，名为 estimate $\hat{Q}$ ，下图的 estimate $\hat{Q}$ 有50%的噪声，estimate $\hat{Q}$ 和 true Q 相差不是很大！说明这个方法的可行性！

3）用 estimated $\hat{Q}$ 就可以来 train 带有 noisy label 的 data 了！

这个表可以看出，estimated 这种方式最 work，true Q 和 estimate $\hat{Q}$ 都是 fixed parameters 来 trained new model 的！！！

5.3 CIFAR-10 + Tiny Images

CIFAR-10 was originally created by cleaning up a subset of Tiny Images

50 k from CIFAR-10
150 k noisy data from excluded set of Tiny Images

bottom-up model：前 50 epoch fixed $\hat{Q}$ ，后 epoch update $\hat{Q}$ with no weight decay
top-down model： $\alpha = 0.5$

两种模型结合， $\gamma = 0.2$ 时效果最好！给 noisy label 加权，看下效果

第四列对应着 figure 7，可以看出 bottom up 的效果一般，top-down 反而好，作者给出的解释是，因为 extra data 中有太多的非 10类的图片，violate the noise model ，而 top-down 表现好的原因是 impose a more uniform label distribution on these outside images！！！

作者用最后一列的实验来验证了他上述的 hypothesis，150k random 的label 为 uniform label，相当于 $\alpha=0.1$ ，里面 not just the excluded set（Tiny Images），效果确实不错！如下是作者对 $\alpha=0.1$ 的总结！！！

5.4 ImageNet + Web Image Search

作者应该只用 1.5 M 的clean data来 train model，然后 extra data 是配合 clean data 一起训练的

从第三行和第四行看出，联合 data train 并不能提高 performance，相对只 train clean data
从四五行可以看出，改变 noisy data 的权重，升了 1.4 个点，厉害
从黄色的部分可以看出，1.4 M noisy data 加权的效果和 15 M full ImageNet 的相仿，amazing

This demonstrates that noisy data can be very beneficial for training.

6 Conclusion（own）

bottom-up（clean，noisy 版）
top-down（label smoothing 5.3小节）
reweighting of Noisy Data（提升明显，5.4小节）

bottom-up clean 版（手头有100%的clean data）

bottom-up noisy版（手头的数据不干净，weight decay on Q）

图像处理篇---图像预处理 Ronin-Lotus 图像处理篇深度学习篇程序代码篇图像处理人工智能 opencv python 深度学习计算机视觉
文章目录前言一、通用目的1.1数据标准化目的实现1.2噪声抑制目的实现高斯滤波中值滤波双边滤波1.3尺寸统一化目的实现1.4数据增强目的实现1.5特征增强目的实现：边缘检测直方图均衡化锐化二、分领域预处理2.1传统机器学习（如SVM、随机森林）2.1.1特点2.1.2预处理重点灰度化二值化形态学操作特征工程2.2深度学习（如CNN、Transformer）2.2.1特点2.2.2预处理重点通道顺序
深度学习五大模型：CNN、Transformer、BERT、RNN、GAN详细解析深度学习
卷积神经网络（ConvolutionalNeuralNetwork,CNN）原理：CNN主要由卷积层、池化层和全连接层组成。卷积层通过卷积核在输入数据上进行卷积运算，提取局部特征；池化层则对特征图进行下采样，降低特征维度，同时保留主要特征；全连接层将特征图展开为一维向量，并进行分类或回归计算。CNN利用卷积操作实现局部连接和权重共享，能够自动学习数据中的空间特征。适用场景：广泛应用于图像处理相关的
大模型黑书阅读笔记--第一章 53年7月11天大模型黑书笔记人工智能自然语言处理语言模型
cnn,rnn达到了极限，憋了三十年（这段时间已经有注意力了，并且注意力也加到了cnn，rnn中，但没啥进展）憋来了工业化最先进的transformertransformer的核心概念可以理解为混合词元（token），rnn通过循环函数顺序分析次元，而transformer模型不是顺序分析，而是将每个词元与序列中其他词元关联起来。为突破cnn的极限，注意力的概念出来了：cnn做序列处理时只关注最后
锂电池剩余寿命预测 | 基于CNN-BiLSTM的锂电池剩余寿命预测研究附Matlab参考代码默默科研仔锂电池寿命预测 cnn matlab 人工智能
基于CNN-BiLSTM的锂电池剩余寿命预测研究附Matlab参考代码一、引言1.1、研究背景和意义锂电池因其高能量密度和长循环寿命，在移动设备、电动汽车和储能系统等领域得到广泛应用。准确预测锂电池的剩余寿命（RemainingUsefulLife,RUL）对于优化电池使用、维护和管理具有重要意义，可以有效减少运营成本，提高设备的安全性和可靠性。随着锂电池应用领域的扩展，对其性能和寿命的预测需求日
请编写一个Python程序，实现WOA-CNN-BiLSTM鲸鱼算法优化卷积双向长短期记忆神经网络多输入单输出回归预测功能。 2301_81121233 算法神经网络 python mongodb storm zookeeper spark
实现一个基于鲸鱼优化算法（WOA）优化的卷积双向长短期记忆神经网络（CNN-BiLSTM）的多输入单输出回归预测功能是一个复杂的任务，涉及到多个步骤和组件。由于完整的实现会非常冗长，我将提供一个简化的框架和关键部分的代码示例，帮助你理解如何实现这个功能。请注意，这个示例不会包含所有细节，比如数据集的准备、鲸鱼优化算法的具体实现（WOA是一个元启发式算法，需要单独实现或引用现有库），以及CNN-Bi
【Attention】SEAttention shanks66 Attention 各种深度学习模块人工智能深度学习 python
SEAttention摘要卷积神经网络（CNNs）的核心构建模块是卷积算子，它使网络能够通过在每一层的局部感受野内融合空间和通道信息来构建有价值的特征。此前大量研究聚焦于这种关系中的空间成分，试图通过在整个特征层级中提升空间编码质量来增强CNN的表征能力。在这项工作中，我们将重点放在通道关系上，并提出一种新颖的架构单元，称为“挤压与激励”（Squeeze-and-Excitation，简称SE）模
【sklearn 04】DNN、CNN、RNN @金色海岸 sklearn dnn cnn
DNNDNN（DeepNeuralNetworks，深度神经网络）是一种相对浅层机器学习模型具有更多参数，需要更多数据进行训练的机器学习算法CNNCNN（convolutionalNeuralNetworks，卷积神经网络）是一种从局部特征开始学习并逐渐整合的神经网络。卷积神经网络通过卷积层来进行特征提取，通过池化层进行降维，相比较全连接的神经网络，卷积神经网络降低了模型复杂度，减少了模型的参数，
【大模型开发】大模型转换为 NCNN 格式并在微信小程序中进行调用云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习微信小程序小程序 NCNN 小程序调用大模型大模型部署大模型优化部署微信小程序
以下内容将介绍如何将大模型转换为NCNN格式并在微信小程序中进行调用。我们会从整体流程、模型转换工具、NCNNWebAssembly（WASM）编译与集成、小程序前端代码示例等方面进行详细讲解，并在最后给出优化方向与未来建议。目录背景与整体流程概述准备工作2.1常见模型格式与转换思路2.2环境与工具安装模型转换为NCNN格式3.1以ONNX模型为例3.2使用onnx2ncnn工具NCNN在微信小程
java实现卷积神经网络CNN（附带源码） Katie。 Java 实战项目 java
Java实现卷积神经网络（CNN）项目详解目录项目概述1.1项目背景与意义1.2什么是卷积神经网络（CNN）1.3卷积神经网络的应用场景相关知识与理论基础2.1神经网络与深度学习概述2.2卷积操作与卷积层原理2.3激活函数与池化层2.4全连接层与损失函数2.5前向传播、反向传播与梯度下降项目需求与分析3.1项目目标3.2功能需求分析3.3性能与扩展性要求3.4异常处理与鲁棒性考虑系统设计与实现思路
MobileNet家族：从v1到v4的架构演进与发展历程彩旗工作室人工智能架构人工智能机器学习 cnn 卷积神经网络
MobileNet是一个专为移动设备和嵌入式系统设计的轻量化卷积神经网络（CNN）家族，旨在在资源受限的环境中实现高效的图像分类、对象检测和语义分割等任务。自2017年首次推出以来，MobileNet经历了从v1到v4的多次迭代，每一代都在计算效率、模型大小和准确性上取得了显著进步。本文将详细探讨MobileNetv1、v2、v3和v4的原理、架构设计及其发展历程，并分析其关键创新和性能表现。Mo
Vision Transformer (ViT) 详细描述及 PyTorch 代码全解析 AIGC_ZY CV transformer pytorch 深度学习
VisionTransformer(ViT)是一种将Transformer架构应用于图像分类任务的模型。它摒弃了传统卷积神经网络(CNN)的卷积操作，而是将图像分割成patches，并将这些patches视为序列输入到Transformer编码器中。ViT的处理流程输入图像被分割成多个固定大小的patch，每个patch经过线性投影变成嵌入向量，然后加上位置编码。接着，这些嵌入向量会和类别标签（c
YOLOv5+UI界面在车辆检测中的应用与实现深度学习&目标检测实战项目 YOLOv5实战项目 YOLO ui 分类数据挖掘目标跟踪人工智能
1.引言随着智能交通系统（ITS）的快速发展，车辆检测已成为计算机视觉领域的重要研究方向。车辆检测技术广泛应用于交通流量监控、车辆违章抓拍、无人驾驶等场景中。近年来，深度学习技术的突破，特别是卷积神经网络（CNN）的崛起，使得目标检测技术取得了显著进展。其中，YOLO（YouOnlyLookOnce）系列模型以其高效的实时检测能力和出色的性能成为车辆检测领域的首选方法之一。在本文中，我们将基于YO
YOLO11改进-模块-引入多尺度差异融合模块MDFM 一勺汤 YOLOv11模型改进系列深度学习人工智能 YOLO YOLOv11 目标检测模块改进
遥感变化检测（RSCD）专注于识别在不同时间获取的两幅遥感图像之间发生变化的区域。近年来，卷积神经网络（CNN）在具有挑战性的RSCD任务中展现出了良好的效果。然而，这些方法未能有效地融合双时相特征，也未提取出对后续RSCD任务有益的有用信息。此外，它们在特征聚合中没有考虑多层次特征交互，并且忽略了差异特征与双时相特征之间的关系，从而影响了RSCD的结果。为解决上述问题，本文通过孪生卷积网络提取不
YOLO优化之扫描融合模块（SimVSS Block）清风AI 人工智能计算机视觉 YOLO 目标检测深度学习目标跟踪
研究背景在自动驾驶技术快速发展的背景下，目标检测作为其核心组成部分面临着严峻挑战。驾驶场景中目标尺度和大小的巨大差异，以及视觉特征不显著且易受噪声干扰的问题，对辅助驾驶系统的安全性构成了潜在威胁。传统的卷积神经网络（CNN）虽然在目标检测领域取得了显著进展，但仍存在局限性，如局部关注性导致难以有效检测不同尺度的目标。为克服这些问题，研究人员开始探索将状态空间模型（SSM）引入目标检测领域，以期提高
《Python深度学习》第四讲：计算机视觉中的深度学习 earthzhang2021 2025讲书课专栏 python 深度学习计算机视觉 1024程序员节 numpy 算法人工智能
计算机视觉是深度学习中最酷的应用之一，它让计算机能够像人类一样“看”和理解图像。想象一下，计算机可以自动识别照片中的物体、人脸，甚至可以读懂交通标志。这一切听起来是不是很神奇？其实，这一切都离不开深度学习中的卷积神经网络（CNN）。今天，我们就来深入了解一下CNN是如何工作的。5.1卷积神经网络简介先来看下卷积神经网络（CNN）是什么。CNN是一种专门用于处理图像数据的神经网络。它的灵感来源于人类
基于人工智能的智能视频内容分析系统小彭律师 python
基于人工智能的智能视频内容分析系统系统功能1.视频数据预处理降噪与滤波：去除视频画面中的噪点和干扰画质增强：调整亮度、对比度和色彩平衡关键帧提取：减少数据量，提取关键信息2.目标识别检测基于深度学习模型（YOLO、FasterR-CNN等）识别多种目标类型（人、车辆、物品等）适应不同光照、角度和遮挡情况输出目标位置、类别和置信度3.行为分析研判基于时序模型（LSTM、3D-CNN等）分析目标动作规
深度学习项目--基于DenseNet网络的“乳腺癌图像识别”，准确率90%+，pytorch复现羊小猪~~ 深度学习网络 pytorch 人工智能 python 机器学习分类
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊前言如果说最经典的神经网络，ResNet肯定是一个，从ResNet发布后，很多人做了修改，denseNet网络无疑是最成功的一个，它采用密集型连接，将通道数连接在一起；本文是基于上一篇复现DenseNet121模型，做一个乳腺癌图像识别，效果还行，准确率0.9+;CNN经典网络之“DenseNet”简介，源码研究与复现(pytorch)：
卷积神经网络可视化天行者@ cnn 人工智能神经网络
卷积神经网络（CNN）的可视化是理解模型行为、调试性能和解释预测结果的重要工具。以下从技术原理、实现方法和应用场景三个维度，系统梳理CNN可视化的核心技术，并提供代码示例和前沿方向分析：一、CNN可视化的核心维度1.卷积核可视化原理：提取卷积层的权重，将其转换为图像形式，观察滤波器学习到的模式。实现步骤：提取卷积层权重（形状为[out_channels,in_channels,kernel_siz
基于YOLOv5的车牌识别系统：从数据集到UI界面的实现深度学习&目标检测实战项目 YOLOv5实战项目 YOLO ui 分类数据挖掘目标跟踪
1.引言随着智能交通系统的发展，车牌识别技术已成为交通管理、停车场自动化、路面监控等应用中的关键技术之一。车牌识别系统（LicensePlateRecognition,LPR）主要用于识别车辆的车牌号码，并将其转化为可以进一步处理的数据。车牌识别系统通常由图像处理、字符识别、目标检测等多种技术组成。近年来，随着深度学习技术的飞速发展，基于卷积神经网络（CNN）的目标检测算法，如YOLO（YouOn
卷积神经网络中的卷积操作 m0_61360701 深度学习 cnn 深度学习人工智能
1.什么是卷积操作？在卷积神经网络（CNN）中，卷积操作是一种数学运算，它的目的是从图像（或其他数据）中提取局部特征。简单来说，卷积就像是用一个小的“扫描仪”在图像上滑动，每次扫描一小块区域，并从中提取有用的信息。2.卷积操作的类比：印章想象你有一张纸和一个印章。印章是一个小的图案，比如一个简单的形状（圆形、方形等）。当你把印章按在纸上时，印章会与纸上的内容接触，并留下一个印记。然后你移动印章，重
卷积神经网络（CNN）详解：从原理到应用的全景解析彩旗工作室人工智能 cnn 人工智能神经网络卷积神经网络
一、定义与核心特征卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专为处理网格状数据（如图像、视频）设计的深度前馈神经网络，其核心特征包括：局部连接：卷积层神经元仅与输入数据的局部区域连接，减少参数数量；权重共享：同一卷积核在整个输入数据上滑动，增强平移不变性；层级特征提取：从低级特征（边缘、纹理）到高级特征（物体部件）的逐层抽象。二、历史演进与关键突破1960年
【光流】——liteflownet论文与代码浅读农夫山泉2号光流计算机视觉深度学习人工智能光流 liteflownet
光流，liteflownetcode:mmflowCVPR20181.前言FlowNet2是最先进的光流估计卷积神经网络(CNN)，需要超过160M的参数来实现精确的流量估计。在本文中，我们提出了一种替代网络，它在Sintel和KITTI基准测试上优于FlowNet2，同时在模型尺寸上要小30倍，在运行速度上要快1.36倍。这是通过深入研究当前框架中可能被遗漏的架构细节而实现的：（1）我们通过轻量
AttributeError: ‘NoneType‘ object has no attribute ‘astype‘ 冰虺 python
今天在复现fasterRCNN网络时，出现AttributeError:'NoneType'objecthasnoattribute'astype'报错，如下图所示通过dug,发现im的shape为none,究其原因是因为cv.imread无法读取图像，主要原因是因为我数据集中存在中文名称。更加详细的请参考一下大佬的博客pythoncv2.imread读取中文路径的图片返回为None的问题_陶将的
Faster R-CNN原理详解以及Pytorch实现模型训练与推理阿_旭深度学习实战 cnn pytorch 人工智能 Faster RCNN
《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体检测系统开发】5.【图片风格快速迁移软件开发】6.【人脸表表情识别系统】7.【YOLOv8多目标识别与自动标注软件开发】8.【基于深度学习的行人跌倒检测系统】9.【基于深度学习的PCB板缺陷检测系统
PointNet++改进策略：模块改进 | x-Conv | PointCNN，结合局部结构与全局排列提升模型性能我是瓦力 PointNet++改进策略人工智能深度学习计算机视觉
目录前言PointCNN实现细节1.XXX-Conv操作输入输出步骤2.PointCNN网络架构层级卷积分类与分割任务3.数据增强4.效率优化前言这篇论文介绍了一种名为PointCNN的方法，旨在从点云（pointcloud）数据中学习特征。传统卷积神经网络（CNN）在处理规则网格数据（如图像）时非常有效，但由于点云是无序且不规则的，直接在其上应用卷积操作会导致形状信息丢失，并对点的排列顺序敏感。
《自然语言处理实战入门》深度学习 ---- 预训练模型初探 shiter AI重制版】预训练 NLP 自然语言处理
文章大纲前言预训练模型简介语言表示学习神经上下文编码器为何需要预训练模型发展历史主流预训练模型预训练模型与分类将PTMs应用至下游任务微调策略未来研究方向参考文献前言随着深度学习的发展，各种神经网络被广泛用于解决自然语言处理(NLP)任务，如卷积神经网络(convolutionalneuralnetworks,CNNs)、递归神经网络(neuralnetworks,RNNs)、基于图的神经网络(g
池化的定义与核心思想 code 旭 AI人工智能学习 python numpy 人工智能
一、池化的定义与核心思想定义：池化是卷积神经网络（CNN）中的一种下采样操作，用于降低特征图的空间维度（宽高），保留主要特征。核心目标：减少计算量：缩小特征图尺寸，降低后续层参数规模。增强模型鲁棒性：对微小平移、旋转等变化不敏感。防止过拟合：通过降维减少冗余信息。二、池化的数学公式1.最大池化（MaxPooling）取池化窗口内的最大值：yi,j=max⁡p=0kh−1max⁡q=0kw−1xi⋅
卷积神经网络（笔记01）天行者@ cnn 人工智能深度学习
视觉处理三大任务：分类、目标检测、图像分割CNN网络主要有三部分构成：卷积层（ConvolutionalLayer）、池化层（PoolingLayer）和激活函数一、解释卷积层中的偏置项是什么，并讨论在神经网络中引入偏置项的好处。在卷积神经网络（CNN）的卷积层里，卷积操作本质上是输入数据与卷积核（滤波器）进行逐元素相乘再求和的过程。偏置项（Bias）是一个额外的可学习参数，对于每个卷积核而言，都
深度解析：DETR的多尺度特征融合 AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
"深度解析：DETR的多尺度特征融合"作者：禅与计算机程序设计艺术1.背景介绍1.1目标检测的挑战与传统方法的局限性目标检测是计算机视觉领域中的一个基本任务，其目标是识别图像或视频中所有感兴趣的目标，并确定它们的位置和类别。传统的目标检测方法，如FasterR-CNN和YOLO，通常依赖于预定义的锚框或候选区域来生成目标proposals。然而，这些方法存在一些固有的局限性：人工先验知识:锚框的设
PyTorch实现CNN：CIFAR-10图像分类实战教程吴师兄大模型 PyTorch pytorch cnn CIFAR-10图像分类人工智能 python 卷积神经网络开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D