AIHGF

论文阅读学习 - CurriculumNet: Weakly Supervised Learning from Large-Scale Web Images

原文：论文阅读学习 - CurriculumNet: Weakly Supervised Learning from Large-Scale Web Images - AIUAI

论文：CurriculumNet: Weakly Supervised Learning from Large-Scale Web Images - ECCV2018

作者：Sheng Guo, Weilin Huang, Haozhi Zhang, Chenfan Zhuang, Dengke Dong, Matthew R. Scott, Dinglong Huang

团队：码隆科技

实现：

1. 主要点

对于大规模网络图像数据的半监督学习
利用课程学习(curriculum learning)实现的原则性学习策略(principled learning strategy)，以有效的处理大量噪声标签(noisy labels) 和数据不均衡(data imbalance) 问题.
设计新的课程学习方法，通过在特征空间中数据的分布密度(distribution density)，评估数据的复杂度；并以无监督的方式对数据复杂度进行排名.
实验说明，高度噪声标签也能够作为一种正则方法，提升模型的泛化能力.

2. 目标

有效的处理大规模网络图像数据集中存在大量噪声标签和数据不均衡的问题.

3. CurriculumNet

基于课程学习的思想，其类似于人类的学习过程，模型从简单的问题开始学起，然后逐渐学习越来越复杂的任务问题.

CurriculumNet 中设计了一种无监督课程学习方法，如图 Fig.2，逐渐的增加噪声标签数据的数据量. 主要包括三步：

[1] - 初始特征生成(initial features generation);

首先，采用全部的训练数据，学习初始模型；然后，利用训练的模型计算训练数据集中每一张图像的深度特征表示(如，FC 层输出特征).

[2] - 课程设计(curriculum design);

训练的初始模型旨在粗略地将训练图像映射到特征空间，以挖掘每一类别内图像的潜在结构及潜在关系; 其提供了定义图像复杂度的有效方法.

对定义的图像复杂度进行分析，以设计学习课程. 其中，每一类别内所有图像，根据复杂度次序，被划分为多个子集.

[3] - 课程学习(curriculum learning).

基于设计的课程，进行课程学习. 即，

首先从包含全部类别的简单数据子集开始训练 CNNs 模型. 这里，假设在简单数据子集中包含更多的准确标签的干净图像.

然后，在训练过程中逐渐连续的添加复杂度越来越高的数据，来提升模型的识别能力.

3.1. 课程设计(Curriculum Design)

Curriculum Learning - ICML2009

Yoshua Bengio

设计课程学习的目标是：能够以无监督的方式对训练图像由简单到复杂进行排序.

这里，采用基于密度聚类算法(density based clustering algorithm)，根据数据分布密度(data distribution density) 评估训练样本的复杂度.

具体地，将全部训练数据集划分为多个数据子集，并将数据子集由简单到复杂进行排名，其中简单数据子集中包含更多标签更可靠的干净图像；而复杂数据子集则包含更多大量的噪声标签.

Clustering by fast search and find of density peaks - 2014Science

根据基于密度聚类算法，对每一类别图像数据集进行处理.

[1] - 首先，对全部训练数据集训练 Inception_V2 模型，作为初始模型;

[2] - 然后，基于初始模型的 fc 层特征，将每一类别内的全部图像，投影到深度特征空间. 对于每张图像 $P_i \rightarrow f(P_i)$ .

[3] - 接着，计算欧氏距离矩阵 $\in \mathcal{R} ^{n \times n}$ :
$D_{ij} = ||f(P_i) - f(P_j)||^2$
其中， $n$ 为当前类别中图像数； $D_{ij}$ 表示图像 $P_i$ 和 $P_j$ 之间的相似性( $D_{ij}$ 值越小，则 $P_i$ 和 $P_j$ 月相似).

[3-1] - 对于每张图像，计算局部密度(local density) $\rho _i$ :
$\rho _i = \sum_j X(D_{ij} - d_c)$
其中，
$\begin{cases} 1 & d<0 \\ 0 &\text{other} \end{cases}$
$d_c$ 是通过对 $\in \mathcal{R} ^{n \times n}$ 中的 $n^2$ 个距离值从小到大进行排列，并选取前 $k$ % 得到的. 这里 $k = 60$ .

$\rho _i$ 是与 $i$ 的距离值小于 $d_c$ 的样本数.

易知，正确标签组成的干净图像通常具有相对相似的视觉表征，其在特征投影空间里会具有较大的局部密度值.

反之，噪声图像往往具有明显的视觉差异性，在特征投影空间里一般是稀疏分布，具有较小的密度值.

[3-2] - 对于每张图像，定义距离 $\delta _i$ :
$\begin{cases} min_{j:p_j>p_i}(D_{ij}) & \text{if } \exists j, \text{ s.t. } \rho_j > \rho_i \\ max(D_{ij}) &\text{otherwise} \end{cases}$
即，如果存在图像 $I_j$ ，其 $\rho_j > \rho_i$ ，则， $\delta _i$ 等于 $D_{i \hat{j}}$ . 其中， $\hat{j}$ 是数据集中与 $i$ 最接近的样本. 否则， $\delta_i$ 等于所有密度中的最大值， $\rho _j$ 是 $i$ 与数据点之间的距离，且与 $i$ 的距离最大的值.

因此，具有最大局部密度值的数据点的 $\delta$ 值最大，并被作为该类别图像的聚类中心.

对于每一类别内的图像，如果其与计算的聚类中心距离越近，则具有更高的正确标签的置信度. 因此，可以简单的采用 k-mean 算法，根据数据样本与聚类中心之间的距离 $D_{cj}$ ，将数据样本划分为多个聚类. 其中， $c$ 为聚类中心.

如图 Fig 3(左) 为 WebVision 数据集中 cat 类别所有图像的 $\delta - \rho$ 图.

对于每一类的图像数据集，生成三个聚类，并将每个聚类的图像作为数据子集.

由于，每个聚类都包含一个密度值来度量其数据分布，以及不同聚类间的关系(relationship). 因此，很容易定义每个数据子集的复杂度，给定课程学习的设计规则.

具有高密度值的数据子集中，所有的图像在特征空间中更彼此接近，表明这些图像具有更强的相似性. 故，定义该数据子集为干净的，具有更多正确的类别标签；

具有低密度值的数据子集中，所有的图像具有较大的视觉表征差异性，其可能包含更多不正确标签的不相关图像. 故，定义该数据子集为噪声的.

此时，既可以得到三个复杂度不同的数据子集：clean, noisy, highly noisy. 每个图像类别包含相同的数据子集数，将其所有图像类组合为最终的课程学习数据集. 如图 Fig.3(左)

3.2. 课程学习(Curriculum Learning)

设计的课程能够以无监督的方式，基于图像的视觉表征来挖掘潜在的数据结构.

这里，设计 multi-stage 学习方案，如图 Fig.3(右). 通过连续地混合从干净数据子集到高度噪声数据子集的三个阶段，训练 CNN 模型.

[1] - 首先，仅基于干净数据子集训练 Inception_V2 模型，其中，数据子集中，每一类别图像具有更接近的视觉表征，有助于模型学习图像的基本的，及干净的视觉信息，以作为后续处理的基础特征.

[2] - [1] 中 Inception_V2 模型训练收敛后，添加噪声数据，继续学习过程. 此时，图像包含更明显的视觉差异性，使得模型能够学习困难样本的更有意义和判别性更强的特征.

虽然噪声数据包含不正确的类别标签，但其仍粗略的保持着数据的主要结构，故有助于模型能力提升.

[3] - 继续添加 highly noisy 的噪声数据，进一步训练模型. highly noisy 的数据集中包含大量的类别标签不正确的视觉不相关图像.

前两个阶段 [1] 和 [2] 课程学习的深度特征能够挖掘数据的主要潜在结构.

论文作者发现，highly noisy 的数据子集并没有对学习的数据结构产生负面影响. 相反，其可以提高模型的泛化能力，使提供一种正则化方式，使得模型避免对于干净数据出现过拟合.

当最终模型训练收敛后，三个数据子集均被利用.

此外，在训练时，对于不同数据子集的样本，在 [2] 和 [3] 阶段的训练，设置类不同的 loss 权重，对于 clean, noisy 和 highly noisy 数据子集，权重分别为 1, 0.5, 0.5.

4. 实现细节

4.1. 训练参数

数据集：WebVision Datasets.

网络模型：Inception with batchnormalization(bn-inception).

训练参数：

[1] - SGD 优化算法，batchsize=256，RMSprop 算法.

[2] - 学习率从 0.1 开始，然后在 $30 \times 10^4$ ， $50 \times 10^4$ ， $60 \times 10^4$ ， $65 \times 10^4$ ， $70 \times 10^4$ 次迭代时，分别将学习力衰减 10x 倍. 训练过程总迭代次数 $70 \times 10^4$ .

[3] - 数据增强，random cropping, scale jittering, ratio jittering.

[4] - 在 global pool 层后接 dropout 层，dropout_ratio=0.2.

4.2. 数据均衡

对于 WebVision 数据集，存在严重的数据不均衡问题. 例如，对于很多大类别的图像数据样本超过 10000 张，而对于小类别的图像数据样本少于 400 张.

直接采用 CNN 模型进行训练，会导致模型偏向于样本较多的大类别.

对此，这里提出 two-level 数据均衡方法：subset-level balance 和 category-level balance.

[1] - subset-level balance

每个 mini-batch 中，对于 stage 1-3，训练样本的选择分别为：(256, 0, 0), (128, 128, 0) 和 (128, 64, 64).

[2] - category-level balance

每个 mini-batch 中，首先从 1000 个类别随机选择 256(stage1)，128(stage 2 和 3) 个类别；然后，对于每个选择的类别，仅随机选取其中的一个样本.

注：category-level balance 仅在干净的数据子集上进行. 在噪声数据子集上进行时，模型表现会下降. 因为，从每一类别图像中随机选取一个样本，其很可能得到单个，但完全不相关的样本，其对于模型训练有负面影响.

4.3. Multi-scale 卷积核

在网络的第一个卷积层，采用了三种不同 kernel 尺寸：5x5, 7x7, 9x9. 然后，将三种 kernel 得到的卷积 maps 进行组合，以得到第一个卷积层的最终输出 feature maps.

Multi-scale 卷积核有助于在第一层增强 low-level 的特征，在 WebVision 数据上的 top-5 errors 有 0.5% 的精度提升.

5. Results

5.1. 不同训练策略

基于 Inception_V2 模型，尝试了四种不同的训练策略：

[1] - Model-A - 直接在整个训练数据集进行模型训练；

[2] - Model-B - 仅在干净的数据子集进行模型训练；

[3] - Model-C - 采用提出的课程学习策略进行模型训练，只采用 2-subset 数据子集课程学习，clean 和 noisy 数据子集.

[4] - Model-D - 采用提出的课程学习策略进行模型训练，采用 3-subset 数据子集课程学习，clean，noisy 和 highly noisy 数据子集.

5.2. 不同的聚类算法

Fig 4(右).

5.3. WebVision 竞赛最终结果

六种模型的集成结果.

Inception v2, Inception v3, Inception v4，Inception resnet v2模型.

5.4. 不同方法对比

5.5. WebVision+ImageNet 更多干净数据

你可能感兴趣的:(图像分类)

番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图亚图跨际 Python 交叉知识算法量化检查图像压缩质量低分辨率多光谱峰值信噪比端到端优化图像压缩手术机器人三维实景实时可微分渲染重建三维可视化
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现超分辨率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG图像相似性近似算法图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU变速图像压缩手术机器人深度估计算法重建三维可视化推理图像超分辨率算法模型三维实景实时可微分渲染算法MATLAB结构
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
基于Pytorch框架的CIFAR-10图像分类任务（附带完整代码）难得北窗高卧 pytorch 人工智能 python 深度学习
本文主要实现在pytorch框架下，训练CIFAR数据集，通过观察训练和验证的误差、准确率图像来进一步改善。保存最好的模型。测试集打印整体准确率和每一类别的准确率，并生成混淆矩阵，将其中每一个错误的图片并保存下来。语言：python实现方式：pytorch框架,CPU关键词:CIFAR-10数据集、Dataset和Dataloader、SummaryWriter画图、网络模型搭建、混淆矩阵、统计所
验证resneXt，densenet，mobilenet和SENet的特色结构 dfj77477 人工智能 python
简介图像分类对网络结构的要求，一个是精度，另一个是速度。这两个需求推动了网络结构的发展。resneXt：分组卷积，降低了网络参数个数。densenet：密集的跳连接。mobilenet：标准卷积分解成深度卷积和逐点卷积，即深度分离卷积。SENet：注意力机制。简单起见，使用了[1]的代码，注释掉layer4，作为基本框架resnet14。然后改变局部结构，验证分类效果。实验结果GPU：gtx107
基于深度学习的对抗样本生成与防御 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的对抗样本生成与防御是当前人工智能安全领域的关键研究方向。对抗样本是通过对输入数据进行微小扰动而产生的，能够导致深度学习模型做出错误预测。这对图像分类、自然语言处理、语音识别等应用构成了严重威胁，因此相应的防御措施也在不断发展。1.对抗样本生成对抗样本生成的方法主要有两大类：基于梯度的方法和基于优化的方法。1.1基于梯度的方法这些方法利用模型的梯度信息，通过细微的扰动来生成对抗样本，迫
【Python】成功解决TypeError: list indices must be integers or slices, not str 高斯小哥 BUG解决方案合集 python list 新手入门学习 debug
【Python】成功解决TypeError:listindicesmustbeintegersorslices,notstr欢迎进入我的个人主页，我是高斯小哥！博主档案：广东某985本硕，SCI顶刊一作，深耕深度学习多年，熟练掌握PyTorch框架。技术专长：擅长处理各类深度学习任务，包括但不限于图像分类、图像重构(去雾\去模糊\修复)、目标检测、图像分割、人脸识别、多标签分类、重识别(行人\车辆
Transformer+目标检测，这一篇入门就够了 BIT可达鸭 ▶深度学习-计算机视觉 transformer 深度学习目标检测计算机视觉自然语言处理
VisionTransformerforObjectDetection本文作者：Encoder-Decoder简介：Encoder-Decoder的缺陷：Attention机制：Self-Attention机制：Multi-HeadAttention：Transformer结构：图像分类之ViT：图像分类之PyramidViT：目标检测之DETR：目标检测之DeformableDETR：本文作者：
经典网络训练图像分类模型一三十度角阳光的问候分类数据挖掘人工智能
目录数据预处理部分：网络模块设置：网络模型保存与测试数据读取与预处理操作制作好数据源：读取标签对应的实际名字加载models中提供的模型，并且直接用训练的好权重当做初始化参数模型参数更新把模型输出层改成自己的设置哪些层需要训练优化器设置数据预处理部分：-数据增强：torchvision中transforms模块自带功能，比较实用-数据预处理：torchvision中transforms也帮我们实现
识别实验笔记和经验总结 Wils0nEdwards 笔记
1.跑对比实验之前，首先保证对比的公平性和可靠性！在进行图像分类模型对比实验时，为了确保对比的公平性和可靠性，以下几个因素需要重点考虑：数据集的一致性：数据集分割：确保训练集、验证集和测试集的划分是一致的。各模型使用相同的训练数据和测试数据。数据集大小：确保数据集的样本数量充足且具有代表性，避免数据集过小导致结果不具备普遍性。数据预处理：图像预处理方法：所有模型使用相同的预处理方法（如归一化、裁剪
[opencv]DNN图像分类 FL1623863129 opencv opencv dnn 分类
OpenCV是一个计算机视觉开源库，提供了处理图像和视频的能力。OpenCV的影响力非常大，有超过47000的社区用户，以及超过1400万次的下载量。其应用领域横跨图像处理、交互式艺术、视频监督、地图拼接和高级机器人等。作为一个有十几年历史的开源项目，OpenCV拥有广大的用户群体和开发者群体。在数字的世界中，一幅图像由多个点（像素）组成。图像处理就是对其中一个像素或者一个区域内的像素（块）进行处
快速使用transformers的pipeline实现各种深度学习任务 E寻数据 huggingface 计算机视觉 nlp 深度学习人工智能 python pipeline transformers
目录引言安装情感分析文本生成文本摘要图片分类实例分割目标检测音频分类自动语音识别视觉问答文档问题回答图文描述引言在这篇中文博客中，我们将深入探讨使用transformers库中的pipeline()函数，它为预训练模型提供了一个简单且快速的推理方法。pipeline()函数支持多种任务，包括文本分类、文本生成、摘要生成、图像分类、图像分割、对象检测、音频分类、自动语音识别、视觉问题回答、文档问题回
阿尔兹海默症-图像分类数据集数据集_深度学习分类数据挖掘人工智能 python 机器学习算法
阿尔兹海默症-图像分类数据集数据集：链接：https://pan.baidu.com/s/1gSUT74XrnHmg2Z11oZNd6A?pwd=wphh提取码：wphh数据集信息介绍：文件夹健康中的图片数量:8000文件夹早期轻度认知障碍中的图片数量:10000文件夹阿尔兹海默症中的图片数量:8000所有子文件夹中的图片总数量:26000阿尔兹海默症-图像分类数据集摘要阿尔兹海默症（Alzhei
基于深度学习的自适应架构 SEU-WYL 深度学习dnn 深度学习架构人工智能
基于深度学习的自适应架构是一种能够动态调整自身结构和参数的神经网络体系，以更好地适应不同的任务和环境需求。这类架构旨在提高模型的灵活性、效率和泛化能力，特别是在面对资源受限或任务多样化的情况下。以下是对该主题的详细介绍：1.背景与动机任务多样性：在现实世界中，模型可能需要处理各种不同的任务，如图像分类、物体检测、自然语言处理等。传统的固定架构模型往往难以在所有任务上都表现出色。资源受限环境：在边缘
[数据集][图像分类]河道污染分类数据集1923张4类别 FL1623863129 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：1922分类类别数：4类别名称:["lianghao","qingwei","yanzhong","zhongdu"]每个类别图片数：lianghao图片数：435qingwei图片数：423yanzhong图片数：577zhongdu图片数：487重要说明
线性代数在卷积神经网络（CNN）中的体现科学的N次方人工智能线性代数 cnn 人工智能
案例：深度学习中的卷积神经网络（CNN）在图像识别领域，卷积神经网络（ConvolutionalNeuralNetworks,CNN）是一个广泛应用深度学习模型，它在人脸识别、物体识别、医学图像分析等方面取得了显著成效。CNN中的核心操作——卷积，就是一个直接体现线性代数应用的例子。假设我们正在训练一个用于识别猫和狗的图像分类器，原始输入是一幅RGB彩色图片，可以将其视为一个高度、宽度和通道数（R
深入了解OpenCVSharp中常见的图像处理功能仰望大佬007 图像处理 opencv 计算机视觉 c#
深入了解OpenCVSharp中常见的图像处理功能前言1.图像加载与保存2.图像基本操作3.图像滤波4.边缘检测5.图像分割6.特征检测与描述子7.目标识别与跟踪8.图像融合与拼接9.形状匹配与模板匹配10.颜色空间转换与直方图11.图像转换与绘制12.图像分类与机器学习13.高级图像处理算法14.GPU加速与并行计算前言OpenCVSharp是C#语言中用于图像处理和计算机视觉的开源库，它提供了
[数据集][图像分类]鲜花分类数据集5735张102类别 FL1623863129 数据集计算机视觉
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：5735分类类别数：102类别名称:["0","1","2","3","4","5","6","7","8","9","10","11","12","13","14","15","16","17","18","19","20","21","22","23",
【深入了解PyTorch】PyTorch实战项目示例：深入探索图像分类、目标检测和情感分析 prince_zxill Python实战教程人工智能与机器学习教程 pytorch 分类目标检测
【深入了解PyTorch】PyTorch实战项目示例：深入探索图像分类、目标检测和情感分析PyTorch实战项目示例：深入探索图像分类、目标检测和情感分析项目一：图像分类数据集准备构建模型训练模型模型评估和预测项目二：目标检测数据集准备构建模型训练模型模型评估和预测项目三：情感分析数据集准备构建模型训练模型模型评估和预测
深度学习图像分类中，要求待分类图像中只有一类物体吗？如果这个图像中有两类物体，那么这个图像被分为哪一类？神笔馬良深度学习分类人工智能
问题描述：深度学习图像分类中，要求待分类图像中只有一类物体吗？如果这个图像中有两类物体，那么这个图像被分为哪一类？问题解答：在深度学习图像分类任务中，通常假设每张图像只包含一类物体。这是因为图像分类模型是针对特定类别的，模型训练的目标是学习如何将输入图像正确分类到这些预定义的类别中。因此，如果一张图像中包含多个类别的物体，那么根据通常的假设，该图像将被分为其中的主要类别或最突出的类别。具体来说，如
【深度学习】S2 数学基础 P6 概率论脚踏实地的大梦想家 #深度学习深度学习概率论
目录基本概率论概率论公理随机变量多个随机变量联合概率条件概率贝叶斯定理求和法则独立性期望与方差小结基本概率论机器学习本质上，就是做出预测。而概率论提供了一种量化和表达不确定性水平的方法，可以帮助我们量化对某个结果的确定性程度。在一个简单的图像分类任务中；如果我们非常确定图像中的对象是一只猫，那么我们可以说标签为“猫”的概率是1，即P(y=“猫”)=1P(y=“猫”)=1P(y=“猫”)=1;如果我
深度学习(16)--基于经典网络架构resnet训练图像分类模型 GodFishhh 深度学习深度学习 python 人工智能 pytorch
目录一.项目介绍二.项目流程详解2.1.引入所需的工具包2.2.数据读取和预处理2.3.加载resnet152模型2.4.初始化模型2.5.设置需要更新的参数2.6.训练模块设置2.7.再次训练所有层2.8.测试网络效果三.完整代码一.项目介绍使用PyTorch工具包调用经典网络架构resnet训练图像分类模型，用于分辨不同类型的花二.项目流程详解2.1.引入所需的工具包importosimpor
【AIGC】Stable Diffusion应用领域 AIGCExplore AIGC AIGC stable diffusion 人工智能
StableDiffusion是一个基于OpenAI的Diffusion模型的扩展版本，主要用于图像生成和处理任务。它并不是一个图像分类模型，而是一个生成式模型，可以生成高质量的图像。以下是StableDiffusion模型的主要功能和应用领域：图像生成：StableDiffusion可以生成各种类型的图像，包括人物肖像、风景、动物、静物等。它能够生成高分辨率、真实感和多样性的图像，具有良好的生成
ubuntu22.04@laptop OpenCV Get Started: 015_deep_learning_with_opencv_dnn_module lida2003 Linux opencv dnn 人工智能计算机视觉开源
ubuntu22.04@laptopOpenCVGetStarted:015_deep_learning_with_opencv_dnn_module1.源由2.应用Demo2.1C++应用Demo2.2Python应用Demo3.使用OpenCVDNN模块进行图像分类3.1导入模块并加载类名文本文件3.2从磁盘加载预训练DenseNet121模型3.3读取图像并准备为模型输入3.4通过模型进行前
【大厂AI课学习笔记】【2.2机器学习开发任务实例】（1）搭建一个机器学习模型 giszz 人工智能学习笔记人工智能学习笔记
今天学习的是，如何搭建一个机器学习模型。主要有以上的步骤：原始数据采集特征工程数据预处理特征提取特征转换（构造）预测识别（模型训练和测试）在实际工作中，特征比模型更重要。数据和特征的选择，已经决定了模型的天花板，模型算法只是去逼近这个上限。在上述的特征工程中：数据预处理，就是去除数据的噪声，例如文本中的错误、不再使用的词语等；特征提取，就是从原始数据中提取一些有效的特征。例如图像分类中，提取边缘、
Matlab DNN多层感知机进行图像分类——附源码分享我是狮子搏兔 Prediction matlab matlab dnn python
提示：麻烦点赞，拒绝白嫖文章目录前言一、数据来源二、训练+预测_一步到位源码1.DNN.m总结前言Python不香吗？非得用matlab来搞机器学习的东西？不是不是，matlab也有集成了许多机器学习算法，当然，都是一些非常基础的机器学习算法。深度学习还是得向python看齐。今天试用了一下matlab自带的DNN模型，封装在newff函数里，寥寥几行代码，非常简洁。提示：以下是本篇文章正文内容，
Seq2seq模型以及Beam Search 非洲小可爱自然语言处理 seq2seq bean search 贪心算法
seq2seq模型及BeamsearchSeq2Seq是一个Encoder-Deocder结构的模型，输入是一个序列，输出也是一个序列。Encoder将一个可变长度的输入序列变为固定长度的向量，Decoder将这个固定长度的向量解码成可变长度的输出序列。目标是最大化该目标函数：seq2seq模型种类onetoone结构，仅仅只是简单的给一个输入得到一个输出，此处并未体现序列的特征，例如图像分类场景
pytorch图像分类全流程(五)--图像分类算法精度评估指标已经大四了，继续努力 datawhale pytorch pytorch 分类深度学习
本次我们来学习图像分类算法精度的各种评估指标：precision、recall、accuracy、f1-score、AP、AUC。首先我们来学一个很重要的概念，混淆矩阵：1.精确率(Precision)：指的是所有被判定为正类（TP+FP）中，真实的正类（TP）占的比例。2.召回率(Recall)：指的是所有真实为正类（TP+FN）中，被判定为正类（TP）占的比例。3.准确率(accuracy)：
pytorch,cnn,rnn和yolo关系小小娱乐 pytorch cnn rnn
卷积神经网络（ConvolutionalNeuralNetworks,CNN）和YOLO（YouOnly卷积神经网络（ConvolutionalNeuralNetworks,CNN）和YOLO（YouOnlyLookOnce）都是深度学习中的重要技术，它们在处理图像数据方面有着广泛的应用。CNN是一种以卷积为核心的神经网络，被广泛用于图像分类、物体检测等任务。YOLO则是一种基于CNN的目标检测算
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他