求则得之，舍则失之

数据增强系列（3）Albumentation 初窥

在这篇文章中，我将通过示例全面介绍使用最广泛的图像增强库之一Albumentation。您应该能够从这篇文章中建立对Albumentation的基本了解，并最终在您自己的工作中进行尝试。

1.什么是Albumentation？

在您了解 Albumentation 有什么帮助之前，了解图像增强在计算机视觉中的含义至关重要。

深度神经网络，尤其是卷积神经网络 (CNN)，更擅长图像分类任务。最先进的 CNN 甚至已被证明在图像识别方面的表现超过了人类。图像增强是获取训练数据集中已有的图像并对其进行操作以创建同一图像的许多更改版本的过程。这既提供了更多的图像来训练，也可以帮助我们的分类器暴露于更广泛的照明和着色情况，从而使我们的分类器更健壮。

Albumentation 是一种工具，可以在将图像送入模型之前对图像进行 [弹性、网格、运动模糊、移位、缩放、旋转、转置、对比度、亮度等]操作。

官方 Albumentation 网站将自己描述为:
Albumentations 是一个 Python 库，用于快速灵活的图像增强。Albumentations 有效地实现了丰富多样的图像变换操作，这些操作针对性能进行了优化，同时为不同的计算机视觉任务提供了简洁而强大的图像增强界面，包括对象分类、分割和检测。

2.为什么要使用 Albumentation？

Albumentation 与其他图像增强相关软件包的区别在于，

2.1 它很快

该软件包已通过多个基于 OpenCV 的库（包括 NumPy、OpenCV、imgaug）进行了优化。

我的深度学习 Python 框架是 Pytorch，所以我最初接触到TorchVision 原生提供的 torchvision.transforms 的使用。Torchvision.transforms 已经提供了非常可靠的自定义增强方法和文档，所以我一直坚持使用它的产品。

在寻找更好的增强开源库时，我发现了这个 Albumentation 包。而且我发现它非常快，高度可定制，最重要的是，只需 <5 分钟即可将 Torchvision 代码重构为 Albumentation。

上图是使用 Intel Xeon Platinum 8168 CPU 在 ImageNet 中通过 2000 个验证集图像的测试结果。每个单元格中的值表示在单个核心中处理的图像数量。您可以看到 Albumentation 在许多转换方面比所有其他库至少高出 2 倍。

2.2 教程

对于项目范围，我将介绍 Albumentation 中的关键组件和用法。该代码集主要基于 Albumentations 团队的教程笔记本。我参考了以下笔记本：migrating_from_torchvision_to_albumentations.ipynb

2.2在 Google Colab 中挂载 Google Drive

我一直使用 Google Colab 来制作简单/可共享的笔记本原型。他们的 Jupyter 是免费的，您可以使用免费的 GPU！

您可以使用以下代码将照片上传到 Google Drive 并将 Google Drive 挂载到 Colab。

from google.colab import drive
drive.mount("/content/gdrive")

此单元格将返回 URL 。单击 URL 后，您可以检索授权码。复制粘贴此代码并按 Enter，您就可以开始了！

此外，我还将导入本教程所需的所有其他Python库

from PIL import Image
import time
import torch
import torchvision
from torch.utils.data import Dataset
from torchvision import transforms
import albumentations
import albumentations.pytorch
from matplotlib import pyplot as plt
import cv2
import numpy as np

为了演示，我用了意大利美丽的威尼斯街头照片。

2.3 原始的TorchVision数据管道

我通常创建一个 Dataloader 来使用 PyTorch 和 Torchvision 处理图像数据管道。

创建一个简单的Pytorch Dataset类
调用图像并进行转换
用100个循环测量整个处理时间

首先，从torch.util.datas获取Dataset抽象类，并创建一个TorchVision Dataset类。然后我传入图像并使用__getitem__方法进行转换。另外，我使用total_time = (time.time() - start_t来度量它所花费的时间。

class TorchvisionDataset(Dataset):
    def __init__(self, file_paths, labels, transform=None):
        self.file_paths = file_paths
        self.labels = labels
        self.transform = transform
        
    def __len__(self):
        return len(self.file_paths)

    def __getitem__(self, idx):
        label = self.labels[idx]
        file_path = self.file_paths[idx]
        
        # Read an image with PIL
        image = Image.open(file_path)
        
        start_t = time.time()
        if self.transform:
            image = self.transform(image)
        total_time = (time.time() - start_t)

        return image, label, total_time

然后我们调整图像的大小为256x256(高度*宽度)，并随机裁剪为224x224的大小。然后应用水平翻转50%的概率，并将其转换为张量。输入文件的路径应该是你的图像所在的谷歌驱动器的路径。

torchvision_transform = transforms.Compose([
    transforms.Resize((256, 256)), 
    transforms.RandomCrop(224),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
])

torchvision_dataset = TorchvisionDataset(
    file_paths=["/content/gdrive/MyDrive/5.jpeg"],
    labels=[1],
    transform=torchvision_transform,
)

然后我们计算从torchvision_dataset提取样本图像并转换它所花费的时间，然后运行100次循环来检查它所花费的平均毫秒。

total_time = 0
for i in range(100):
  sample, _, transform_time = torchvision_dataset[0]
  total_time += transform_time

print("torchvision time/sample: {} ms".format(total_time*10))

plt.figure(figsize=(10, 10))
plt.imshow(transforms.ToPILImage()(sample))
plt.show()

在我的 Colab 环境中，一百个 Resize + RandomCrop + RandomHorizontalFlip 循环花费了大约 12 毫秒，而最后一张图像的大小为 224x224，如您所见。您还可以看到第 100 张图像发生了翻转！

2.4 Albumentation数据管道

现在我将重构从TorchVision到albuitation的数据管道.与TorchVision类似，我们创建了一个Albumentations Dataset类。

class AlbumentationsDataset(Dataset):
    """__init__ and __len__ functions are the same as in TorchvisionDataset"""
    def __init__(self, file_paths, labels, transform=None):
        self.file_paths = file_paths
        self.labels = labels
        self.transform = transform
        
    def __len__(self):
        return len(self.file_paths)

    def __getitem__(self, idx):
        label = self.labels[idx]
        file_path = self.file_paths[idx]
        
        # Read an image with OpenCV
        image = cv2.imread(file_path)
        
        # By default OpenCV uses BGR color space for color images,
        # so we need to convert the image to RGB color space.
        image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

        start_t = time.time()
        if self.transform:
            augmented = self.transform(image=image) 
            image = augmented['image']
	    total_time = (time.time() - start_t)
        return image, label, total_time

现在在Albumentation中创建一个变换。在这个例子中，你可以发现一个小小的语法差异，即Torchvision的RandomHorizontalFlip()在Albumentation中产生了与HorizontalFlip()相同的结果。

"""
torchvision_transform = transforms.Compose([
    transforms.Resize((256, 256)), 
    transforms.RandomCrop(224),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
])
"""

# Same transform with torchvision_transform
albumentations_transform = albumentations.Compose([
    albumentations.Resize(256, 256), 
    albumentations.RandomCrop(224, 224),
    albumentations.HorizontalFlip(), # Same with transforms.RandomHorizontalFlip()
    albumentations.pytorch.transforms.ToTensor()
])

执行相同的图像变换，得到平均时间，并可视化结果。

# Same dataset with torchvision_dataset
albumentations_dataset = AlbumentationsDataset(
    file_paths=["/content/gdrive/MyDrive/5.jpeg"],
    labels=[1],
    transform=albumentations_transform,
)
total_time = 0
for i in range(100):
  sample, _, transform_time = albumentations_dataset[0]
  total_time += transform_time

print("albumentations time/sample: {} ms".format(total_time*10))

plt.figure(figsize=(10, 10))
plt.imshow(transforms.ToPILImage()(sample))
plt.show()

令人惊讶的是，它只花了2.1ms，比Torchvision快了大约6倍!它甚至比我们从官方基准文档中看到的有更大的计算差距，而且裁剪区域似乎也有细微的差别。

3.Albumentations的应用

如您所见，它非常快，而且速度很重要。

在代码竞赛中，如果能减少图像处理中的计算瓶颈，其他部分（模型拟合、超参数调优等）可以使用更多的资源。
在实际行业中，生产数据库中可能会涌入大量新图像（即每秒 1000 个图像）。想象一下开发一个实时深度学习模型。快速处理图像的方法在模型中至关重要，这可能会影响用户体验并最终影响收入/利润。
为了您的学习目的，掌握最新和表现最佳的技术技能是有帮助的，这在构建您自己的项目和求职（即简历）时可能会很有用。

4.更复杂的例子

最后，我将展示如何使用OneOf函数进行增强，我个人觉得这个函数最复杂但在 Albumentation 中很有用：

albumentations_transform_oneof = albumentations.Compose([
    albumentations.Resize(256, 256), 
    albumentations.RandomCrop(224, 224),
    albumentations.OneOf([
                          albumentations.HorizontalFlip(p=1),
                          albumentations.RandomRotate90(p=1),
                          albumentations.VerticalFlip(p=1)            
    ], p=1),
    albumentations.OneOf([
                          albumentations.MotionBlur(p=1),
                          albumentations.OpticalDistortion(p=1),
                          albumentations.GaussNoise(p=1)                 
    ], p=1),
    albumentations.pytorch.ToTensor()
])

它的 Resize 和 Random Crop 与之前代码集中具有相同的代码。OneOf随机采用括号内列出的变换之一。我们甚至可以将发生的概率放在函数本身中。例如，如果 ([…], p=0.5) ，它会以 50% 的机会跳过整个变换，并以 1/6 的机会随机选择三个变换之一。

我让它从水平翻转、旋转、垂直翻转中随机选择，并再次让它从模糊、失真、噪声中随机选择。所以在这种情况下，我们允许 3x3 = 9 种组合。

albumentations_dataset = AlbumentationsDataset(
    file_paths=["/content/gdrive/My Drive/img5.png"],
    labels=[1],
    transform=albumentations_transform_oneof,
)

num_samples = 5
fig, ax = plt.subplots(1, num_samples, figsize=(25, 5))
for i in range(num_samples):
  ax[i].imshow(transforms.ToPILImage()(albumentations_dataset[0][0]))
  ax[i].axis('off')

结果如下:

结论

总而言之，我介绍了图像增强技术，Python 中的 Albumentation 库，并在教程中提供了示例代码。为了该项目，该实验仅使用单个图像进行，但可以发现速度有很大提高。Albumentation 提供了多种转换，因此我强烈建议我的读者从今天开始使用它。

参考目录

https://towardsdatascience.com/getting-started-with-albumentation-winning-deep-learning-image-augmentation-technique-in-pytorch-47aaba0ee3f8

你可能感兴趣的:(数据增强,数据增强)

YOLOv8数据增强热心小张研究生 yolov8
1.找到augment.py（ultralytics/data/augment.py），修改对应内容#TransformsT=[A.Blur(p=0.01),A.MedianBlur(p=0.01),A.ToGray(p=0.01),A.CLAHE(p=0.01),A.RandomBrightnessContrast(p=0.0),A.RandomGamma(p=0.0),A.ImageCompr
计算机视觉中的数据增强方法总结 CV技术指南(公众号) CV技术总结计算机视觉深度学习卷积神经网络
前言：在计算机视觉方向，数据增强的本质是人为地引入人视觉上的先验知识，可以很好地提升模型的性能，目前基本成为模型的标配。最近几年逐渐出了很多新的数据增强方法，在本文将对数据增强做一个总结。本文介绍了数据增强的作用，数据增强的分类，数据增强的常用方法，一些特殊的方法，如Cutout，RandomErasing，Mixup，Hide-and-Seek，CutMix，GridMask，FenceMask
第3篇：LangChain的架构总览与设计理念 Gemini技术窝 langchain 架构大数据人工智能 AIGC nlp
LangChain库是一个专为自然语言处理（NLP）设计的强大工具包，致力于简化复杂语言模型链的构建和执行。在本文中，我们将深入解析LangChain库的架构，详细列出其核心组件、设计理念及其在不同场景中的应用，并讨论其优缺点。文章目录1.LangChain库简介2.核心组件2.1数据输入模块作用2.2数据预处理模块作用2.3数据增强模块作用2.4数据加载与批处理模块作用2.5模型训练模块作用2.
pytorh基础知识和函数的学习：torchvision.transforms() 深蓝海拓机器视觉和人工智能学习学习 pytorch
transforms是PyTorch的torchvision库中用于图像处理的一个模块。它提供了一组工具，用于在图像数据集上进行常见的预处理和数据增强操作，以便更好地训练深度学习模型。以下是一些常用的torchvision.transforms转换：基础图像转换：transforms.ToTensor():将PIL图像或NumPy数组转换为PyTorch的张量，并将像素值范围从[0,255]缩放到
深度学习速通系列:鲁棒性和稳定性 Ven% 深度学习速通系列深度学习自然语言处理人工智能 python nlp
在机器学习中，鲁棒性和稳定性是评估模型性能的两个关键指标，它们对于确保模型在实际应用中的可靠性至关重要。鲁棒性（Robustness）定义：鲁棒性指的是模型对于输入数据的扰动、噪声、异常值或对抗性攻击的抵抗能力。一个鲁棒的模型能够在面对这些不利因素时保持其性能。提高鲁棒性的方法：数据增强：通过对训练数据进行变换（如旋转、缩放、裁剪等），使模型能够更好地泛化到未见过的数据。对抗训练：在训练过程中引入
6. 深度学习中的正则化技术：防止过拟合 Network_Engineer 机器学习深度学习人工智能
引言过拟合是深度学习模型在训练过程中常遇到的挑战。过拟合会导致模型在训练数据上表现良好，但在新数据上表现不佳。为了防止过拟合，研究者们提出了多种正则化技术，如L1/L2正则化、Dropout、数据增强等。这些技术通过约束模型的复杂度或增加数据的多样性，有效提高了模型的泛化能力。本篇博文将深入探讨这些正则化技术的原理、应用及其在实际深度学习任务中的效果。1.过拟合的原因与影响过拟合通常发生在模型的复
经典网络训练图像分类模型一三十度角阳光的问候分类数据挖掘人工智能
目录数据预处理部分：网络模块设置：网络模型保存与测试数据读取与预处理操作制作好数据源：读取标签对应的实际名字加载models中提供的模型，并且直接用训练的好权重当做初始化参数模型参数更新把模型输出层改成自己的设置哪些层需要训练优化器设置数据预处理部分：-数据增强：torchvision中transforms模块自带功能，比较实用-数据预处理：torchvision中transforms也帮我们实现
训练过程训练集的准确率都低于验证集和测试集的准确率可能的原因 Wils0nEdwards python 人工智能深度学习
每一个epoch训练集的准确率都低于验证集和测试集的准确率，这种现象不太常见，可能有以下几个原因：1.数据增强过强如果你在训练集上使用了较强的数据增强（如随机翻转、ColorJitter等），而验证集和测试集仅进行了基础的预处理。这会导致训练集的样本更具挑战性，模型在训练集上的表现不如在验证集和测试集上的表现。2.训练和验证集分布差异训练集、验证集和测试集的分布可能存在差异。如果训练集包含更多的噪
caffe/PyTorch/TensorFlow 在Jupyter Notebook GPU中运用俊俏的萌妹纸 caffe 人工智能深度学习
在JupyterNotebook中使用Caffe框架并利用GPU加速，可以实现多种效果和目的，主要集中在深度学习领域。以下是一些主要的应用场景：快速训练模型：GPU加速可以显著提高模型训练的速度。对于大型数据集和复杂的神经网络结构，使用GPU可以大大减少训练时间。实时数据增强：在训练过程中，可以实时地对输入数据进行变换和增强，以提高模型的泛化能力。GPU加速使得这些操作更加高效。大规模数据处理：深
4. 生成对抗网络（GAN）：生成模型的崛起 Network_Engineer 机器学习 python 深度学习机器学习算法人工智能
引言生成对抗网络（GAN）是近年来深度学习领域中最具创新性和影响力的模型之一。GAN通过生成器和判别器的对抗性训练，能够生成逼真的图像、音频、文本等数据，广泛应用于图像生成、数据增强、风格迁移等任务中。本篇博文将深入解析GAN的基本原理、训练过程，以及其在各类生成任务中的应用。1.GAN的基本架构生成对抗网络（GAN）由两个核心部分组成：生成器（Generator）和判别器（Discriminat
深度学习100问44:如何避免模型出现过拟合现象不断持续学习ing 人工智能自然语言处理机器学习
嘿，想让你的模型不出现过拟合现象？来看看这些妙招吧！一、增加数据量这就好比让学生多做各种不同的练习题。数据多了，模型就能学到更普遍的规律，而不是只记住那一点点数据里的小细节。你可以去收集更多真实的数据，或者用数据增强的办法。就像在图像识别里，把图片转一转、翻一翻、剪一剪，这样数据就变得更多样啦。二、简化模型要是模型太复杂，那就像盖了一座超级华丽的城堡，容易记住一些不该记的东西。那就把模型弄得简单点
PyTorch库学习之torch.repeat_interleave函数 Midsummer-逐梦 #torch pytorch 学习人工智能
PyTorch库学习之torch.repeat_interleave函数一、简介torch.repeat_interleave是PyTorch库中的一个函数，它用于重复张量中的元素。这个函数可以沿着指定的维度重复张量中的每个元素，返回一个新的张量。当不指定维度时，会将输入张量展平，并重复每个元素。这个函数在处理序列数据或生成数据增强样本时非常有用。二、语法和参数语法:torch.repeat_in
第T10周：数据增强 OreoCC 深度学习人工智能 tensorflow2
>-**本文为[365天深度学习训练营]中的学习记录博客**>-**原作者：[K同学啊]**第10周：数据增强难度：夯实基础⭐⭐语言：Python3、TensorFlow2要求：学会在代码中使用数据增强手段来提高acc请探索更多的数据增强手段并记录在本教程中，你将学会如何进行数据增强，并通过数据增强用少量数据达到非常非常棒的识别准确率。我将展示两种数据增强方式，以及如何自定义数据增强方式并将其放到
Datawhale AI夏令营-task03 ghost_him 人工智能
DatawhaleAI夏令营-task03笔记来源：DatawhaleAI夏令营数据增强基础数据增强是一种在机器学习和深度学习领域常用的技术，尤其是在处理图像和视频数据时。**数据增强的目的是通过人工方式增加训练数据的多样性，从而提高模型的泛化能力，使其能够在未见过的数据上表现得更好。**数据增强涉及对原始数据进行一系列的变换操作，生成新的训练样本。这些变换模拟了真实世界中的变化，对于图像而言，数
基于PIL实现亮度、噪声、随机黑块数据增强小陈phd python numpy 人工智能
importosimportshutilfromPILimportImage,ImageEnhanceimportnumpyasnpimportrandomfromtqdmimporttqdm#ColorJitteringfunctiondefapply_color_jitter(image,brightness=0.5,contrast=0.5,saturation=0.5):"""Applyc
图像数据增强菜鸟瞎编
一、做随机亮度、对比度、饱和度修改，使用tensorflowAPI核心部分是aug_op函数，这可是菜鸟的心血啊！#coding:utf-8importtensorflowastfimportcv2importrandomimportsysimportosimportshutil#os.environ["CUDA_VISIBLE_DEVICES"]=""defrandom_normal(img,m
基于Diffusion Model的数据增强方法应用——毕业设计其三大鸟仙童课程设计计算机视觉深度学习
文章目录题目简介前言StableDiffusionLatentdiffusion自动编码器(VAE)U-NetText-EncoderStableDiffusion的推理过程从零开始配置实验环境IDEAnacondaCUDA和CuDNNCuDNNStableDiffusion的本地部署运行测试总结题目简介笔者个人的毕业设计课题如下：简介：使用预训练的DiffusionModel图像生成模型生成图像
【面经——《广州敏视数码科技有限公司》——图像处理算法工程师-深度学习方向】有情怀的机械男面试offer 面经
目录笔试HR面专业面——60多分钟主管面反问：笔试8道题——简答题+1道编程苹果、香蕉、梨、菠萝，彩色图像如何进行分类？一辆带车牌的汽车，图像亮度整体呈现偏亮状态，如何去提高图像的清晰度？并设计一个准确定位车牌位置的方案。训练集和测试集各5000张，进行目标检测，写出选择的模型以及设计方案？样本量不足怎么去提高检测的准确性？数据增强梯度下降法的优化算法有哪些，各有什么优缺点？损失函数有哪些？优缺点
【论文阅读笔记】AutoAugment:Learning Augmentation Strategies from Data 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
AutoAugment:LearningAugmentationStrategiesfromData摘要研究方法:本文描述了一种名为AutoAugment的简单程序，通过这个程序可以自动寻找改进的数据增强策略。研究设计了一个策略空间，其中策略包含多个子策略，在每个小批量数据中针对每张图片随机选择一个子策略。每个子策略由两个操作组成，每个操作是图像处理函数（如平移、旋转或剪切），以及应用这些函数的概
【论文阅读笔记】Contrastive Learning with Stronger Augmentations 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
ContrastiveLearningwithStrongerAugmentations摘要基于提供的摘要，该论文的核心焦点是在对比学习领域提出的一个新框架——利用强数据增强的对比学习（ContrastiveLearningwithStrongerAugmentations，简称CLSA）。以下是对摘要的解析：问题陈述：表征学习（representationlearning）已在对比学习方法的推动
低资源学习与知识图谱：构建与应用 cooldream2009 AI技术知识图谱知识图谱人工智能低资源
目录前言1低资源学习方法1.1数据增强1.2特征增强1.3模型增强2低资源知识图谱构建与推理2.1元关系学习2.2对抗学习2.3零样本关系抽取2.4零样本学习与迁移学习2.5零样本学习与辅助信息3基于知识图谱的低资源学习应用3.1零样本图像分类3.2知识增强的零样本学习3.3语义与知识信息的利用结语前言在当今人工智能领域，低资源学习成为一个备受关注的话题，尤其是在少样本学习和零样本学习方面。这种学
MogaNet实战：使用 MogaNet实现图像分类任务（二） AI浩图像分类人工智能人工智能深度学习计算机视觉
文章目录训练部分导入项目使用的库设置随机因子设置全局参数图像预处理与增强读取数据设置Loss设置模型设置优化器和学习率调整策略设置混合精度，DP多卡，EMA定义训练和验证函数训练函数验证函数调用训练和验证方法运行以及结果查看测试完整的代码在上一篇文章中完成了前期的准备工作，见链接：MogaNet实战：使用MogaNet实现图像分类任务（一）前期的工作主要是数据的准备，安装库文件，数据增强方式的讲解
科普：坐标系中几何变换及常见公式 9命怪猫几何学计算机视觉几何学
几何变换”通常指的是对图像进行平移、旋转、缩放、翻转等操作，以改变图像的位置、大小和方向。这些几何变换常用于图像处理、计算机视觉和深度学习领域，用于数据增强、图像预处理、物体检测等任务。具体来说，几何变换包括以下几种主要操作：平移：将图像沿着水平和垂直方向移动一定的距离。旋转：围绕图像中心点或指定点进行旋转，改变图像的方向。缩放：按照指定的比例增大或缩小图像的尺寸。翻转：沿水平或垂直方向对图像进行
大模型注入领域知识，模型体验和Token重复知识 lichunericli LLM 人工智能语言模型
1如何给LLM注入领域知识？给LLM（低层次模型，如BERT、GPT等）注入领域知识的方法有很多。以下是一些建议：数据增强：在训练过程中，可以通过添加领域相关的数据来增强模型的训练数据。这可以包括从领域相关的文本中提取示例、对现有数据进行扩充或生成新的数据。迁移学习：使用预训练的LLM模型作为基础，然后在特定领域的数据上进行微调。这样可以利用预训练模型学到的通用知识，同时使其适应新领域。领域专家标
stupid_brain MORE_77 深度学习深度学习 python 人工智能
前言：本文用于记录本人AI新手期间犯的各种错误，时常更新。正文开始：读取数据的num_worker设置过少，以至于训练速度卡在读取数据上。训练集数据处理：数据增强有利于解决过拟合问题。模型：relu少写、batchnorm位置写错。test记得关闭梯度更新withtorch.no_grad():
基于轻量级模型YOLOX-Nano的菜品识别系统钟良堂笔记深度学习目标检测 yolox-nano 菜品识别
工程Gitee地址：https://gitee.com/zhong-liangtang/ncnn-android-yolox-nano一、YOLOX简介YOLOX是一个在2021年被旷视科技公司提出的高性能且无锚框（Anchor-free）的检测器，在YOLO系列的基础上吸收近年来目标检测学术界的最新成果，如解耦头（DecoupledHead）、数据增强、无锚框、标签分配策略SimOTA（Simp
论文笔记：NIPS 2020 Graph Contrastive Learning with Augmentations 饮冰l 图弱监督数据挖掘机器学习神经网络深度学习
前言本文主要提出在图对比学习大框架下的图数据增强的若干方法。概括来说，本文提出了一种图对比学习框架来无监督的完成图表示学习，首先作者提出了基于各种先验信息的四种图数据增强方法。然后，作者分析了在四种不同的图数据增强条件下，不同组合对多个数据集的影响:半监督、无监督、迁移学习以及对抗性攻击。作者为GNN的预训练提出了基于图数据增强的对比学习框架来解决图中数据异质性的挑战，本文的主要贡献如下：作者提出
Graph Contrastive Learning with Augmentations tutoujiehegaosou Graph 笔记
GraphCL学习笔记Abstract提出GNN对自监督学习和pre-training较少。本文提出了GraphCL框架，用于学习图的无监督表示。设计四种类型的数据增强，在不同的settings（learningrate，batchsize，dropout参数）下，研究这四种增强对不同数据集的影响。Introduction大多数graph-level的任务场景，GNN都是在监督的情况下进行端到端的
Vim实战：使用 Vim实现图像分类任务（二）静静AI学堂图像分类实战 vim 分类深度学习
文章目录训练部分导入项目使用的库设置随机因子设置全局参数图像预处理与增强读取数据设置Loss设置模型设置优化器和学习率调整策略设置混合精度，DP多卡，EMA定义训练和验证函数训练函数验证函数调用训练和验证方法运行以及结果查看测试完整的代码在上一篇文章中完成了前期的准备工作，见链接：Vim实战：使用Vim实现图像分类任务（一）前期的工作主要是数据的准备，安装库文件，数据增强方式的讲解，模型的介绍和实
imgaug数据增强神器：增强器一览 a flying bird 计算机视觉计算机视觉
官网：imgaug—imgaug0.4.0documentationhttps://imgaug.readthedocs.io/en/latest/github:GitHub-aleju/imgaug:Imageaugmentationformachinelearningexperiments.imgaug数据增强神器：增强器一览_iaa图像增强改变颜色-CSDN博客文章浏览阅读9.8k次，点赞3
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他