求则得之，舍则失之

数据增强系列（4）如何进行实例分割的增强

1.概述

在本笔记中，我们将使用流行的增强库，Albumentations来执行类似于coco数据集的多个注释的图像增强。
你可以简单地安装它:pip install albumentations

2.代码实现

我们考虑一个图分割图像有若干对象，每个对象有一个标签，一个边界框(bbox)，和一个二进制掩码。

2.1导入相关库

# Let's import needed libraries
import torch
import albumentations as A
import cv2
import json
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import os
from skimage.color import label2rgb

2.2 设置相关参数

设置通用常量。提示：在实践中，您可以创建 config.py 文件，将它们添加到那里，然后执行

from configs import ...
IMG_SIZE = 512
MAX_SIZE = 1120
IMAGE_ID = '0461935888bad18244f11e67e7d3b417.jpg'

设置数据路径。为方便起见，我在此处上传了图像和注释

input_path = 'examples-for-augs'
image_filepath = os.path.join(input_path, IMAGE_ID)
annot_filepath = os.path.join(input_path, 'annotations.csv')

2.3 数据可视化

让我们加载带有注释的图像

# load image
image = cv2.imread(image_filepath, cv2.IMREAD_UNCHANGED)
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)  # I am still wondering why OpenCV changed to BGR by default
height, width, channels = image.shape
print(height, width) # 1685 1123
# load annotations
anns = pd.read_csv(annot_filepath)
print(anns.head())
#   Unnamed: 0                               ImageId  ... Width  ClassId
# 0        5842  0461935888bad18244f11e67e7d3b417.jpg  ...  1123       23
# 1        5843  0461935888bad18244f11e67e7d3b417.jpg  ...  1123       23
# 2        5844  0461935888bad18244f11e67e7d3b417.jpg  ...  1123        6
# 3        5845  0461935888bad18244f11e67e7d3b417.jpg  ...  1123       32
# 4        5846  0461935888bad18244f11e67e7d3b417.jpg  ...  1123       42

def img_masks_targets(df, img_id):
    """Select all targets of one image as an array of numbers
       Select all masks of one image as an array of RLE strings
       Output:
            masks and targets for an image
    """
    # select all targets of one image as an array of numbers
    targets = df[df['ImageId'] == img_id]["ClassId"].values
    # select all masks of one image as an array is strings
    rles = df[df['ImageId'] == img_id]["EncodedPixels"].values
    return targets, rles


labels, rles = img_masks_targets(anns, img_id=IMAGE_ID)
num_instances = len(rles)
print(f'Number of instances on the image {len(rles)}') # Number of instances on the image 10

图像的掩码通常采用游程编码格式(RLE)。我们需要将它们转换为二进制掩码来绘制和/或增强。这里有一些RLE编码和解码的助手

# :https://www.kaggle.com/paulorzp/run-length-encode-and-decode
def rle_decode(rle_str: str, mask_shape: tuple, mask_dtype=np.uint8):
    """Helper to decode RLE string to a binary mask"""
    s = rle_str.split()
    starts, lengths = [np.asarray(x, dtype=int) for x in (s[0:][::2], s[1:][::2])]
    starts -= 1
    ends = starts + lengths
    mask = np.zeros(np.prod(mask_shape), dtype=mask_dtype)
    for lo, hi in zip(starts, ends):
        mask[lo:hi] = 1
    return mask.reshape(mask_shape[::-1]).T


def rle_encode(mask):
    """Helper to encode binary mask to RLE string"""
    pixels = mask.T.flatten()
    pixels = np.concatenate([[0], pixels, [0]])
    rle = np.where(pixels[1:] != pixels[:-1])[0] + 1
    rle[1::2] -= rle[::2]
    return rle.tolist()


masks = np.zeros((len(rles), height, width), dtype=np.uint8)
for num in range(num_instances):
    masks[num, :, :] = rle_decode(rles[num], (height, width), np.uint8)

print(masks.shape) # (10, 1685, 1123)

定义一些辅助函数来可视化数据和标签

def visualize_bbox(img, bbox, color=(255, 255, 0), thickness=2):
    """Helper to add bboxes to images
    Args:
        img : image as open-cv numpy array
        bbox : boxes as a list or numpy array in pascal_voc fromat [x_min, y_min, x_max, y_max]
        color=(255, 255, 0): boxes color
        thickness=2 : boxes line thickness
    """
    x_min, y_min, x_max, y_max = bbox
    x_min, y_min, x_max, y_max = int(x_min), int(y_min), int(x_max), int(y_max)
    cv2.rectangle(img, (x_min, y_min), (x_max, y_max), color=color, thickness=thickness)
    return img


def plot_image_anns(image, masks, boxes=None):
    """Helper to plot images with bboxes and masks
    Args:
        image: image as open-cv numpy array, original and augmented
        masks: setof binary masks, original and augmented
        bbox : boxes as a list or numpy array, original and augmented
    """
    # glue binary masks together
    one_mask = np.zeros_like(masks[0])
    for i, mask in enumerate(masks):
        one_mask += (mask > 0).astype(np.uint8) * (
                11 - i)  # (11-i) so my inner artist is happy with the masks colors

    if boxes is not None:
        for box in boxes:
            image = visualize_bbox(image, box)

    # for binary masks we get one channel and need to convert to RGB for visualization
    mask_rgb = label2rgb(one_mask, bg_label=0)

    f, ax = plt.subplots(1, 2, figsize=(16, 16))
    ax[0].imshow(image)
    ax[0].set_title('Original image')
    ax[1].imshow(mask_rgb, interpolation='nearest')
    ax[1].set_title('Original mask')
    f.tight_layout()
    plt.show()


def plot_image_aug(image, image_aug, masks, aug_masks, boxes, aug_boxes):
    """Helper to plot images with bboxes and masks and their augmented versions
    Args:
        image, image_aug: image as open-cv numpy array, original and augmented
        masks, aug_masks:setof binary masks, original and augmented
        bbox, aug_boxes : boxes as a list or numpy array, original and augmented
    """
    # glue masks together
    one_mask = np.zeros_like(masks[0])
    for i, mask in enumerate(masks):
        one_mask += (mask > 0).astype(np.uint8) * (11 - i)

    one_aug_mask = np.zeros_like(aug_masks[0])
    for i, augmask in enumerate(aug_masks):
        one_aug_mask += (augmask > 0).astype(np.uint8) * (11 - i)

    for box in boxes:
        image = visualize_bbox(image, box)
    for augbox in aug_boxes:
        image_aug = visualize_bbox(image_aug, augbox)

        # for binary masks we get one channel and need to convert to RGB for visualization
    mask_rgb = label2rgb(one_mask, bg_label=0)
    mask_aug_rgb = label2rgb(one_aug_mask, bg_label=0)

    f, ax = plt.subplots(2, 2, figsize=(16, 16))
    ax[0, 0].imshow(image)
    ax[0, 0].set_title('Original image')
    ax[0, 1].imshow(image_aug)
    ax[0, 1].set_title('Augmented image')
    ax[1, 0].imshow(mask_rgb, interpolation='nearest')
    ax[1, 0].set_title('Original mask')
    ax[1, 1].imshow(mask_aug_rgb, interpolation='nearest')
    ax[1, 1].set_title('Augmented mask')
    f.tight_layout()
    plt.show()

让我们看看我们的图像和相应的蒙版

plot_image_anns(image, masks)

如 Mask-R-CNN 的实例分割模型，您还需要边界框。 COCO 数据集提供了它们，但通常你只会得到掩码。没问题，我们将从掩码生成bbox。

def get_boxes_from_masks(masks):
    """ Helper, gets bounding boxes from masks """
    coco_boxes = []
    for mask in masks:
        pos = np.nonzero(mask)
        xmin = np.min(pos[1])
        xmax = np.max(pos[1])
        ymin = np.min(pos[0])
        ymax = np.max(pos[0])
        coco_boxes.append([xmin, ymin, xmax, ymax])
    coco_boxes = np.asarray(coco_boxes, dtype=np.float32)

    return coco_boxes


img = image.copy()
boxes = get_boxes_from_masks(masks)
plot_image_anns(img, masks, boxes)

2.4 数据增强

现在让我们创建一个我们想要应用于图像和注释的变换列表。增强的选择取决于您的任务。常见的包括：

卫星成像数据的 D4 对称群增强；
用于分类的不同亮度和颜色的裁剪，旋转和缩放；
基于相机的自动驾驶任务的天气条件模拟；
X 射线胸部扫描的噪声、模糊和轻微旋转等。
在这里，我们将列出一些用于实验的列表。在实践中，最好创建 transforms.py 文件并将其全部放在那里。
请注意:A.Normalize函数——像ImageNet数据集训练中那样对图像进行归一化。建议在向模型发送数据之前进行此操作，特别是在ImageNet骨干上进行预先训练的情况下。

#  可视化目的，我在这里注释了它
D4_transforms = [A.Resize(height // 2, width // 2, interpolation=cv2.INTER_LINEAR, p=1),
                 # D4 Group augmentations
                 A.HorizontalFlip(p=1),
                 A.VerticalFlip(p=0.5),
                 A.RandomRotate90(p=0.5),
                 A.Transpose(p=0.5),
                 # A.Normalize()
                 ]

geom_transforms = [A.ShiftScaleRotate(shift_limit=0.0625, scale_limit=0.1, rotate_limit=15,
                                      interpolation=cv2.INTER_LINEAR, border_mode=cv2.BORDER_CONSTANT, value=0,
                                      mask_value=0, p=0.5),
                   # D4 Group augmentations
                   A.HorizontalFlip(p=0.5),
                   A.VerticalFlip(p=0.5),
                   A.RandomRotate90(p=0.5),
                   A.Transpose(p=0.5),
                   # crop and resize
                   A.RandomSizedCrop((MAX_SIZE - 100, MAX_SIZE), height // 2, width // 2, w2h_ratio=1.0,
                                     interpolation=cv2.INTER_LINEAR, always_apply=False, p=0.5),
                   A.Resize(height // 2, width // 2, interpolation=cv2.INTER_LINEAR, p=1),
                   # A.Normalize(),
                   ]
heavy_transforms = [A.RandomRotate90(),
                    A.Flip(),
                    A.Transpose(),
                    A.GaussNoise(),
                    A.ShiftScaleRotate(shift_limit=0.0625, scale_limit=0.1, rotate_limit=45, p=0.7),
                    A.OneOf([
                        A.MotionBlur(p=0.2),
                        A.MedianBlur(blur_limit=3, p=0.1),
                        A.Blur(blur_limit=3, p=0.1),
                    ], p=0.5),
                    A.OneOf([
                        A.Sharpen(),
                        A.Emboss(),
                        A.RandomBrightnessContrast(),
                    ], p=0.5),
                    A.HueSaturationValue(p=0.3),
                    # A.Normalize(),
                    ]
# 我们需要选择bbox格式，请参考这里的库文档:https://albumentations.readthedocs.io/en/latest/api/core.html#albumentations.core.composition.BboxParams
bbox_params = {'format': 'pascal_voc', 'min_area': 0, 'min_visibility': 0, 'label_fields': ['category_id']}
# 现在我们准备对图像、bbox 集和mask集应用增强。它需要 bboxes 作为列表，因此我们将其转换为列表格式。
boxes = list(boxes)  # you need to send bounding boxes to a list
img = image.copy()

augs = A.Compose(heavy_transforms, bbox_params=bbox_params, p=1)
# 我在这里会报错，将augs.is_check_args = False即可
augmented = augs(image=img, masks=masks, bboxes=boxes, category_id=labels, force_apply=True)
aug_img = augmented['image']
aug_masks = augmented['masks']
aug_boxes = augmented['bboxes']

plot_image_aug(img, aug_img, masks, aug_masks, boxes, aug_boxes)

让我们测试一些其他的增强集

img = image.copy()

augs = A.Compose(geom_transforms, bbox_params=bbox_params, p=1)
augmented = augs(image=img, masks=masks, bboxes=boxes, category_id=labels)
aug_img = augmented['image']
aug_masks = augmented['masks']
aug_boxes = augmented['bboxes']

plot_image_aug(img, aug_img, masks, aug_masks, boxes, aug_boxes)

for i in range(2):
    img = image.copy()

    augs = A.Compose(heavy_transforms, bbox_params=bbox_params, p=1)
    augmented = augs(image=img, masks=masks, bboxes=boxes, category_id=labels)
    aug_img = augmented['image']
    aug_masks = augmented['masks']
    aug_boxes = augmented['bboxes']

    plot_image_aug(img, aug_img, masks, aug_masks, boxes, aug_boxes)

最后，您可能希望在训练过程中增强您的图像。在这种情况下，您可能希望将它们包含在数据集中。在PyTorch上它是这样的:

class DatasetAugs(torch.utils.data.Dataset):
    """
    My Dummy dataset for instance segmentation with augs

        :param fold: integer, number of the fold
        :param df: Dataframe with sample tokens
        :param debug: if True, runs the debugging on few images
        :param img_size: the desired image size to resize to
        :param input_dir: directory with imputs and targets (and maps, optionally)
        :param transforms: list of transformations

        """

    def __init__(self, fold: int, df: pd.DataFrame,
                 debug: bool, img_size: int,
                 input_dir: str, transforms=None,
                 ):
        super(DatasetAugs, self).__init__()  # inherit it from torch Dataset
        self.fold = fold
        self.df = df
        self.debug = debug
        self.img_size = img_size
        self.input_dir = input_dir
        self.transforms = transforms
        self.classes = df.classes.unique()
        if self.debug:
            self.df = self.df.head(16)
            print('Debug mode, samples: ', self.df.samples)
        self.samples = list(self.df.samples)

    def __len__(self):
        return len(self.samples)

    def __getitem__(self, idx):
        sample = self.samples[idx]
        input_filepath = '{}/{}'.format(self.input_dir, sample)
        # load image
        im = cv2.imread(input_filepath, cv2.IMREAD_UNCHANGED)
        im = cv2.cvtColor(im, cv2.COLOR_BGR2RGB)

        # get annotations
        labels, rles = img_masks_targets(self.df, img_id=sample)
        masks = np.zeros((len(rles), height, width), dtype=np.uint8)
        for num in range(num_instances):
            masks[num, :, :] = rle_decode(rles[num], (height, width), np.uint8)

            # get boxes from masks
        boxes = get_boxes_from_masks(masks)
        boxes = list(boxes)
        # augment image and targets
        if self.transforms is not None:
            bbox_params = {'format': 'pascal_voc', 'min_area': 5, 'min_visibility': 0.5,
                           'label_fields': ['category_id']}
            augs = A.Compose(self.transforms, bbox_params=bbox_params, p=1)
            augmented = augs(image=im, masks=masks, bboxes=boxes, category_id=labels)
            im = augmented['image']
            masks = augmented['masks']
            boxes = augmented['bboxes']

            # targets to tensor
        boxes = torch.as_tensor(boxes, dtype=torch.float32)
        labels = torch.as_tensor(labels, dtype=torch.int64)
        masks = torch.as_tensor(masks, dtype=torch.uint8)
        image_id = torch.tensor([idx])
        area = (boxes[:, 3] - boxes[:, 1]) * (boxes[:, 2] - boxes[:, 0])
        iscrowd = torch.zeros((len(boxes),), dtype=torch.int64)

        target = {}
        target["boxes"] = boxes
        target["labels"] = labels
        target["masks"] = masks
        target["image_id"] = image_id
        target["area"] = area
        target["iscrowd"] = iscrowd

        im = torch.from_numpy(im.transpose(2, 0, 1))  # channels first

        return im, target

链接：https://pan.baidu.com/s/1KtXBe-pneHvzJ3KiHbcosA
提取码：123a

计算机视觉总结 Trank-Lw 计算机视觉深度学习人工智能
以下是针对上述问题的详细解答，并结合代码示例进行说明：1.改进YOLOv5人脸检测模块，复杂光照场景准确率从98.2%提升至99.5%优化具体过程：光照补偿：在数据预处理阶段，采用自适应光照补偿算法，对图像进行实时增强，以减少光照变化对人脸检测的影响。数据增强：在训练数据中增加复杂光照场景下的样本，如强光、弱光、背光等，通过数据增强提高模型对不同光照条件的适应性。模型调整：对YOLOv5模型的网络
【图像预处理】瞬间记忆深度学习 python
(4条消息)图像预处理方法总结_AI强仔的博客-CSDN博客对图像进行预处理的一些常见方法包括：调整图像大小和分辨率，以便适应模型的输入要求。对图像进行裁剪或填充，以使其大小和比例符合要求。调整图像的亮度、对比度和饱和度等图像属性。进行图像平滑或锐化操作，以去除噪声或增强图像特征。进行图像归一化或标准化，以确保各个特征在相同的尺度上。应用数据增强技术，如旋转、平移、缩放、翻转等，以扩大数据集，提高
【机器视觉】少量样本图片情况下的图片识别技术方案 yuanpan 机器学习人工智能计算机视觉
在只有少量图片样本的情况下，进行图像识别是一个具有挑战性的任务。以下是一些应对小样本问题的有效方案：1.数据增强（DataAugmentation）通过对现有样本进行各种变换来生成更多的训练数据，例如：几何变换：旋转、缩放、平移、翻转等。颜色变换：调整亮度、对比度、饱和度等。噪声添加：高斯噪声、椒盐噪声等。裁剪和填充：随机裁剪图像的一部分或填充边缘。工具：Keras：ImageDataGenera
使用 TensorFlow 进行图像处理：深度解析卷积神经网络（CNN）一碗黄焖鸡三碗米饭人工智能前沿与实践 tensorflow 图像处理 cnn 人工智能机器学习 python ai
目录使用TensorFlow进行图像处理：深度解析卷积神经网络（CNN）1.什么是卷积神经网络（CNN）？CNN的基本结构为什么CNN适合图像处理？2.使用TensorFlow构建CNN2.1环境准备2.2加载并预处理MNIST数据集2.3构建CNN模型2.4编译和训练模型2.5评估模型3.CNN的优化与改进3.1使用数据增强3.2调整网络结构4.CNN在其他图像处理任务中的应用5.总结参考文献在
图像处理篇---图像预处理 Ronin-Lotus 图像处理篇深度学习篇程序代码篇图像处理人工智能 opencv python 深度学习计算机视觉
文章目录前言一、通用目的1.1数据标准化目的实现1.2噪声抑制目的实现高斯滤波中值滤波双边滤波1.3尺寸统一化目的实现1.4数据增强目的实现1.5特征增强目的实现：边缘检测直方图均衡化锐化二、分领域预处理2.1传统机器学习（如SVM、随机森林）2.1.1特点2.1.2预处理重点灰度化二值化形态学操作特征工程2.2深度学习（如CNN、Transformer）2.2.1特点2.2.2预处理重点通道顺序
数据增强：扩充数据集提升模型泛化能力 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1.数据增强的重要性在机器学习领域，模型的泛化能力至关重要。一个泛化能力强的模型能够在未见数据上表现良好，而过拟合的模型则会在训练数据上表现出色，但在新数据上表现糟糕。数据增强是一种有效提升模型泛化能力的技术，它通过对现有数据进行各种变换，人为地扩充数据集，从而增加训练数据的数量和多样性。1.2.数据增强的应用场景数据增强广泛应用于各种机器学习任务中，包括：图像识别:对图像进行旋转
数据增强：扩充数据集，提升模型的鲁棒性 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。然而,在现实世界中,获取大量高质量的数据通常是一个巨大的挑战。数据采集过程耗时耗力,而且成本高昂。此外,某些领域的数据存在隐私和安全问题,难以获取。1.2数据集不足的挑战当数据集规模有限时,模型很容易过拟合,无法很好地推广到新的、
医疗影像联邦学习可解释性算法研究智能计算研究中心其他
内容概要医疗影像分析领域的联邦学习技术正面临数据隐私保护与模型可解释性的双重挑战。本研究以跨机构医疗影像协作场景为核心，系统性探讨联邦学习框架下可解释性算法的创新路径，重点解决医疗AI模型在分布式训练中的透明度缺失问题。通过引入动态特征选择机制与可解释性注意力模块，算法在保持数据本地化处理的同时，实现了关键病灶特征的跨域关联与可视化解析。研究同步整合自动化数据增强流程与多维度评估指标（如F1值、召
大语言模型的训练数据清洗策略 gs80140 AI python
目录大语言模型的训练数据清洗策略1.数据去重与标准化问题解决方案示例代码（Python实现数据去重）：2.过滤有害内容问题解决方案示例代码（基于关键词过滤有害内容）：3.纠正数据不均衡问题解决方案示例代码（欠采样非均衡数据）：4.识别和纠正刻板印象问题解决方案示例代码（简单的数据增强）：5.处理低质量与无关数据问题解决方案示例代码（去除HTML标签）：6.处理时效性数据问题解决方案示例代码（基于时
yolov4 zzh- 笔记
V4贡献：亲民政策，单GPU就能训练的非常好，接下来很多小模块都是这个出发点两大核心方法，从数据层面和网络设计层面来进行改善消融实验，感觉能做的都让他给做了，这工作量不轻全部实验都是单GPU完成，不用太担心设备了Bagoffreebies(BOF)只增加训练成本，但是能显著提高精度，并不影响推理速度数据增强：调整亮度、对比度、色调、随机缩放、剪切、翻转、旋转网络正则化的方法：Dropout、Dro
少样本数值型数据集 | 数据增强蒜蓉趣多多机器学习人工智能材料工程
对于小样本数字型数据集，数据增强的有效方法主要集中在创造新的样本、调整现有样本的特征、或者通过生成模型来模拟真实分布。下面是个人搜集到的方法及部分代码。希望对大家的科研/工作有所帮助！1.噪声注入(NoiseInjection)方法：在原始数据上添加少量的随机噪声，生成新的样本。噪声可以是高斯噪声、均匀分布噪声或其他分布的噪声。实现：对于每个特征，可以加上一个服从小均值和小方差的正态分布噪声，如X
Python第二十三课：自监督学习 | 无标注数据的觉醒程之编 Python全栈通关秘籍 python 开发语言人工智能机器学习
本节目标理解自监督学习的核心范式与优势掌握对比学习（ContrastiveLearning）框架实现图像掩码自编码器（MaskedAutoencoder）开发实战项目：亿级参数模型轻量化探索数据增强的创造性艺术一、自监督学习基础（AI的拼图游戏）1.核心思想解析学习范式数据需求生活比喻监督学习海量标注数据老师逐题批改作业无监督学习纯无标签数据自学杂乱笔记自监督学习自动生成伪标签玩拼图游戏（根据碎片
数据增强正在杀死你的模型：90%开发者不知道的回译质量陷阱人工智能
1回译增强的核心机理1.1跨语言语义重构原理目前文本数据增强方面效果较好的增强方法。回译数据增强（Back-translationAugmentation）是基于神经机器翻译的文本再生技术，其核心运作流程包含三个关键阶段：语义编码阶段：源语言文本通过NMT模型编码为中间语义表示跨语言迁移阶段：语义表示解码为目标语言文本（建议选择阿尔巴尼亚语、斯瓦希里语等低资源语种）语义重构阶段：目标语言文本二次编
增量预训练和微调的区别做个天秤座的程序猿大模型原理 webkit
文章目录前言一、增量预训练和微调的区别二、代码示例1.增量预训练示例2.微调示例3.代码的区别三、数据格式1.增量预训练2.微调3.示例4.小结四、数据量要求1.指导原则2.示例3.实际操作中的考虑4.小结前言增量预训练是一种在现有预训练模型的基础上，通过引入新的数据或任务来进一步训练模型的方法。这种方法的主要目的是在不从头开始训练模型的情况下，利用新数据或特定领域的数据增强模型的能力和性能。增量
医学文本分析中的命名实体识别：从理论到实践软件职业规划语言模型 unity 人工智能
1.数据预处理数据预处理是医学命名实体识别系统的基础步骤，其质量直接影响模型的训练效果和最终性能。数据预处理主要包括医学文本的标注、清洗以及数据增强三个方面。1.1医学文本的标注标注是数据预处理中的关键环节，其目的是将医学文本中的实体明确标记出来，以便模型能够学习到实体的特征和边界。标注的方式通常采用BIO标注法。1.1.1BIO标注法BIO标注法是一种广泛应用于命名实体识别任务的标注方式，它通过
生成对抗网络优化医疗影像分析方法智能计算研究中心其他
内容概要生成对抗网络（GAN）在医疗影像分析中的应用正经历从理论验证到临床落地的关键转型。本研究通过整合联邦学习算法与动态数据增强技术，构建了跨机构医疗影像协同分析框架，在保证患者隐私的前提下实现了数据资源的有效扩展。值得注意的是，算法优化过程中采用的三阶段特征工程策略——包括基于注意力机制的特征选择、多尺度特征融合以及可解释性特征映射——使模型决策透明度提升约37.6%。临床实践表明，将联邦学习
验证码识别：使用OCR技术识别图形验证码详解数据知道 2025年爬虫和逆向教程 ocr python 爬虫 OCR识别验证码识别图片验证码
文章目录一、基本原理二、所需工具2.1Python环境2.2图像处理库2.3OCR引擎2.4Python接口三、实现步骤3.1获取验证码图像3.2图像预处理3.3使用OCR进行字符识别3.4基本OCR识别样例四、提高识别准确率的方法4.1字符分割4.2使用深度学习模型4.3数据增强4.4集成多个OCR引擎五、实际应用中的注意事项六、总结验证码（CAPTCHA）是一种用于区分人类用户和自动化程序的安
从零开始：基于LLM大模型构建智能应用程序的完整指南 AI天才研究院 ChatGPT 人工智能
目录从零开始：基于LLM大模型构建智能应用程序的完整指南什么是LLM大模型如何利用LLM大模型构建智能应用程序1.收集和准备数据2.构建LLM大模型3.集成和部署4.监测和维护使用特定于私有领域的数据增强LLM检索增强生成(RAG)数据预处理、分块和检索技术零射击与少量射击提示和指导LLM大模型使用LLM进行推荐和聚类任务改善组织内的搜索体验考虑以上所有解锁的利基应用程序参考最近，围绕大型语言模型
Chebykan wx 文章阅读やっはろ深度学习
文献筛选[1]神经网络：全面基础[2]通过sigmoid函数的超层叠近似[3]多层前馈网络是通用近似器[5]注意力是你所需要的[6]深度残差学习用于图像识别[7]视觉化神经网络的损失景观[8]牙齿模具点云补全通过数据增强和混合RL-GAN[9]强化学习：一项调查[10]使用PySR和SymbolicRegression.jl的科学可解释机器学习[11]Z.Liu,Y.Wang,S.Vaidya,F
PointNet++改进策略：模块改进 | x-Conv | PointCNN，结合局部结构与全局排列提升模型性能我是瓦力 PointNet++改进策略人工智能深度学习计算机视觉
目录前言PointCNN实现细节1.XXX-Conv操作输入输出步骤2.PointCNN网络架构层级卷积分类与分割任务3.数据增强4.效率优化前言这篇论文介绍了一种名为PointCNN的方法，旨在从点云（pointcloud）数据中学习特征。传统卷积神经网络（CNN）在处理规则网格数据（如图像）时非常有效，但由于点云是无序且不规则的，直接在其上应用卷积操作会导致形状信息丢失，并对点的排列顺序敏感。
深度学习PyTorch之数据加载DataLoader @Mr_LiuYang 计算机视觉基础深度学习 pytorch 人工智能
深度学习pytorch之简单方法自定义9类卷积即插即用文章目录数据加载基础架构1、Dataset类详解2、DataLoader核心参数解析3、数据增强数据加载基础架构核心类关系图torch.utils.data├──Dataset(抽象基类)├──DataLoader(数据加载器)├──Sampler(采样策略)├──BatchSampler(批量采样)└──IterableDataset(流式数
一学就会的深度学习基础指令及操作步骤（6）迁移学习小圆圆666 深度学习迁移学习人工智能卷积神经网络
文章目录迁移学习模型准备数据增强模型训练模型微调和预测检查预测结果迁移学习迁移学习是将一个任务中学到的知识应用到另一个相关任务上，以提高新任务的学习效率和性能。优势：节省训练时间，提高模型性能，尤其在小数据场景下效果显著。核心是利用源域的知识来帮助目标域任务，比如在ImageNet上预训练的模型用于医疗影像分类。源域（SourceDomain）：已有知识的领域（如ImageNet图像库）。目标域（
深度学习 PyTorch 中 18 种数据增强策略与实现 @Mr_LiuYang 计算机视觉基础数据增强深度学习 torchvision transforms
深度学习pytorch之简单方法自定义9类卷积即插即用数据增强通过对训练数据进行多种变换，增加数据的多样性，它帮助我们提高模型的鲁棒性，并减少过拟合的风险。PyTorch提供torchvision.transforms模块丰富的数据增强操作，我们可以通过组合多种策略来实现复杂的增强效果。本文将介绍18种常用的图像数据增强策略，并展示如何使用PyTorch中的torchvision.transfor
AF3 block_delete_msa函数解读 qq_27390023 深度学习人工智能 python 生物信息学 pytorch
AlphaFold3data_transforms模块的block_delete_msa函数用于从MSA（多序列比对）中删除多个块（block）序列，以模拟MSA数据的缺失或噪声。这在训练时可能用于数据增强（防止模型对MSA过度依赖）。推理（inference）时不会使用，因为完整MSA对预测准确性很重要。源代码：#Notusedininference@curry1defblock_delete_
python数据增强——随机裁剪灰灰学姐数据增强 python 开发语言
importcv2importosimportrandominput_folder='JPEGImages'output_folder='images'ifnotos.path.exists(output_folder):os.makedirs(output_folder)#定义随机裁剪函数defrandom_crop(image,crop_size):h,w,_=image.shapeifh
探秘Mixup：数据增强的新利器荣正青
探秘Mixup：数据增强的新利器mixupImplementationofthemixuptrainingmethod项目地址:https://gitcode.com/gh_mirrors/mi/mixup项目简介是一个由HongyiZhang开发的Python库，它实现了机器学习中的数据增强策略——Mixup方法。这个项目的目标是通过混合不同样本的数据点生成新的训练样本，从而帮助模型更好地学习数
计算机视觉实战：YOLOv8在工业质检中的应用（附完整代码+数据集） emmm形成中深度学习人工智能 python 计算机视觉
计算机视觉实战：YOLOv8在工业质检中的应用（附完整代码+数据集）摘要：本文为零基础读者系统讲解目标检测核心原理，基于YOLOv8实现工业缺陷检测实战项目。从数据标注到模型部署，包含环境配置、数据增强、模型训练全流程详解，手把手教你打造高精度智能质检系统！关键词：YOLOv8、目标检测、工业质检、缺陷识别、PyTorch一、为什么选择YOLOv8做工业质检？1.1工业质检的三大痛点人工成本高：传
目标检测YOLO实战应用案例100讲-面向无人机图像的小目标检测林聪木无人机目标检测人工智能
目录知识储备YOLOv8无人机拍摄视角小目标检测数据集结构环境部署说明安装依赖模型训练权重和指标可视化展示训练YOLOv8PyQt5GUI开发主窗口代码main_window.py使用说明无人机目标跟踪一、目标跟踪的基本原理二、常用的目标跟踪算法基于YOLOv8+图像分割优化关键优化策略（基于VisDrone数据集实验验证）1.模型结构改进2.数据增强策略3.后处理优化4.训练技巧三、性能优化建议
第十三站：卷积神经网络（CNN）的优化武狐肆骸机器学习 cnn 人工智能神经网络
前言：在上一期我们构建了基本的卷积神经网络之后，接下来我们将学习一些提升网络性能的技巧和方法。这些优化技术包括数据增强、网络架构的改进、正则化技术。1.数据增强（DataAugmentation）数据增强是提升深度学习模型泛化能力的一种常见手段。通过对训练数据进行各种随机变换，可以生成更多的训练样本，帮助模型避免过拟合。常见的数据增强方法：旋转（Rotation）：随机旋转图像，增强模型对旋转变换
《深度剖析：生成对抗网络中生成器与判别器的高效协作之道》程序猿阿伟生成对抗网络人工智能机器学习
在人工智能的前沿领域，生成对抗网络（GAN）以其独特的对抗学习机制，为数据生成和处理带来了革命性的变革。生成器与判别器作为GAN的核心组件，它们之间的协作效率直接决定了GAN在图像生成、数据增强、风格迁移等众多应用中的表现。深入探究二者如何实现更高效的协作，不仅是优化GAN性能的关键，也为解锁人工智能更多创新应用场景提供了可能。生成器与判别器：GAN的核心架构解析生成器（Generator）的使命
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情