旅途中的宽~

【计算机视觉 | Kaggle】飞机凝结轨迹识别 Baseline 分享和解读（含源代码）

文章目录

一、导读
二、比赛背景
三、比赛任务
四、比赛数据
五、评价指标
六、Baseline
- 6.1 Training part
- 6.2 Submission part

一、导读

比赛名称：Google Research - Identify Contrails to Reduce Global Warming

https://www.kaggle.com/competitions/google-research-identify-contrails-reduce-global-warming

训练 ML 模型以识别卫星图像中的尾迹

比赛类型：计算机视觉、语义分割

二、比赛背景

Contrails 是“凝结轨迹”的缩写，是在飞机发动机排气中形成的线状冰晶云，由飞机飞过大气中的超潮湿区域时产生。持续的尾迹对全球变暖的贡献与它们为飞行所燃烧的燃料一样多。

凝结尾迹占人类造成的全球变暖的大约 1%，使用卫星图像的目的是确认已有的模型的预测效果。凝结尾迹是飞机发动机排气中形成的冰晶云。它们可以通过在大气中吸收热量来促进全球变暖。研究人员已经开发出模型来预测凝结尾迹何时形成以及它们将导致多少变暖。但是，他们需要使用卫星图像来验证这些模型。

三、比赛任务

在本次比赛中，您将使用地球静止卫星图像来识别航空轨迹。原始卫星图像是从GOES-16 Advanced Baseline Imager (ABI)获得的，它在Google Cloud Storage上公开可用。

轨迹必须包含至少 10 个像素
轨迹必须至少比宽度长 3 倍
轨迹应至少在两个图像中可见

四、比赛数据

train/ - 训练集；每个文件夹代表一个record_id
validation/ 与训练集相同，没有单独的标签注释
test/ - 测试集
sample_submission.csv - 格式正确的样本提交文件

五、评价指标

为了减小提交文件的大小，我们的指标对像素值使用游程编码。评价指标为 Dice coefficient：

$\frac{2 * |X \cap Y|}{|X| + |Y|}$
赛题是一个典型语义分割比赛，需要构建语义分割的模型。相比与常规的语义分割比赛，本次比赛有两个难点：

比赛数据集比较大，450GB
包含时序图片，并且标签和时序相关

六、Baseline

6.1 Training part

import sys
sys.path.append("../input/pretrained-models-pytorch")
sys.path.append("../input/efficientnet-pytorch")
sys.path.append("/kaggle/input/smp-github/segmentation_models.pytorch-master")
sys.path.append("/kaggle/input/timm-pretrained-resnest/resnest/")
import segmentation_models_pytorch as smp

具体来说，代码做了以下几个操作：

导入 sys 模块，用于添加新的路径到 Python 搜索路径中。
使用 sys.path.append 将 “…/input/pretrained-models-pytorch”、“…/input/efficientnet-pytorch”、“/kaggle/input/smp-github/segmentation_models.pytorch-master” 和 “/kaggle/input/timm-pretrained-resnest/resnest/” 这四个路径添加到 Python 搜索路径中。
导入了 segmentation_models_pytorch 模块，并使用别名 smp。

通过以上导入操作，你可以使用 smp 这个别名来调用 segmentation_models_pytorch 库中的函数和类，例如图像分割模型。

这样做的目的是为了方便在 Kaggle 环境中使用预训练的 PyTorch 模型和相关的图像分割工具，以便更轻松地进行图像分割任务的开发和实验。

%%writefile config.yaml

data_path: "/kaggle/input/contrails-images-ash-color"
output_dir: "models"

folds:
    n_splits: 4
    random_state: 42
train_folds: [0, 1, 2, 3]
    
seed: 42

train_bs: 48
valid_bs: 128
workers: 2

progress_bar_refresh_rate: 1

early_stop:
    monitor: "val_loss"
    mode: "min"
    patience: 999
    verbose: 1

trainer:
    max_epochs: 20
    min_epochs: 20
    enable_progress_bar: True
    precision: "16-mixed"
    devices: 2

model:
    seg_model: "Unet"
    encoder_name: "timm-resnest26d"
    loss_smooth: 1.0
    image_size: 384
    optimizer_params:
        lr: 0.0005
        weight_decay: 0.0
    scheduler:
        name: "cosine_with_hard_restarts_schedule_with_warmup"
        params:
            cosine_with_hard_restarts_schedule_with_warmup:
                num_warmup_steps: 350
                num_training_steps: 3150
                num_cycles: 1

这段代码是一个 YAML 格式的配置文件，用于配置一个图像分割任务的参数。YAML 是一种简单的数据序列化语言，用于配置和存储数据。

这份配置文件中包含了以下内容：

数据路径和输出目录：定义了数据集的路径和输出模型的目录。
交叉验证的折数：folds 部分指定了交叉验证的折数和随机种子，以便将数据集划分为训练集和验证集。
训练和验证的批次大小：train_bs 和 valid_bs 分别指定了训练和验证时的批次大小。
训练的其他参数：包括随机种子 seed、工作线程数量 workers、进度条刷新率 progress_bar_refresh_rate 等。
提前停止策略：early_stop 部分指定了提前停止的相关参数，例如监测的指标、模式（最小化或最大化）、耐心值等。
训练器（Trainer）参数：包括最大训练周期数 max_epochs、最小训练周期数 min_epochs、是否启用进度条等。
模型参数：model 部分定义了图像分割模型的相关参数，如分割模型的类型 seg_model、编码器的名称 encoder_name、图像大小 image_size、优化器参数等。

这样的配置文件可以让你在运行图像分割任务时轻松地修改参数和配置，以便快速尝试不同的设置和调整超参数，提高模型性能和训练效率。

# Dataset
import torch
import numpy as np
import torchvision.transforms as T

class ContrailsDataset(torch.utils.data.Dataset):
    def __init__(self, df, image_size=256, train=True):
        self.df = df
        self.trn = train
        self.normalize_image = T.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225))
        self.image_size = image_size
        if image_size != 256:
            self.resize_image = T.transforms.Resize(image_size)

    def __getitem__(self, index):
        row = self.df.iloc[index]
        con_path = row.path
        con = np.load(str(con_path))
        img = con[..., :-1]
        label = con[..., -1]
        label = torch.tensor(label)
        img = torch.tensor(np.reshape(img, (256, 256, 3))).to(torch.float32).permute(2, 0, 1)
        if self.image_size != 256:
            img = self.resize_image(img)
        img = self.normalize_image(img)
        return img.float(), label.float()

    def __len__(self):
        return len(self.df)

这段代码定义了一个 PyTorch 数据集类 ContrailsDataset，用于加载和处理图像分割任务的数据。

数据集类的主要功能包括：

初始化：在初始化过程中，数据集类接收一个数据帧（DataFrame） df，以及一个布尔值 train，用于标识数据集是用于训练还是验证。同时，它也接收一个整数 image_size，表示图像的大小，若该值不等于 256，则会使用 T.transforms.Resize 将图像调整为指定大小。
__getitem__ 方法：这是数据集类的核心方法，在使用索引来获取数据样本时会调用。在这个方法中，根据索引获取数据帧中的一行，从中提取出图像和标签，并对其进行处理。具体地，它会将读取的 numpy 数组转换为 PyTorch 张量，并进行大小和通道维度的调整，最后返回处理后的图像和标签。
__len__ 方法：这个方法返回数据集的样本数量，以便在训练和验证时知道数据集的总样本数。

该数据集类适用于加载存储在 numpy 格式中的图像和标签数据，并将其转换为 PyTorch 张量，供神经网络模型使用。注意，在使用该数据集类之前，你需要根据实际数据的存储方式和结构来适配数据帧 df，以确保正确读取图像和标签数据。

self.normalize_image 是一个 torchvision 的数据转换（transform），用于对图像数据进行归一化操作。在深度学习中，归一化是一个重要的预处理步骤，可以将图像的像素值缩放到特定的范围，以便更好地训练模型并提高模型的收敛性和稳定性。

在 torchvision 中，T.Normalize(mean, std) 是一个常用的数据转换，它将输入的图像数据进行归一化。它接受两个参数：

mean：这是一个包含三个元素的元组或列表，表示图像数据在每个通道上的均值。通常，这些均值是在大规模图像数据集上计算得到的。在这里，(0.485, 0.456, 0.406) 是对应于 ImageNet 数据集的 RGB 通道均值。
std：这也是一个包含三个元素的元组或列表，表示图像数据在每个通道上的标准差。同样，这些标准差也是在大规模图像数据集上计算得到的。在这里，(0.229, 0.224, 0.225) 是对应于 ImageNet 数据集的 RGB 通道标准差。

T.Normalize 的作用是将图像数据的每个通道减去均值，然后除以标准差，这样处理后的图像数据会具有零均值和单位方差，从而使数据的分布更稳定。

在 ContrailsDataset 类中，self.normalize_image 这个数据转换被用于对图像数据进行归一化处理。在 __getitem__ 方法中，将加载的图像数据转换为 PyTorch 张量后，会应用 self.normalize_image 来进行归一化处理，以便更好地输入神经网络模型。这样做可以有效地将数据缩放到合适的范围，以加快训练速度和提高模型性能。

__getitem__ 方法的完整实现。该方法用于获取数据集中的一个样本。

row = self.df.iloc[index]：从数据帧 df 中根据索引 index 获取相应行的数据。
con_path = row.path：从该行数据中获取路径信息，该路径指向一个数据文件，其中包含图像数据和标签数据。
con = np.load(str(con_path))：使用 NumPy 的 np.load() 方法加载数据文件，将其读取为一个 NumPy 数组 con。
img = con[..., :-1]：从 con 数组中获取图像部分，... 表示所有维度的索引，:-1 表示除了最后一个维度之外的所有维度。
label = con[..., -1]：从 con 数组中获取标签部分，... 表示所有维度的索引，-1 表示最后一个维度。
label = torch.tensor(label)：将标签数据转换为 PyTorch 张量。
img = torch.tensor(np.reshape(img, (256, 256, 3))).to(torch.float32).permute(2, 0, 1)：将图像数据转换为 PyTorch 张量，并进行一系列预处理操作。np.reshape(img, (256, 256, 3)) 将图像的通道维度移到最后，然后使用 torch.tensor() 将其转换为张量，to(torch.float32) 将数据类型转换为 float32，最后使用 permute(2, 0, 1) 将通道维度移到最前面，使其符合 PyTorch 的张量格式要求。
if self.image_size != 256:：检查图像的尺寸是否需要进行调整。
img = self.resize_image(img)：如果需要，将图像大小调整为 self.image_size。
img = self.normalize_image(img)：对图像数据进行标准化处理，将像素值缩放到固定的范围内，以适应模型的输入要求。
return img.float(), label.float()：返回处理后的图像和标签作为元组，并将它们转换为 float 类型的张量。

在 PyTorch 中，permute() 是一个张量的操作函数，用于重新排列张量的维度顺序。它的作用是改变张量的维度排列，不改变张量中的元素值。

permute() 函数的输入参数是一个表示新维度顺序的整数元组。例如，对于一个四维张量 tensor，可以使用 tensor.permute(0, 2, 3, 1) 来将原先的维度排列 [0, 1, 2, 3] 调整为 [0, 2, 3, 1]。

下面是一个示例：

import torch

# 创建一个四维张量
tensor = torch.randn(2, 3, 4, 5)
# 打印原始维度排列
print("Original tensor shape:", tensor.shape)  # Output: (2, 3, 4, 5)
# 使用 permute() 调整维度排列
tensor_permuted = tensor.permute(0, 2, 3, 1)
# 打印调整后的维度排列
print("Permuted tensor shape:", tensor_permuted.shape)  # Output: (2, 4, 5, 3)

在上面的示例中，原始张量的维度排列是 [2, 3, 4, 5]，使用 tensor.permute(0, 2, 3, 1) 调整为 [2, 4, 5, 3]。可以看到，张量的维度顺序被重新排列，但张量中的元素值保持不变。permute() 函数是一种非常便捷的方式来进行维度转换，特别是在神经网络的数据处理过程中，经常需要调整张量的维度以适应模型的输入要求。

# Lightning module

import torch
import pytorch_lightning as pl
import segmentation_models_pytorch as smp
from torch.optim.lr_scheduler import CosineAnnealingLR, ReduceLROnPlateau
from torch.optim import AdamW
import torch.nn as nn
from torchmetrics.functional import dice
from transformers import get_cosine_with_hard_restarts_schedule_with_warmup

seg_models = {
    "Unet": smp.Unet,
    "Unet++": smp.UnetPlusPlus,
    "MAnet": smp.MAnet,
    "Linknet": smp.Linknet,
    "FPN": smp.FPN,
    "PSPNet": smp.PSPNet,
    "PAN": smp.PAN,
    "DeepLabV3": smp.DeepLabV3,
    "DeepLabV3+": smp.DeepLabV3Plus,
}

class LightningModule(pl.LightningModule):
    def __init__(self, config):
        super().__init__()
        self.config = config
        self.model = model = seg_models[config["seg_model"]](
            encoder_name = config["encoder_name"],
            encoder_weights = "imagenet",
            in_channels = 3,
            classes = 1,
            activation = None,
        )
        self.loss_module = smp.losses.DiceLoss(mode="binary", smooth=config["loss_smooth"])
        self.val_step_outputs = []
        self.val_step_labels = []

    def forward(self, batch):
        imgs = batch
        preds = self.model(imgs)
        return preds

    def configure_optimizers(self):
        optimizer = AdamW(self.parameters(), **self.config["optimizer_params"])
        if self.config["scheduler"]["name"] == "CosineAnnealingLR":
            scheduler = CosineAnnealingLR(
                optimizer,
                **self.config["scheduler"]["params"]["CosineAnnealingLR"],
            )
            lr_scheduler_dict = {"scheduler": scheduler, "interval": "step"}
            return {"optimizer": optimizer, "lr_scheduler": lr_scheduler_dict}
        elif self.config["scheduler"]["name"] == "ReduceLROnPlateau":
            scheduler = ReduceLROnPlateau(
                optimizer,
                **self.config["scheduler"]["params"]["ReduceLROnPlateau"],
            )
            lr_scheduler = {"scheduler": scheduler, "monitor": "val_loss"}
            return {"optimizer": optimizer, "lr_scheduler": lr_scheduler}
        elif self.config["scheduler"]["name"] == "cosine_with_hard_restarts_schedule_with_warmup":
            scheduler = get_cosine_with_hard_restarts_schedule_with_warmup(
                optimizer,
                **self.config["scheduler"]["params"][self.config["scheduler"]["name"]],
            )
            lr_scheduler_dict = {"scheduler": scheduler, "interval": "step"}
            return {"optimizer": optimizer, "lr_scheduler": lr_scheduler_dict}

    def training_step(self, batch, batch_idx):
        imgs, labels = batch
        preds = self.model(imgs)
        if self.config["image_size"] != 256:
            preds = torch.nn.functional.interpolate(preds, size=256, mode='bilinear')
        loss = self.loss_module(preds, labels)
        self.log("train_loss", loss, on_step=True, on_epoch=True, prog_bar=True, batch_size=16)
        for param_group in self.trainer.optimizers[0].param_groups:
            lr = param_group["lr"]
        self.log("lr", lr, on_step=True, on_epoch=False, prog_bar=True)
        return loss

    def validation_step(self, batch, batch_idx):
        imgs, labels = batch
        preds = self.model(imgs)
        if self.config["image_size"] != 256:
            preds = torch.nn.functional.interpolate(preds, size=256, mode='bilinear')
        loss = self.loss_module(preds, labels)
        self.log("val_loss", loss, on_step=False, on_epoch=True, prog_bar=True)
        self.val_step_outputs.append(preds)
        self.val_step_labels.append(labels)

    def on_validation_epoch_end(self):
        all_preds = torch.cat(self.val_step_outputs)
        all_labels = torch.cat(self.val_step_labels)
        all_preds = torch.sigmoid(all_preds)
        self.val_step_outputs.clear()
        self.val_step_labels.clear()
        val_dice = dice(all_preds, all_labels.long())
        self.log("val_dice", val_dice, on_step=False, on_epoch=True, prog_bar=True)
        if self.trainer.global_rank == 0:
            print(f"\nEpoch: {self.current_epoch}", flush=True)

这段代码定义了一个 PyTorch Lightning 模块 LightningModule，用于训练图像分割模型。

主要功能包括：

初始化：在初始化过程中，接收一个配置参数 config，用于配置模型的参数和优化器。
构建图像分割模型：根据配置中的 seg_model 和 encoder_name，从 seg_models 字典中选择合适的图像分割模型，并初始化该模型。
定义损失函数：使用 smp.losses.DiceLoss 作为损失函数，并根据配置中的 loss_smooth 参数初始化 Dice Loss。
前向传播：在 forward 方法中，接收一个批次的图像数据 batch，将其输入模型中进行前向传播，并返回预测结果 preds。
配置优化器和学习率调度器：通过 configure_optimizers 方法配置优化器和学习率调度器。根据配置中的 scheduler，选择对应的学习率调度器，例如 CosineAnnealingLR、ReduceLROnPlateau 或 cosine_with_hard_restarts_schedule_with_warmup。
训练步骤：在 training_step 方法中，接收一个批次的图像数据 batch 和批次索引 batch_idx，执行模型的训练步骤。计算模型的预测结果 preds 和损失函数的值 loss，并输出训练的损失值和学习率。
验证步骤：在 validation_step 方法中，接收一个批次的图像数据 batch 和批次索引 batch_idx，执行模型的验证步骤。计算模型的预测结果 preds 和损失函数的值 loss，并输出验证的损失值。
验证轮结束时操作：在 on_validation_epoch_end 方法中，进行每个验证轮结束后的操作。计算 Dice 指标，并打印当前的训练轮数。

该 LightningModule 类为图像分割任务提供了整体的训练和验证流程，包括模型的初始化、损失函数的定义、前向传播、优化器和学习率调度器的配置，以及训练和验证的具体步骤。它是 PyTorch Lightning 框架中的一个核心组件，可以大大简化训练过程，并提供了丰富的功能和回调函数来定制化训练过程。

初始化的步骤：

__init__ 方法：初始化函数，在创建类实例时被调用，用于定义模型的结构和其他初始化操作。
- config: 是一个字典，包含了模型的配置参数。
- model: 初始化语义分割模型，通过 seg_models 字典中指定的 seg_model 和 encoder_name 来选择特定的语义分割模型。
- loss_module: 定义了用于计算损失的 DiceLoss，参数 mode="binary" 表示计算二值分割的 Dice Loss。
- val_step_outputs 和 val_step_labels: 这是用于保存验证步骤中的模型输出和真实标签的列表，以便在 validation_step 方法中使用和跟踪验证指标。

接下来，这个 LightningModule 类还包含其他几个方法，用于实现模型的前向传播、优化器和学习率调度器的配置，以及训练和验证步骤的定义。

前向传播过程：

forward 方法定义了模型的前向传播过程。它接收一个批次的输入数据 batch，其中 batch 是一个包含图像数据的张量。在这里，imgs 表示输入的图像数据。

然后，self.model 表示定义的语义分割模型，根据 config["seg_model"] 和 config["encoder_name"] 来选择相应的模型结构。self.model 接收 imgs 作为输入，进行前向传播，得到预测的语义分割结果 preds。

最后，forward 方法返回预测结果 preds，这个结果将在训练过程中用于计算损失和优化模型。

配置优化器和学习率调度器：

在这个方法中，首先根据配置参数 self.config["optimizer_params"] 创建一个 AdamW 优化器对象 optimizer，其中使用了模型的参数 self.parameters()。

然后，根据配置参数 self.config["scheduler"]["name"] 来选择相应的学习率调度器。

如果选择的调度器是 CosineAnnealingLR，则创建一个 CosineAnnealingLR 调度器对象 scheduler，并使用 self.config["scheduler"]["params"]["CosineAnnealingLR"] 中的参数来配置调度器。
如果选择的调度器是 ReduceLROnPlateau，则创建一个 ReduceLROnPlateau 调度器对象 scheduler，并使用 self.config["scheduler"]["params"]["ReduceLROnPlateau"] 中的参数来配置调度器。
如果选择的调度器是 cosine_with_hard_restarts_schedule_with_warmup，则创建一个使用 get_cosine_with_hard_restarts_schedule_with_warmup 函数生成的调度器对象 scheduler，并使用 self.config["scheduler"]["params"][self.config["scheduler"]["name"]] 中的参数来配置调度器。

最后，根据选择的调度器返回一个字典，其中包含了优化器和学习率调度器的配置信息。这样，在训练过程中，Lightning 就会自动地根据这些配置来进行优化和学习率调整。

在训练集上的一个前向传播和损失计算的步骤：

这个方法接收一个批次的输入数据 batch 和批次的索引 batch_idx。

首先，从输入批次 batch 中解包得到图像数据 imgs 和对应的标签 labels。然后，通过 self.model 对图像数据进行前向传播，得到预测的语义分割结果 preds。

如果配置中的 image_size 不等于 256，那么会对预测结果 preds 进行插值，将其调整为大小为 256x256 的分辨率。

接着，使用 self.loss_module 计算预测结果 preds 和真实标签 labels 之间的 Dice Loss。这里使用 Dice Loss 作为损失函数来度量预测结果和真实标签之间的相似度。

然后，通过 self.log 方法记录训练损失 train_loss，并设置 on_step=True 和 on_epoch=True，这样在训练过程中会每个步骤和每个 epoch 都打印损失，并显示在进度条中。

接下来，获取当前优化器的学习率 lr，并使用 self.log 方法记录学习率 lr，设置 on_step=True 和 on_epoch=False，这样在训练过程中会每个步骤打印学习率，并显示在进度条中。

最后，返回计算得到的损失值 loss，这个值将用于进行反向传播和模型的优化。

模型在验证集上的一个前向传播和损失计算的步骤：

这个方法接收一个批次的输入数据 batch 和批次的索引 batch_idx。

如果配置中的 image_size 不等于 256，那么会对预测结果 preds 进行插值，将其调整为大小为 256x256 的分辨率。

然后，通过 self.log 方法记录验证损失 val_loss，设置 on_step=False 和 on_epoch=True，这样在每个 epoch 结束时打印验证损失，并显示在进度条中。

接下来，将预测结果 preds 和标签 labels 添加到列表 self.val_step_outputs 和 self.val_step_labels 中，这样在每个 epoch 结束时可以使用这些数据来计算整个验证集上的评估指标。

注意，这里没有返回任何值，因为在 Lightning 中，在验证阶段只需要计算验证指标，不需要进行反向传播和优化，因此不需要返回损失值。

完成了一个完整的验证阶段后进行的操作：

该方法在每个 epoch 结束时被调用，用于对整个验证集的预测结果进行评估和记录。

首先，将所有验证步骤中得到的预测结果 self.val_step_outputs 和标签 self.val_step_labels 拼接起来，形成一个完整的预测结果和对应的标签，分别存储在 all_preds 和 all_labels 中。

然后，对预测结果 all_preds 进行 sigmoid 函数的转换，将其转换为概率值在 0 到 1 之间。

接着，使用 torchmetrics.functional.dice 函数计算预测结果 all_preds 和真实标签 all_labels 之间的 Dice 系数。Dice 系数是用于评估语义分割任务的一种指标，用于衡量预测结果与真实标签之间的相似度。

接下来，通过 self.log 方法记录验证集上的 Dice 系数 val_dice，设置 on_step=False 和 on_epoch=True，这样在每个 epoch 结束时打印验证集上的 Dice 系数，并显示在进度条中。

最后，如果当前进程是全局排名为 0 的进程（通常是主进程），则打印当前 epoch 的信息，例如显示当前 epoch 的编号，这里使用 self.current_epoch 来获取当前的 epoch 编号，并使用 print 函数打印该信息。

# Actual training
import warnings
warnings.filterwarnings("ignore")
import gc
import os
import torch
import yaml
import pandas as pd
import pytorch_lightning as pl
from pytorch_lightning.callbacks import ModelCheckpoint, EarlyStopping, TQDMProgressBar
from torch.utils.data import DataLoader
from sklearn.model_selection import KFold
from pytorch_lightning.loggers import CSVLogger

torch.set_float32_matmul_precision("medium")
with open("config.yaml", "r") as file_obj:
    config = yaml.safe_load(file_obj)
pl.seed_everything(config["seed"])
gc.enable()
contrails = os.path.join(config["data_path"], "contrails/")
train_path = os.path.join(config["data_path"], "train_df.csv")
valid_path = os.path.join(config["data_path"], "valid_df.csv")

train_df = pd.read_csv(train_path)
valid_df = pd.read_csv(valid_path)

train_df["path"] = contrails + train_df["record_id"].astype(str) + ".npy"
valid_df["path"] = contrails + valid_df["record_id"].astype(str) + ".npy"

df = pd.concat([train_df, valid_df]).reset_index()

Fold = KFold(shuffle=True, **config["folds"])
for n, (trn_index, val_index) in enumerate(Fold.split(df)):
    df.loc[val_index, "kfold"] = int(n)
df["kfold"] = df["kfold"].astype(int)

for fold in config["train_folds"]:
    print(f"\n###### Fold {fold}")
    trn_df = df[df.kfold != fold].reset_index(drop=True)
    vld_df = df[df.kfold == fold].reset_index(drop=True)
    dataset_train = ContrailsDataset(trn_df, config["model"]["image_size"], train=True)
    dataset_validation = ContrailsDataset(vld_df, config["model"]["image_size"], train=False)
    data_loader_train = DataLoader(
        dataset_train,
        batch_size=config["train_bs"],
        shuffle=True,
        num_workers=config["workers"],
    )
    data_loader_validation = DataLoader(
        dataset_validation,
        batch_size=config["valid_bs"],
        shuffle=False,
        num_workers=config["workers"],
    )
    checkpoint_callback = ModelCheckpoint(
        save_weights_only=True,
        monitor="val_dice",
        dirpath=config["output_dir"],
        mode="max",
        filename=f"model-f{fold}-{{val_dice:.4f}}",
        save_top_k=1,
        verbose=1,
    )
    progress_bar_callback = TQDMProgressBar(
        refresh_rate=config["progress_bar_refresh_rate"]
    )
    early_stop_callback = EarlyStopping(**config["early_stop"])

    trainer = pl.Trainer(
        callbacks=[checkpoint_callback, early_stop_callback, progress_bar_callback],
        logger=CSVLogger(save_dir=f'logs_f{fold}/'),
        **config["trainer"],
    )
    model = LightningModule(config["model"])
    trainer.fit(model, data_loader_train, data_loader_validation)

    del (
        dataset_train,
        dataset_validation,
        data_loader_train,
        data_loader_validation,
        model,
        trainer,
        checkpoint_callback,
        progress_bar_callback,
        early_stop_callback,
    )
    torch.cuda.empty_cache()
    gc.collect()

这段代码实际上是执行图像分割模型的训练过程。它使用了 PyTorch Lightning 框架来简化训练过程，并采用 K 折交叉验证的方式来训练多个模型。

主要步骤如下：

读取配置文件：首先，代码通过读取 “config.yaml” 配置文件来加载训练的参数设置。
数据准备：代码读取数据集文件并构建训练集和验证集的数据帧（DataFrame）。然后，根据 K 折交叉验证的要求，将数据划分为 K 份，其中 (K-1) 份作为训练集，1 份作为验证集。
开始训练：通过 for 循环，对每个折（fold）进行训练。
构建数据集和数据加载器：对于每个折，代码通过构建 ContrailsDataset 数据集类和数据加载器来加载训练和验证数据。将数据集传递给数据加载器，以便进行批量数据加载。
配置回调函数：为训练过程配置回调函数，包括模型保存回调、早停回调和进度条回调。这些回调函数在训练过程中会根据设定的条件执行相应的操作。
配置 pl.Trainer：通过配置 pl.Trainer 类，指定训练过程中的一些设置，例如使用的 GPU 数量、最大训练周期数、最小训练周期数等。
创建 LightningModule 模型：创建一个 LightningModule 模型，将配置文件中的参数传递给模型。
训练模型：使用 trainer.fit 方法进行模型的训练。在训练过程中，模型会自动执行前向传播、反向传播、优化器更新等操作。
清理资源：每完成一个折的训练后，代码会释放一些资源，如数据集、数据加载器、模型、回调函数等，以便于下一个折的训练。

整个训练过程会持续多个周期，每个周期（epoch）会对训练集进行迭代训练，然后在验证集上进行验证，并根据验证结果选择是否早停或保存模型。最终，通过多次 K 折交叉验证，可以得到多个训练好的模型，并从中选择最好的模型进行后续使用。

import seaborn as sn
import matplotlib.pyplot as plt

for fold in config["train_folds"]:
    metrics = pd.read_csv(f"/kaggle/working/logs_f{fold}/lightning_logs/version_0/metrics.csv")
    del metrics["step"]
    del metrics["lr"]
    del metrics["train_loss_step"]
    metrics.set_index("epoch", inplace=True)
    g = sn.relplot(data=metrics, kind="line")
    plt.title(f"Fold {fold}")
    plt.gcf().set_size_inches(15, 5)
    plt.grid()
    plt.show()

这段代码用于绘制图像分割模型训练过程中的一些指标随着训练周期的变化情况。它通过读取每个折（fold）的训练日志文件，提取相应的指标数据，并使用 seaborn 和 matplotlib 库进行可视化。

主要步骤如下：

通过 for 循环遍历每个折（fold）。
读取训练日志：使用 pd.read_csv 读取每个折训练的日志文件，该日志文件保存了训练过程中的指标数据。
数据预处理：删除不需要的列，并将 “epoch” 列设置为数据帧的索引，以便后续绘图。
绘制折（fold）的指标曲线：使用 sn.relplot 绘制每个折的指标随着训练周期的变化情况。这里使用了 seaborn 中的 relplot 函数来绘制折线图。
设置图像属性：设置图像的标题、尺寸和网格等属性。
显示图像：使用 plt.show() 显示绘制好的图像。

通过以上步骤，代码将绘制每个折的训练过程中指标的变化曲线，以便观察模型的训练情况、收敛性和性能。这样的可视化有助于了解训练的进展情况，并可以发现模型是否过拟合或欠拟合，以及在哪些周期达到了最佳性能等信息。

6.2 Submission part

import warnings
warnings.filterwarnings("ignore")
import gc
import os
import glob
import numpy as np
import pandas as pd
import torch
from torch import nn
from torch.utils.data import Dataset, DataLoader
import pytorch_lightning as pl
import torchvision.transforms as T
import yaml

这段代码导入了一系列的 Python 库和模块，用于进行图像分割任务的实验和开发。

具体的导入内容包括：

warnings：用于忽略警告信息，以便在实验过程中不显示警告。
gc：Python 的垃圾回收模块，用于处理内存管理和垃圾回收。
os：用于与操作系统进行交互，比如文件路径的操作和系统命令的执行。
glob：用于查找符合特定规则的文件路径。
numpy：用于处理数值计算和数组操作。
pandas：用于数据处理和分析，特别是用于处理结构化数据，如 DataFrame。
torch：PyTorch 深度学习框架的核心模块。
torch.nn：PyTorch 中的神经网络模块，包含各种层和损失函数。
Dataset 和 DataLoader：PyTorch 中用于处理数据的模块，用于加载数据集并构建数据加载器。
pytorch_lightning：PyTorch Lightning 是一个轻量级的 PyTorch 框架扩展，用于简化深度学习的训练和开发流程。
torchvision.transforms：用于定义图像数据的预处理和数据增强的模块。
yaml：用于读取和解析 YAML 格式的配置文件。

这些导入语句为后续的图像分割任务实验提供了必要的基础库和模块，可以方便地进行数据处理、模型定义、训练和验证等操作。同时，通过 PyTorch Lightning 的使用，还能进一步简化训练流程，并提供丰富的功能和回调函数来进行定制化的实验和调试。

batch_size = 32
num_workers = 1
THR = 0.5
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
data = '/kaggle/input/google-research-identify-contrails-reduce-global-warming'
data_root = '/kaggle/input/google-research-identify-contrails-reduce-global-warming/test/'
submission = pd.read_csv(os.path.join(data, 'sample_submission.csv'), index_col='record_id')

这段代码设置了一些变量和路径，为进行图像分割任务的预测和提交结果做准备。

具体的设置包括：

batch_size = 32：定义每个批次中的样本数量。
num_workers = 1：定义数据加载器的工作线程数量。
THR = 0.5：定义一个阈值（threshold），用于在进行预测时对模型输出进行二值化，以得到最终的分割结果。
device：定义计算设备，如果可用，则使用 CUDA 加速，否则使用 CPU 进行计算。
data：设置数据集的根路径，此处指向 “/kaggle/input/google-research-identify-contrails-reduce-global-warming”，该路径可能包含训练集和测试集等数据。
data_root：设置测试集数据的路径，指向 “/kaggle/input/google-research-identify-contrails-reduce-global-warming/test/”，该路径是测试集数据存放的目录。
submission：读取测试集的样本提交文件 “sample_submission.csv”，并将 “record_id” 列作为数据帧的索引，该文件用于提交最终的预测结果。

通过上述设置，代码为后续的测试数据加载、模型预测和结果提交做好了准备。具体的预测和提交过程可能会在后续的代码中进行。

filenames = os.listdir(data_root)
test_df = pd.DataFrame(filenames, columns = ['record_id'])
test_df['path'] = data_root + test_df['record_id'].astype(str)

这段代码用于构建测试集的数据帧（DataFrame），以便在进行图像分割模型的预测时使用。

具体步骤如下：

使用 os.listdir(data_root) 获取测试集数据目录 data_root 中的所有文件名列表 filenames。os.listdir() 函数会返回指定目录下的所有文件和子目录的名称。
创建一个新的数据帧 test_df，并将 filenames 列表作为一列 “record_id” 加入数据帧。
构建 “path” 列：将 “record_id” 列中的每个文件名转换为完整的文件路径，并添加为 “path” 列。这样，“path” 列中保存了测试集数据文件的完整路径。

通过以上步骤，代码将测试集数据的文件名和完整路径保存在数据帧 test_df 中，方便后续加载数据和进行模型的预测。每行数据表示测试集中的一个样本，其中 “record_id” 列保存了样本的文件名，“path” 列保存了样本的完整文件路径。

class ContrailsDataset(torch.utils.data.Dataset):
    def __init__(self, df, image_size=256, train=True):
        self.df = df
        self.trn = train
        self.df_idx: pd.DataFrame = pd.DataFrame({'idx': os.listdir(f'/kaggle/input/google-research-identify-contrails-reduce-global-warming/test')})
        self.normalize_image = T.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225))
        self.image_size = image_size
        if image_size != 256:
            self.resize_image = T.transforms.Resize(image_size)
    
    def read_record(self, directory):
        record_data = {}
        for x in [
            "band_11", 
            "band_14", 
            "band_15"
        ]:
            record_data[x] = np.load(os.path.join(directory, x + ".npy"))
        return record_data

    def normalize_range(self, data, bounds):
        """Maps data to the range [0, 1]."""
        return (data - bounds[0]) / (bounds[1] - bounds[0])
    
    def get_false_color(self, record_data):
        _T11_BOUNDS = (243, 303)
        _CLOUD_TOP_TDIFF_BOUNDS = (-4, 5)
        _TDIFF_BOUNDS = (-4, 2)
        N_TIMES_BEFORE = 4
        r = self.normalize_range(record_data["band_15"] - record_data["band_14"], _TDIFF_BOUNDS)
        g = self.normalize_range(record_data["band_14"] - record_data["band_11"], _CLOUD_TOP_TDIFF_BOUNDS)
        b = self.normalize_range(record_data["band_14"], _T11_BOUNDS)
        false_color = np.clip(np.stack([r, g, b], axis=2), 0, 1)
        img = false_color[..., N_TIMES_BEFORE]
        return img
    
    def __getitem__(self, index):
        row = self.df.iloc[index]
        con_path = row.path
        data = self.read_record(con_path)    
        img = self.get_false_color(data)
        img = torch.tensor(np.reshape(img, (256, 256, 3))).to(torch.float32).permute(2, 0, 1)
        if self.image_size != 256:
            img = self.resize_image(img) 
        img = self.normalize_image(img)
        image_id = int(self.df_idx.iloc[index]['idx'])    
        return img.float(), torch.tensor(image_id)
    
    def __len__(self):
        return len(self.df)

这是一个名为 ContrailsDataset 的 PyTorch 数据集类，用于处理图像分割任务中的数据加载和预处理。

类中包含以下方法：

__init__(self, df, image_size=256, train=True)：初始化方法，用于指定数据集的相关设置和参数。df 是包含样本信息的数据帧，image_size 是图像的尺寸，默认为 256，train 是一个布尔值，用于标识是否是训练集，如果为 True，则表示是训练集，否则表示是测试集。
read_record(self, directory)：用于从指定目录 directory 读取记录数据。这个方法从不同文件中加载 “band_11”、“band_14” 和 “band_15” 数据，然后返回这些数据组成的字典。
normalize_range(self, data, bounds)：用于将数据映射到指定范围 [0, 1] 的方法。data 是要映射的数据，bounds 是目标范围的上下界。
get_false_color(self, record_data)：用于生成伪彩色图像的方法。该方法从记录数据字典 record_data 中获取 “band_11”、“band_14” 和 “band_15” 数据，并通过归一化和组合生成伪彩色图像。
__getitem__(self, index)：用于获取数据集中特定索引处的数据样本。根据索引 index，读取数据帧 df 中对应的样本信息，调用 read_record 方法读取记录数据，并通过 get_false_color 方法生成伪彩色图像。然后，对图像进行大小调整、标准化处理，并返回图像和样本的 ID。
__len__(self)：用于获取数据集的长度，即样本的数量。

通过这个自定义的数据集类，可以方便地加载数据、对图像进行预处理，并在训练和预测过程中使用 PyTorch 的数据加载器来加载批次数据。这样，可以方便地将数据送入模型进行训练和推理。

get_false_color 方法用于生成伪彩色图像，主要是通过计算不同波段之间的像元值差异来构造一张伪彩色图像。在这里，该方法接受一个包含多个波段数据的字典 record_data 作为输入，然后根据不同波段之间的范围进行归一化，构造伪彩色图像并返回。

具体的步骤如下：

_T11_BOUNDS、_CLOUD_TOP_TDIFF_BOUNDS 和 _TDIFF_BOUNDS 是用来指定不同波段的范围。这些值用于将不同波段数据映射到 [0, 1] 范围内。
N_TIMES_BEFORE 是一个常量，用于指定取伪彩色图像的哪个时间点。在这里，根据 img = false_color[..., N_TIMES_BEFORE] 选择取第 N_TIMES_BEFORE 个时间点的伪彩色图像。
r、g 和 b 是分别对应于红、绿、蓝通道的像素值。计算这些通道的方法是通过对不同波段之间的像元值进行差异计算，然后将差异值映射到指定的范围内。
使用 np.clip 函数将归一化后的像素值限制在 [0, 1] 范围内，然后通过 np.stack 函数将三个通道的像素值堆叠在一起，构成一张伪彩色图像 false_color。
最后，根据选定的时间点 N_TIMES_BEFORE，从 false_color 中提取出对应时间点的伪彩色图像 img 并返回。

这样，get_false_color 方法可以根据给定的波段数据构造一张伪彩色图像，用于在深度学习模型中进行处理和训练。

def rle_encode(x, fg_val=1):
    """
    Args:
        x:  numpy array of shape (height, width), 1 - mask, 0 - background
    Returns: run length encoding as list
    """
    dots = np.where(
        x.T.flatten() == fg_val)[0]  # .T sets Fortran order down-then-right
    run_lengths = []
    prev = -2
    for b in dots:
        if b > prev + 1:
            run_lengths.extend((b + 1, 0))
        run_lengths[-1] += 1
        prev = b
    return run_lengths

def list_to_string(x):
    """
    Converts list to a string representation
    Empty list returns '-'
    """
    if x: # non-empty list
        s = str(x).replace("[", "").replace("]", "").replace(",", "")
    else:
        s = '-'
    return s

这段代码定义了两个辅助函数 rle_encode 和 list_to_string，用于对图像分割结果进行 Run Length Encoding (RLE) 编码和字符串转换的操作。

rle_encode(x, fg_val=1)：该函数用于对图像进行 RLE 编码。输入参数 x 是一个 NumPy 数组，表示一个二值化的图像掩码（mask），其中 1 表示目标区域（前景），0 表示背景区域。函数会将前景区域的像素位置编码成一串 RLE 格式的列表，返回的是一个包含像素位置和长度的列表。这个编码方法常用于图像分割任务的结果提交，以便减少提交文件的大小和计算量。
list_to_string(x)：该函数用于将列表转换为字符串表示。输入参数 x 是一个列表，函数会将列表转换为一个不包含方括号和逗号的字符串表示。如果列表为空，则返回 '-' 字符串。这个函数在对 RLE 编码结果进行字符串表示时很有用，方便保存到提交文件或其他输出中。

通过使用这两个辅助函数，可以将图像分割结果进行编码和转换为指定格式的字符串表示，方便提交预测结果或保存到文件中。这在进行图像分割任务的评估和结果输出时非常有用。

class LightningModule(pl.LightningModule):
    def __init__(self, config):
        super().__init__()
        self.model = smp.Unet(encoder_name=config["encoder_name"],
                              encoder_weights=None,
                              in_channels=3,
                              classes=1,
                              activation=None,
                              )
    def forward(self, batch):
        return self.model(batch)

这是一个 PyTorch Lightning 的子类 LightningModule，它定义了一个简单的图像分割模型。

该类包含以下方法：

__init__(self, config)：初始化方法，接受一个配置字典 config，并使用该配置创建 Unet 模型。encoder_name 指定了使用的编码器名称，encoder_weights 为 None 表示不使用预训练权重，in_channels=3 表示输入图像的通道数为 3（RGB 彩色图像），classes=1 表示输出的通道数为 1（二值化的分割掩码），activation=None 表示不使用激活函数。
forward(self, batch)：前向传播方法，接受一个批次的图像 batch，并将其传递给 Unet 模型进行前向计算，返回模型的输出。

该类继承了 PyTorch Lightning 的 pl.LightningModule，因此它具有 Lightning 模型所需的必要功能，如 training_step、validation_step、configure_optimizers 等方法。在实际的训练和验证过程中，可以使用此 Lightning 模型类，以更简洁的方式定义和管理模型，并进行训练和推理。

MODEL_PATH = "/kaggle/working/models/"
#with open(os.path.join(MODEL_PATH, "config.yaml"), "r") as file_obj:
#    config = yaml.safe_load(file_obj)

test_ds = ContrailsDataset(
        test_df,
        config["model"]["image_size"],
        train = False
    )
test_dl = DataLoader(test_ds, batch_size=batch_size, num_workers = num_workers)

这部分代码用于创建测试集的数据加载器（DataLoader），以便在模型推理（预测）阶段使用。

ContrailsDataset 是之前定义的用于加载测试数据的自定义数据集类，通过传入测试数据的信息 test_df 和其他相关参数，创建了 test_ds 对象。
test_ds：是通过 ContrailsDataset 类创建的测试数据集对象，用于加载测试集的图像数据并进行预处理。
config["model"]["image_size"]：通过访问配置字典 config 中的 “model” 部分，并获取 “image_size” 参数的值，即测试数据的图像尺寸。
train=False：将 train 参数设为 False，表示 test_ds 是测试数据集，以便在数据集类中进行相应处理。
DataLoader 是 PyTorch 提供的数据加载器，用于批量加载数据。通过传入 test_ds 数据集对象、batch_size 和 num_workers 参数，创建了 test_dl 数据加载器。
batch_size=batch_size：指定每个批次中的样本数量，这里使用之前设定的 batch_size 值。
num_workers=num_workers：指定数据加载器的工作线程数量，这里使用之前设定的 num_workers 值。

通过创建测试数据加载器 test_dl，我们可以方便地批量加载测试数据，然后将数据输入到模型进行预测，最终得到测试集的分割结果。

gc.enable()
all_preds = {}

for i, model_path in enumerate(glob.glob(MODEL_PATH + '*.ckpt')):
    print(model_path)
    model = LightningModule(config["model"]).load_from_checkpoint(model_path, config=config["model"])
    model.to(device)
    model.eval()
    model_preds = {}
    for _, data in enumerate(test_dl):
        images, image_id = data
        images = images.to(device)
        with torch.no_grad():
            predicted_mask = model(images[:, :, :, :])
        if config["model"]["image_size"] != 256:
            predicted_mask = torch.nn.functional.interpolate(predicted_mask, size=256, mode='bilinear')
        predicted_mask = torch.sigmoid(predicted_mask).cpu().detach().numpy()     
        for img_num in range(0, images.shape[0]):
            current_mask = predicted_mask[img_num, :, :, :]
            current_image_id = image_id[img_num].item()
            model_preds[current_image_id] = current_mask
    all_preds[f"f{i}"] = model_preds
    del model    
    torch.cuda.empty_cache()
    gc.collect()

这段代码使用已经训练好的多个模型对测试集进行预测，并将预测结果保存在 all_preds 字典中。

gc.enable()：启用 Python 的垃圾回收，这有助于及时释放不再使用的内存。
all_preds = {}：创建一个空字典 all_preds，用于存储所有模型的预测结果。
for i, model_path in enumerate(glob.glob(MODEL_PATH + '*.ckpt')):：使用 glob.glob() 函数获取所有以 “.ckpt” 结尾的文件路径，即训练好的模型的路径。然后，通过循环遍历所有的模型文件。
model = LightningModule(config["model"]).load_from_checkpoint(model_path, config=config["model"])：加载指定路径 model_path 的训练好的模型，并根据配置 config["model"] 创建 Lightning 模型。这里使用 .load_from_checkpoint() 方法来加载模型。
model.to(device)：将模型移动到指定的计算设备 device（GPU 或 CPU）上。
model.eval()：将模型设置为评估模式，即关闭 BatchNormalization 和 Dropout 层，以便在推理阶段保持一致的行为。
model_preds = {}：创建一个空字典 model_preds，用于存储当前模型的预测结果。
for _, data in enumerate(test_dl):：使用 test_dl 数据加载器循环遍历测试集的数据。
images, image_id = data：从 test_dl 中获取当前批次的图像数据 images 和图像 ID image_id。
images = images.to(device)：将图像数据移动到指定的计算设备上。
with torch.no_grad():：使用 torch.no_grad() 上下文管理器，关闭梯度计算，加速推理过程。
predicted_mask = model(images[:, :, :, :])：对图像进行预测，得到模型输出 predicted_mask。
if config["model"]["image_size"] != 256:：根据配置中的图像尺寸，对模型输出进行大小调整。
predicted_mask = torch.sigmoid(predicted_mask).cpu().detach().numpy()：将模型输出进行sigmoid激活，并将结果转换为NumPy数组。这里得到了每个图像的预测掩码。
for img_num in range(0, images.shape[0]):：遍历当前批次中的每张图像。
current_mask = predicted_mask[img_num, :, :, :]：获取当前图像的预测掩码。
current_image_id = image_id[img_num].item()：获取当前图像的图像 ID。
model_preds[current_image_id] = current_mask：将当前图像的预测掩码加入 model_preds 字典中，以图像 ID 为键，掩码为值。
all_preds[f"f{i}"] = model_preds：将当前模型的预测结果加入 all_preds 字典中，以模型编号 f{i} 为键，当前模型的预测结果为值。
del model、torch.cuda.empty_cache() 和 gc.collect()：释放模型占用的内存并进行垃圾回收，以便在下一次循环中使用新的模型。

通过上述循环，代码对测试集中的所有图像使用多个训练好的模型进行预测，并将每个模型的预测结果保存在 all_preds 字典中。每个模型的预测结果都是一个字典，其中每个图像 ID 对应一个预测掩码，即每张图像的分割预测结果。

for index in submission.index.tolist():
    for i in range(len(glob.glob(MODEL_PATH + '*.ckpt'))):
        if i == 0:
            predicted_mask = all_preds[f"f{i}"][index]
        else:
            predicted_mask += all_preds[f"f{i}"][index]
    predicted_mask = predicted_mask / len(glob.glob(MODEL_PATH + '*.ckpt'))
    predicted_mask_with_threshold = np.zeros((256, 256))
    predicted_mask_with_threshold[predicted_mask[0, :, :] < THR] = 0
    predicted_mask_with_threshold[predicted_mask[0, :, :] > THR] = 1
    submission.loc[int(index), 'encoded_pixels'] = list_to_string(rle_encode(predicted_mask_with_threshold))

这段代码使用多个模型的预测结果来生成提交文件的 Run Length Encoding (RLE) 编码。

for index in submission.index.tolist():：对提交文件中的每个图像 ID 进行遍历。
for i in range(len(glob.glob(MODEL_PATH + '*.ckpt'))):：遍历之前训练好的多个模型的索引 i。
if i == 0:：如果是第一个模型的索引，将预测掩码初始化为 all_preds[f"f{i}"][index]。
else:：对于其他模型的索引，将预测掩码累加上 all_preds[f"f{i}"][index]，以获得多个模型的预测结果之和。
predicted_mask = predicted_mask / len(glob.glob(MODEL_PATH + '*.ckpt'))：将预测掩码除以模型的总数，以得到平均预测结果。
predicted_mask_with_threshold = np.zeros((256, 256))：创建一个大小为 (256, 256) 的全零数组，用于存储阈值化后的预测结果。
predicted_mask_with_threshold[predicted_mask[0, :, :] < THR] = 0 和 predicted_mask_with_threshold[predicted_mask[0, :, :] > THR] = 1：根据阈值 THR，将预测掩码中小于阈值的像素设置为0，大于阈值的像素设置为1，得到二值化的分割结果。
submission.loc[int(index), 'encoded_pixels'] = list_to_string(rle_encode(predicted_mask_with_threshold))：使用 RLE 编码函数对二值化的分割结果进行编码，并将编码后的结果保存在提交文件的相应行中。

通过上述步骤，代码将使用多个模型的预测结果进行投票或平均，然后根据阈值 THR 进行二值化处理，并最终将结果保存在提交文件中，用于在 Kaggle 上提交图像分割任务的预测结果。

你可能感兴趣的:(计算机视觉,kaggle,计算机视觉,人工智能,语义分割,kaggle)

算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI产品经理需要了解的算法知识 AI劳模人工智能产品经理 AI产品经理 AI产品经理入门零基础入门产品经理算法语言模型
1、自然语言生成（NLG）自然语言生成（NaturalLanguageGeneration，简称NLG）是一种人工智能技术，它的目标是将计算机的数据、逻辑或算法产生的信息转换成人类可读的自然语言文本。换句话说，NLG能让机器“学会”写文章、报告、故事或者其他任何形式的文字，就像人类作家那样。这项技术使得机器能够理解复杂的数据并将其转化为易于理解的语言，以适应不同的受众和情境。应用实例：金融报告自动
【Python】OpenAI API 宅男很神经 python 开发语言
【Python与OpenAIAPI深度探索：从基础到未来】第一章：OpenAIAPI概览与核心概念1.1OpenAIAPI是什么？能做什么？OpenAIAPI(ApplicationProgrammingInterface，应用程序编程接口)是一套允许开发者通过编程方式访问和使用OpenAI开发的各种先进人工智能模型的服务。这些模型经过海量数据的训练，能够在多种任务上达到甚至超越人类水平。通过AP
Python：操作 Word 对齐方式 Thomas Kant Python python word c#
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Python：操作Word对齐方式详解（左对齐/右对齐/居中/两端对齐）在日常办公自动化中，我们经常需要对Word文档中的段落设置对齐方式，如左对齐、右对齐、居中、两端对齐等。本文将带你使用python-docx库
TestCafe ➜ Playwright fixture 架构迁移指南 Thomas Kant 自动化测试 playwright testcafe typescript 测试架构
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】
医疗金融预测与语音识别中的模型优化及可解释性技术突破智能计算研究中心其他
内容概要随着人工智能技术的纵深发展，模型优化与可解释性技术正在重塑医疗诊断、金融预测及语音识别领域的应用范式。在医疗领域，基于自适应学习的动态参数调整机制，结合迁移学习的跨场景知识复用，显著提升了疾病筛查模型的泛化能力；而金融预测场景中，联邦学习框架通过分布式数据协作，在保障隐私安全的前提下，实现了风险预测模型的多维度优化。语音识别领域则依托边缘计算架构，将模型压缩技术与实时推理引擎结合，有效解决
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc