向岸看

尝试在UNet添加SK模块和CBAM模块

数据集：refuge数据集

训练轮数：10

Architecture	dice coefficient	mean IOU
unet	0.946	52.6
sk-unet	0.989	66.1
cbam-unet	0.988	65.8

（1）在UNet最后的输出卷积前添加，SK模块

训练结果：

[epoch: 9]
train_loss: 0.0710
lr: 0.009592
dice coefficient: 0.989
global correct: 97.8
average row correct: ['47.3', '99.1']
IoU: ['34.4', '97.8']
mean IoU: 66.1

模型改动：

from typing import Dict
import torch
import torch.nn as nn
import torch.nn.functional as F

# sk-unet
'''------------- SK模块-----------------------------'''
class SKConv(nn.Module):
    def __init__(self, features, WH, M, G, r, stride=1, L=32):
        """ Constructor
        Args:
            features: 输入通道维度
            WH: 输入特征图的空间维度
            M: 分支的数量
            G: 卷积组的数量
            r: 计算d，向量s的压缩倍数，C/r
            stride: 步长，默认为1
            L: 矢量z的最小维度，默认为32
        """
        super(SKConv, self).__init__()
        d = max(int(features / r), L)
        self.M = M
        self.features = features
        self.convs = nn.ModuleList([])
        # 使用不同kernel size的卷积，增加不同的感受野
        for i in range(M):
            self.convs.append(nn.Sequential(
                nn.Conv2d(features, features, kernel_size=3 + i * 2, stride=stride, padding=1 + i, groups=G),
                nn.BatchNorm2d(features),
                nn.ReLU(inplace=False)
            ))
        # 全局平均池化
        self.gap = nn.AvgPool2d(int(WH / stride))
        self.fc = nn.Linear(features, d)
        self.fcs = nn.ModuleList([])
        # 全连接层
        for i in range(M):
            self.fcs.append(
                nn.Linear(d, features)
            )
        self.softmax = nn.Softmax(dim=1)

    def forward(self, x):
        ''' Split操作'''
        for i, conv in enumerate(self.convs):
            fea = conv(x).unsqueeze_(dim=1)
            if i == 0:
                feas = fea
            else:
                feas = torch.cat([feas, fea], dim=1)

        ''' Fuse操作'''
        fea_U = torch.sum(feas, dim=1)
        fea_s = self.gap(fea_U).squeeze_()
        fea_z = self.fc(fea_s)

        ''' Select操作'''
        for i, fc in enumerate(self.fcs):
            # fc-->d*c维
            vector = fc(fea_z).unsqueeze_(dim=1)
            if i == 0:
                attention_vectors = vector
            else:
                attention_vectors = torch.cat([attention_vectors, vector], dim=1)
        # 计算attention权重
        attention_vectors = self.softmax(attention_vectors)
        attention_vectors = attention_vectors.unsqueeze(-1).unsqueeze(-1)
        # 最后一步，各特征图与对应的注意力权重相乘，得到输出特征图V
        fea_v = (feas * attention_vectors).sum(dim=1)
        return fea_v


# 卷积，在uent中卷积一般成对使用
class DoubleConv(nn.Sequential):
    # 输入通道数， 输出通道数， mid_channels为成对卷积中第一个卷积层的输出通道数
    def __init__(self, in_channels, out_channels, mid_channels=None):
        if mid_channels is None:
            mid_channels = out_channels
        super(DoubleConv, self).__init__(
            # 3*3卷积，填充为1，卷积之后输入输出的特征图大小一致
            nn.Conv2d(in_channels, mid_channels, kernel_size=3, padding=1, bias=False),
            nn.BatchNorm2d(mid_channels),
            nn.ReLU(inplace=True),
            nn.Conv2d(mid_channels, out_channels, kernel_size=3, padding=1, bias=False),
            nn.BatchNorm2d(out_channels),
            nn.ReLU(inplace=True)
        )

# 下采样
class Down(nn.Sequential):
    def __init__(self, in_channels, out_channels):
        super(Down, self).__init__(
            # 1.最大池化的窗口大小为2， 步长为2
            nn.MaxPool2d(2, stride=2),
            # 2.两个卷积
            DoubleConv(in_channels, out_channels)
        )

# 上采样
class Up(nn.Module):
    # bilinear是否采用双线性插值
    def __init__(self, in_channels, out_channels, bilinear=True):
        super(Up, self).__init__()
        if bilinear:
            # 使用双线性插值上采样
            # 上采样率为2，双线性插值模式
            self.up = nn.Upsample(scale_factor=2, mode='bilinear', align_corners=True)
            self.conv = DoubleConv(in_channels, out_channels, in_channels // 2)
        else:
            # 使用转置卷积上采样
            self.up = nn.ConvTranspose2d(in_channels, in_channels // 2, kernel_size=2, stride=2)
            self.conv = DoubleConv(in_channels, out_channels)

    def forward(self, x1: torch.Tensor, x2: torch.Tensor) -> torch.Tensor:
        x1 = self.up(x1)
        # [N, C, H, W]
        # 上采样之后的特征图与要拼接的特征图，高度方向的差值
        diff_y = x2.size()[2] - x1.size()[2]
        # 上采样之后的特征图与要拼接的特征图，宽度方向的差值
        diff_x = x2.size()[3] - x1.size()[3]

        # padding_left, padding_right, padding_top, padding_bottom
        # 1.填充差值
        x1 = F.pad(x1, [diff_x // 2, diff_x - diff_x // 2,
                        diff_y // 2, diff_y - diff_y // 2])

        # 2.拼接
        x = torch.cat([x2, x1], dim=1)
        # 3.卷积，两次卷积
        x = self.conv(x)
        return x

# 最后的1*1输出卷积
class OutConv(nn.Sequential):
    def __init__(self, in_channels, num_classes):
        super(OutConv, self).__init__(
            nn.Conv2d(in_channels, num_classes, kernel_size=1)
        )


class UNet(nn.Module):
    # 参数: 输入通道数， 分割任务个数， 是否使用双线插值， 网络中第一个卷积通道个数
    def __init__(self,
                 in_channels: int = 1,
                 num_classes: int = 2,
                 bilinear: bool = True,
                 base_c: int = 64):
        super(UNet, self).__init__()
        self.in_channels = in_channels
        self.num_classes = num_classes
        self.bilinear = bilinear

        self.in_conv = DoubleConv(in_channels, base_c)

        # 下采样，参数:输入通道,输出通道
        self.down1 = Down(base_c, base_c * 2)
        self.down2 = Down(base_c * 2, base_c * 4)
        self.down3 = Down(base_c * 4, base_c * 8)


        # 如果采用双线插值上采样为 2，采用转置矩阵上采样为 1
        factor = 2 if bilinear else 1
        # 最后一个下采样，如果是双线插值则输出通道为512，否则为1024
        self.down4 = Down(base_c * 8, base_c * 16 // factor)

        # 上采样，参数:输入通道,输出通道
        self.up1 = Up(base_c * 16, base_c * 8 // factor, bilinear)
        self.up2 = Up(base_c * 8, base_c * 4 // factor, bilinear)
        self.up3 = Up(base_c * 4, base_c * 2 // factor, bilinear)
        self.up4 = Up(base_c * 2, base_c, bilinear)
        # 最后的1*1输出卷积
        self.out_conv = OutConv(base_c, num_classes)

        # # sk模块
        self.sk = SKConv(base_c, 480, 2, 1, 2)

    # 正向传播过程
    def forward(self, x: torch.Tensor) -> Dict[str, torch.Tensor]:
        # 1. 定义最开始的两个卷积层
        x1 = self.in_conv(x)

        # 2. contracting path（收缩路径）
        x2 = self.down1(x1)
        x3 = self.down2(x2)
        x4 = self.down3(x3)
        x5 = self.down4(x4)
        # 3. expanding path（扩展路径）
        x = self.up1(x5, x4)
        x = self.up2(x, x3)
        x = self.up3(x, x2)
        x = self.up4(x, x1)
        # sk模块
        x = self.sk(x)

        # 4. 最后1*1输出卷积
        logits = self.out_conv(x)


        return {"out": logits}

（2）在UNet最后的输出卷积后添加，CBAM模块

训练结果：

[epoch: 9]
train_loss: 0.2040
lr: 0.000000
dice coefficient: 0.988
global correct: 97.7
average row correct: ['48.6', '98.9']
IoU: ['33.8', '97.7']
mean IoU: 65.8

模型改动：

import os
import time
import datetime

import torch

from src import UNet
from train_utils import train_one_epoch, evaluate, create_lr_scheduler
from my_dataset import DriveDataset
import transforms as T


class SegmentationPresetTrain:
    def __init__(self, base_size, crop_size, hflip_prob=0.5, vflip_prob=0.5,
                 mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225)):
        min_size = int(0.5 * base_size)
        max_size = int(1.2 * base_size)

        trans = [T.RandomResize(min_size, max_size)]
        if hflip_prob > 0:
            trans.append(T.RandomHorizontalFlip(hflip_prob))
        if vflip_prob > 0:
            trans.append(T.RandomVerticalFlip(vflip_prob))
        trans.extend([
            T.RandomCrop(crop_size),
            T.ToTensor(),
            T.Normalize(mean=mean, std=std),
        ])
        self.transforms = T.Compose(trans)

    def __call__(self, img, target):
        return self.transforms(img, target)


class SegmentationPresetEval:
    def __init__(self, mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225)):
        self.transforms = T.Compose([
            T.ToTensor(),
            T.Normalize(mean=mean, std=std),
        ])

    def __call__(self, img, target):
        return self.transforms(img, target)


def get_transform(train, mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225)):
    base_size = 565
    crop_size = 480

    if train:
        return SegmentationPresetTrain(base_size, crop_size, mean=mean, std=std)
    else:
        return SegmentationPresetEval(mean=mean, std=std)

# 传入参数，创建模型
def create_model(num_classes):
    model = UNet(in_channels=3, num_classes=num_classes, base_c=32)
    return model


def main(args):
    device = torch.device(args.device if torch.cuda.is_available() else "cpu")
    batch_size = args.batch_size
    # segmentation nun_classes + background
    num_classes = args.num_classes + 1

    # using compute_mean_std.py
    mean = (0.709, 0.381, 0.224)
    std = (0.127, 0.079, 0.043)

    # 用来保存训练以及验证过程中信息
    results_file = "results{}.txt".format(datetime.datetime.now().strftime("%Y%m%d-%H%M%S"))

    train_dataset = DriveDataset(args.data_path,
                                 train=True,
                                 transforms=get_transform(train=True, mean=mean, std=std))

    val_dataset = DriveDataset(args.data_path,
                               train=False,
                               transforms=get_transform(train=False, mean=mean, std=std))

    num_workers = min([os.cpu_count(), batch_size if batch_size > 1 else 0, 8])
    train_loader = torch.utils.data.DataLoader(train_dataset,
                                               batch_size=batch_size,
                                               num_workers=num_workers,
                                               shuffle=True,
                                               pin_memory=True,
                                               collate_fn=train_dataset.collate_fn)

    val_loader = torch.utils.data.DataLoader(val_dataset,
                                             batch_size=1,
                                             num_workers=num_workers,
                                             pin_memory=True,
                                             collate_fn=val_dataset.collate_fn)

    model = create_model(num_classes=num_classes)
    model.to(device)

    params_to_optimize = [p for p in model.parameters() if p.requires_grad]

    optimizer = torch.optim.SGD(
        params_to_optimize,
        lr=args.lr, momentum=args.momentum, weight_decay=args.weight_decay
    )

    scaler = torch.cuda.amp.GradScaler() if args.amp else None

    # 创建学习率更新策略，这里是每个step更新一次(不是每个epoch)
    lr_scheduler = create_lr_scheduler(optimizer, len(train_loader), args.epochs, warmup=True)

    if args.resume:
        checkpoint = torch.load(args.resume, map_location='cpu')
        model.load_state_dict(checkpoint['model'])
        optimizer.load_state_dict(checkpoint['optimizer'])
        lr_scheduler.load_state_dict(checkpoint['lr_scheduler'])
        args.start_epoch = checkpoint['epoch'] + 1
        if args.amp:
            scaler.load_state_dict(checkpoint["scaler"])

    best_dice = 0.
    start_time = time.time()
    for epoch in range(args.start_epoch, args.epochs):
        mean_loss, lr = train_one_epoch(model, optimizer, train_loader, device, epoch, num_classes,
                                        lr_scheduler=lr_scheduler, print_freq=args.print_freq, scaler=scaler)

        confmat, dice = evaluate(model, val_loader, device=device, num_classes=num_classes)
        val_info = str(confmat)
        print(val_info)
        print(f"dice coefficient: {dice:.3f}")
        # write into txt
        with open(results_file, "a") as f:
            # 记录每个epoch对应的train_loss、lr以及验证集各指标
            train_info = f"[epoch: {epoch}]\n" \
                         f"train_loss: {mean_loss:.4f}\n" \
                         f"lr: {lr:.6f}\n" \
                         f"dice coefficient: {dice:.3f}\n"
            f.write(train_info + val_info + "\n\n")

        if args.save_best is True:
            if best_dice < dice:
                best_dice = dice
            else:
                continue

        save_file = {"model": model.state_dict(),
                     "optimizer": optimizer.state_dict(),
                     "lr_scheduler": lr_scheduler.state_dict(),
                     "epoch": epoch,
                     "args": args}
        if args.amp:
            save_file["scaler"] = scaler.state_dict()

        if args.save_best is True:
            torch.save(save_file, "save_weights/best_model.pth")
        else:
            torch.save(save_file, "save_weights/model_{}.pth".format(epoch))

    total_time = time.time() - start_time
    total_time_str = str(datetime.timedelta(seconds=int(total_time)))
    print("training time {}".format(total_time_str))


def parse_args():
    import argparse
    parser = argparse.ArgumentParser(description="pytorch unet training")

    parser.add_argument("--data-path", default="./", help="DRIVE2 root")
    # exclude background
    parser.add_argument("--num-classes", default=1, type=int)
    parser.add_argument("--device", default="cuda", help="training device")
    parser.add_argument("-b", "--batch-size", default=4, type=int)
    parser.add_argument("--epochs", default=10, type=int, metavar="N",
                        help="number of total epochs to train")

    parser.add_argument('--lr', default=0.01, type=float, help='initial learning rate')
    parser.add_argument('--momentum', default=0.9, type=float, metavar='M',
                        help='momentum')
    parser.add_argument('--wd', '--weight-decay', default=1e-4, type=float,
                        metavar='W', help='weight decay (default: 1e-4)',
                        dest='weight_decay')
    parser.add_argument('--print-freq', default=1, type=int, help='print frequency')
    parser.add_argument('--resume', default='', help='resume from checkpoint')
    parser.add_argument('--start-epoch', default=0, type=int, metavar='N',
                        help='start epoch')
    parser.add_argument('--save-best', default=True, type=bool, help='only save best dice weights')
    # Mixed precision training parameters
    parser.add_argument("--amp", default=False, type=bool,
                        help="Use torch.cuda.amp for mixed precision training")

    args = parser.parse_args()

    return args


if __name__ == '__main__':
    args = parse_args()

    if not os.path.exists("./save_weights"):
        os.mkdir("./save_weights")

    main(args)

TypeError: detect_image() missing 1 required positional argument: ‘image‘（已解决） Vertira pytorch pytorch
TypeError:detect_image()missing1requiredpositionalargument:'image'这是在没有实例化类对象的情况下，强行硬访问类的成员函数的结果。我在程序中直接使用Unet()中的detect_image()函数，结果出现上面的错误，具体强制使用的程序程序如下这样访问类的成员是不对的。在上面的第一个图像上面已经实例化了类对象，为什么不用呢unet=U
UNet改进（5）：线性注意力机制（Linear Attention）-原理详解与代码实现摸鱼许可证人工智能计算机视觉
引言在计算机视觉领域，UNet架构因其在图像分割任务中的卓越表现而广受欢迎。近年来，注意力机制的引入进一步提升了UNet的性能。本文将深入分析一个结合了线性注意力机制的UNet实现，探讨其设计原理、代码实现以及在医学图像分割等任务中的应用潜力。UNet架构概述UNet最初由Ronneberger等人提出，主要用于生物医学图像分割。其独特的U形结构由编码器（下采样路径）和解码器（上采样路径）组成，通
nnUNet V2代码——图像增强（三） w1ndfly 阅读nnUNet V2代码图像增强计算机视觉 nnunet 机器学习深度学习人工智能图像增强
本文阅读的nnU-NetV2图像增强有亮度调整、对比度调整、低分辨率调整各个类内的各个函数的调用关系见前文nnUNetV2代码——图像增强（一）的BasicTransform类安装batchgeneratorsv2，nnU-NetV2关于图像增强的代码都在这个库中，点击链接，将其clone到本地后，在命令行进入文件夹内，pipinstall-e.即可（注意-e后有个点）。本文目录一Multipli
nnUNet V2修改网络——暴力替换网络为Swin-Unet w1ndfly nnU-Net V2修改网络 nnunet 深度学习人工智能机器学习 nnunetv2
更换前，要用nnUNetV2跑通所用数据集，证明nnUNetV2、数据集、运行环境等没有问题阅读nnU-NetV2的U-Net结构，初步了解要修改的网络，知己知彼，修改起来才能游刃有余。Swin-Unet是一种基于纯Transformer的U型编码器-解码器架构，专为医学图像分割任务设计。传统方法主要依赖卷积神经网络（CNN），尤其是U-Net及其变体，通过局部卷积操作和跳跃连接提取多尺度特征。然
nnUNet V2修改网络——加入MultiResBlock模块 w1ndfly nnU-Net V2修改网络深度学习人工智能卷积神经网络计算机视觉机器学习 nnunet nnU-Net V2
更换前，要用nnUNetV2跑通所用数据集，证明nnUNetV2、数据集、运行环境等没有问题阅读nnU-NetV2的U-Net结构，初步了解要修改的网络，知己知彼，修改起来才能游刃有余。MultiResBlock是MultiResUNet中核心组件之一，旨在解决传统U-Net在处理多尺度医学图像时的局限性。传统的U-Net使用固定大小的卷积核（如3x3），这在处理具有不同尺度特征的医学图像时可能不
nnUNet V2代码——图像增强（一） w1ndfly 图像增强阅读nnUNet V2代码计算机视觉机器学习深度学习人工智能 nnunet nnU-Net V2 nnUNet
本文目录nnUNetV2使用的图像增强方法各个图像增强代码1.BasicTransform2.SpatialTransform__init__函数get_parameters函数_apply_to_image函数_apply_to_segmentation函数其余函数nnUNetV2使用的图像增强方法nnUNetV2会依照概率依次对图像应用以下图像增强方法：代码-类名对应图像增强方法Spatial
nnUNet V2代码——生成dataset_fingerprint.json w1ndfly 阅读nnUNet V2代码人工智能计算机视觉深度学习机器学习卷积神经网络 nnU-Net V2 nnunet
前文请见nnUNetv2_plan_and_preprocess命令阅读nnUNet\nnunetv2\experiment_planning\dataset_fingerprint\fingerprint_extractor.py文件内只有一个DatasetFingerprintExtractor类，阅读它在DatasetFingerprintExtractor类内涉及的其他函数都在文章后半部分
【图像去噪】论文精读：SUNet: Swin Transformer UNet for Image Denoising 十小大 transformer 深度学习图像去噪图像处理计算机视觉论文阅读论文笔记
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言AbstractI.INTRODUCTIONII.RELATEDWORKA.ImageRestorationB.UNetC.SwinTransformerIII.PR
干货分享 | 关于 UNet 架构的8个热门面试问题老唐777 人工智能机器学习深度学习计算机视觉图像处理面试 python
前言UNet架构是专门为图像分割任务设计的深度学习模型。由于其能够处理高分辨率图像并生成准确的分割图，因此广泛应用于各种应用，例如医学图像分割、卫星图像分析和自动驾驶车辆中的目标检测。UNet非常适合多类图像分割任务，但可能需要平衡训练数据或使用概率分割图来处理类重叠或不平衡的类分布。本文主要介绍关于UNet架构的8个热门面试问题，希望对你有所帮助。资料分享正式开始之前，为了方便大家学习，我整理了
全球首套10米分辨率全球梯田分布图做科研的周师兄数据集分享大数据数据分析
梯田农业在山区发挥着至关重要的作用，可以防止水土流失，优化土地利用，并支持当地生态系统。然而，由于缺乏统一的自动识别模型，对梯田全球分布的研究有限。尽管近年来深度学习架构发展迅速，但它们在提取梯田地图方面的表现仍需进一步研究。为了解决这一局限性，本研究比较了八种最先进的深度学习模型的性能，包括UNet、HRNet、DeepLabv3+、TransUNet、Segmenter、PVTv2、Swin-
1.基于PyTorch实现的UNet模型代码进行数据集测试2.Transformer和CNN混合模型，用于图像分割任务3.基于Swin Transformer图像分割模型架构 OICQQ67658008 pytorch transformer cnn
1.基于PyTorch实现的UNet模型代码进行数据集测试2.Transformer和CNN混合模型，用于图像分割任务3.基于SwinTransformer图像分割模型架构文章目录1.UNet模型定义2.数据集准备3.测试代码模型架构解析PyTorch实现架构解析PyTorch实现经典的UNet架构，它是一种用于图像分割的卷积神经网络。UNet由编码器和解码器两部分组成，通过跳跃连接（skipco
【AI】YOLOv7部署在NVIDIA Jetson TX2上郭老二 AI 人工智能 YOLO 计算机视觉
AI学习目录汇总1、硬件平台1.1MCUMicrocontrollerUnit，微处理器在单片机上也能跑的AI算法，好神奇啊，比如MCUNet1.2CPUCentralProcessingUnit，中央处理器一般的框架都有CPU版本，当然速度会慢一些，在x86电脑上勉强能用，在嵌入式ARM板上几乎无法使用1.3GPUGraphicsProcessingUnit，图形处理器例如英伟达的各种显卡等，具
nnUNet V2修改网络——暴力替换网络为UCTransNet w1ndfly nnU-Net V2修改网络 nnU-Net V2 nnunet 深度学习计算机视觉机器学习
更换前，要用nnUNetV2跑通所用数据集，证明nnUNetV2、数据集、运行环境等没有问题阅读nnU-NetV2的U-Net结构，初步了解要修改的网络，知己知彼，修改起来才能游刃有余。UCTransNet是一种创新的医学图像分割网络，它重新思考了U-Net中的跳跃连接设计。该网络以U-Net为基础架构，引入了通道变换器（CTrans）模块，专门用于替代传统的跳跃连接。其核心在于多尺度通道交叉融合
UNet 改进(26)：与FPN结合的图像分割网络点我头像干啥 Unet 模型改进 transformer 深度学习人工智能
1.介绍在计算机视觉领域，图像分割是一个核心任务，而UNet架构因其优异的性能在医学图像分割等领域广受欢迎。本文将详细解析一个结合了UNet和特征金字塔网络(FPN)的创新架构，展示如何通过融合两种经典网络的优势来提升分割性能。网络架构概述这个代码实现了一个结合UNet和FPN的混合架构，主要包含以下几个关键组件：DoubleConv模块：基础的双卷积块FPN模块：特征金字塔网络UNetWithF
stable diffusion文生图代码解读 Qiming_v Diffusers stable diffusion 人工智能深度学习
来自于diffusers的文档，更好的说明了文生图pipeline是怎么执行的。fromPILimportImageimporttorchfromtransformersimportCLIPTextModel,CLIPTokenizerfromdiffusersimportAutoencoderKL,UNet2DConditionModel,UniPCMultistepSchedulerMODEL
UNET改进71：添加自研LEGM模块| AICurator Unet和Unet++改进专栏深度学习神经网络机器学习
本文内容：在不同位置添加LEGM目录论文简介1.步骤一2.步骤二3.步骤三4.步骤四论文简介从一张模糊图像中恢复出清晰的图像是一项开放的逆问题。尽管已取得显著的研究进展，但大多数现有方法忽略了下游任务对上游去雾过程的促进作用。从雾的生成机制来看，场景的深度信息与模糊图像之间存在潜在联系。基于此，我们提出了一种双任务协同互促框架，以实现单张图像的去雾。该框架通过双任务交互机制整合了深度估计和去雾，并
语义分割常用模型 jmxer 深度学习笔记 python 深度学习机器学习
VGG-Unetimporttorchimporttorch.nnasnn#定义一个通用的卷积块classConvBNReLU(nn.Sequential):def__init__(self,in_channels,out_channels,kernel_size=3,padding=1):super(ConvBNReLU,self).__init__(nn.Conv2d(in_channels,
ERDUnet: An Efficient Residual Double-codingUnet for Medical Image Segmentation 医学分割哇哇哇哇哇哇哇哇哇机器学习人工智能
ERDUnet:一种用于医学图像分割的高效残差双编码单元摘要医学图像分割在临床诊断中有着广泛的应用，基于卷积神经网络的分割方法已经能够达到较高的准确率。然而，提取全局上下文特征仍然很困难，而且参数太大，无法临床应用。为此，我们提出了一种新的网络结构来改进传统的编码器-解码器网络模型，在保持分割精度的同时节省了参数。通过构造一个能够同时提取局部特征和全局连续性信息的编码器模块，提高了特征提取效率。设
UNet 改进(24)：结合金字塔（PSP）场景解析的医学图像分割网络点我头像干啥 Unet 模型改进网络人工智能计算机视觉
1.介绍在医学图像分割领域，UNet架构因其优异的性能而广受欢迎。今天我们要分析的UNet_PSP是一个改进版的UNet，它在传统UNet的基础上引入了金字塔场景解析模块(PSP)，以更好地捕获多尺度上下文信息。本文将详细解析这个网络的架构设计、核心组件和实现细节。UNet_PSP整体保持了UNet的经典编码器-解码器结构，但在最底层的瓶颈层加入了PSP模块。这种设计结合了UNet的精确定位能力和
UNet 改进(23)：基于深度可分离卷积的UNet实现点我头像干啥 Unet 模型改进 transformer 深度学习人工智能
UNet是一种经典的编码器-解码器结构网络，广泛应用于图像分割任务。本文将详细解析一个使用深度可分离卷积改进的UNet实现，帮助读者理解其架构设计和实现细节。1.介绍代码概述这段代码实现了一个UNet网络架构，并提供了两种卷积块选择：•标准卷积块•深度可分离卷积块通过use_separable参数可以灵活切换这两种实现方式，让我们能够比较不同卷积方式对网络性能的影响。核心组件解析2.1深度可分离卷
Unet改进24：添加DualConv||轻量级深度神经网络的双卷积核 AICurator Unet和Unet++改进专栏深度学习神经网络机器学习 unet 语义分割
本文内容：在不同位置添加DualConv目录论文简介1.步骤一2.步骤二3.步骤三4.步骤四论文简介卷积神经网络(CNN)架构通常对内存和计算要求很高，这使得它们在硬件资源有限的嵌入式系统中不可行。我们提出了双卷积核(DualConv)来构建轻量级深度神经网络。DualConv结合3×3和1×1卷积核同时处理相同的输入特征映射通道，并利用群卷积技术高效排列卷积滤波器。DualConv可以在任何CN
Unet改进33：添加ConvolutionalGLU(2024最新改进方法)|紧凑的网络结构和高效的运算 AICurator Unet和Unet++改进专栏深度学习神经网络机器学习 unet 语义分割
本文内容：在不同位置添加ConvolutionalGLU目录论文简介1.步骤一2.步骤二3.步骤三4.步骤四论文简介由于残差连接的深度退化效应，许多依赖堆叠层进行信息交换的高效视觉变形模型往往不能形成足够的信息混合，导致视觉感知不自然。为了解决这个问题，在本文中，我们提出了聚合注意力，这是一种基于仿生设计的令牌混合器，它模拟生物中央凹视觉和连续眼运动，同时使特征映射上的每个令牌具有全局感知。此外，
UNet 改进(21)：可变形卷积UNet架构点我头像干啥 Unet 模型改进网络人工智能计算机视觉深度学习
1.网络详解本文将详细介绍一个基于可变形卷积(DeformableConvolution)的UNet网络实现，该网络结合了传统UNet架构和先进的DeformConv2d操作，能够更好地处理图像中的几何形变。网络架构概述这个实现包含两个主要组件：DoubleConv-双卷积块，可选择使用常规卷积或可变形卷积UNet-完整的UNet网络架构1.DoubleConv模块DoubleConv是一个包含两
复现：Mamba-UNet：降水临近预报的创新解决方案 hanfeng5268 深度学习 pytorch lstm 人工智能深度学习
S.Zhaoetal.,“Mamba-UNet:Dual-BranchMambaFusionU-NetWithMultiscaleSpatio-TemporalAttentionforPrecipitationNowcasting,”inIEEETransactionsonIndustrialInformatics,doi:10.1109/TII.2025.3540478.原文复现代码在最后在全球
【DAY20240927】经典深度学习模型对比：LeNet5、CNN、ResNet20、AlexNet、TextCNN 与 VGG-11 胆小鬼~ 深度学习 cnn 人工智能
文章目录前言一、LeNet5二、CNN三、AlexNet四、ResNet20五、TextCNN六、VGG-11前言Weleverage6modelstodealwiththedata,i.e.,LeNet5(LeNet)(LeCunetal.1989),asyntheticCNNnetwork(CNN),ResNet20(ResNet)(Heetal.2016),AlexNet(Krizhevsk
Java iText 编辑PDF时常遇到问题 zhulangfly Java java pdf 开发语言
1.java.lang.IllegalArgumentException:PdfReadernotopenedwithownerpasswordiTextPdfReade读取PDF文件时，由于PDF设置了权限（用浏览器打开该PDF文件如下图所示），导致需要提供密码，如何解决呢，对于不同版本的Itext有不同的处理方案，请参照代码：PdfReader.unethicalreading=true;//
Acunetix v25.4 发布 - Web 应用程序安全测试 web安全
Acunetixv25.4(Linux,Windows)-Web应用程序安全测试Acunetix|WebApplicationSecurityScanner请访问原文链接：https://sysin.org/blog/acunetix/查看最新版。原创作品，转载请保留出处。作者主页：sysin.orgAcunetix漏洞扫描器，管理您的网络安全。使用Acunetix提高您的Web应用程序安全性Ac
具身智能零碎知识点（三）：深入解析 “1D UNet”：结构、原理与实战墨绿色的摆渡人具身智能零碎知识点 pytorch 人工智能 python transformer 具身智能
深入解析“1DUNet”：结构、原理与实战【深度学习入门】1DUNet详解：结构、原理与实战指南一、1DUNet是什么？二、核心结构与功能1.整体架构2.编码器（Encoder）3.解码器（Decoder）4.跳跃连接（SkipConnection）5.瓶颈层（Bottleneck）三、数学原理与数值示例1.1D卷积运算2.编码-解码流程四、PyTorch代码实现1.完整模型代码2.使用示例五、实
U-Net架构整点薯条吃吃喽人工智能深度学习
基本了解UNet是一种经典的卷积神经网络架构，解决了传统方法在数据量不足时面临的挑战。最初由医学图像分割任务提出，后被广泛应用于扩散模型（如DDPM、DDIM、StableDiffusion）中作为噪声预测的核心网络。核心结构包括一个收缩路径（downsamplingpath）和一个对称的扩展路径（upsamplingpath）。收缩路径通过多次下采样操作捕获上下文信息，而扩展路径则通过上采样操作
PyTorch 深度学习实战（27）：扩散模型（Diffusion Models）与图像生成进取星辰 PyTorch 深度学习实战机器学习人工智能
一、扩散模型原理1.核心思想扩散模型（DiffusionModels）通过逐步添加和去除噪声学习数据分布，核心分为两个过程：2.训练目标（简化损失函数）通过最小化预测噪声的均方误差：二、扩散模型实现（基于PyTorch）以MNIST手写数字生成为例，实现扩散模型：定义噪声调度：线性或余弦噪声计划构建UNet模型：预测每一步的噪声实现扩散过程：前向加噪与反向去噪训练与生成：从噪声生成图像三、代码实现
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(

尝试在UNet添加SK模块和CBAM模块

你可能感兴趣的:(unet)