gefeng1209

医学图像分割模型的常用loss

1.交叉熵损失函数-cross entropy

二分类交叉熵损失函数binary_crossentropy

$-\frac{1}{N}\sum_{i=1}^{N}\left ( y_{i}log\left ( \hat{y}_{i} \right )+\left ( 1-y_{i} \right )log\left (1-\hat{y}_{i} \right )\right )$

其中,N为像素点个数, $y_{i}$ 为输入实例 $x_{i}$ 的真实类别, $\hat{y}_{i}$ 为预测输入实例 $x_{i}$ 属于类别 1 的概率. 对所有样本的对数损失表示对每个样本的对数损失的平均值, 对于完美的分类器, 对数损失为 0。

多分类交叉熵损失函数categorical_crossentropy

$-\frac{1}{N}\sum_{i=1}^{N}\left ( y_{i1}log\left ( \hat{y}_{i1} \right )+ y_{i2} log\left (\hat{y}_{i2} \right )+...+y_{im}log\left ( \hat{y}_{im} \right )\right ) =-\frac{1}{N}\sum_{i=1}^{N}\sum_{j=1}^{m}\left( y_{ij}log\left ( \hat{y}_{ij} \right )\right )$

该损失函数分别检查每个像素，m为类别数(num_label),将类预测 $y_{i}=[y_{i1},y_{i2},...,y_{im}]$ (深度方向的像素向量)与我们的热编码目标向量 $\hat{y}_{i}=[\hat{y}_{i1},\hat{y}_{i2},...,\hat{y}_{im}]$ 进行比较。

由此可见，交叉熵的损失函数单独评估每个像素矢量的类预测，然后对所有像素求平均值，所以我们可以认为图像中的像素被平等的学习了。但是，医学图像中常出现类别不均衡（class imbalance）的问题，由此导致训练会被像素较多的类主导，对于较小的物体很难学习到其特征，从而降低网络的有效性。

pytorch代码实现

pytorch自带的nn.CrossEntropyLoss结合了nn.logSoftmax()和nn.NLLLoss()

class CrossEntropy(nn.Module):
    def __init__(self,ignore_label=-1,weight=None):
        super(CrossEntropy,self).__init__()
        self.ignore_label=ignore_label
        self.criterion=nn.CrossEntropyLoss(weight=weight,
                                           ignore_index=self.ignore_label)

    def forward(self, score,target):
        '''

        :param score: Tensor[bs,num_classes,256,256]
        :param target: Tensor[bs,256,256]
        :return:
        '''
        loss=self.criterion(score,target)
        return loss

2.带权重的交叉熵函数-Weighted cross entropy(WCE)

$-\frac{1}{N}\sum_{i=1}^{N}\left ( \omega_{1} y_{i1}log\left ( \hat{y}_{i1} \right )+ \omega_{2}y_{i2} log\left (\hat{y}_{i2} \right )+...+ \omega_{m}y_{im}log\left ( \hat{y}_{im} \right )\right ) =-\frac{1}{N}\sum_{i=1}^{N}\sum_{j=1}^{m}\left( \omega_{j}y_{ij}log\left ( \hat{y}_{ij} \right )\right )$

其中， $\omega=[\omega_{1},\omega_{2},...\omega_{m}]$ 为对预测概率图中每个类别的权重，用于加权在预测图上占比例小的类别对loss函数的贡献

$\omega_{j}=\frac{N-\sum_{i}^{N}\hat{y}_{ij}}{\sum_{i}^{N}\hat{y}_{ij}}$

3.Dice Coefficient Loss

dice coefficient 源于二分类，本质上是衡量两个样本的重叠部分。该指标范围从0到1，其中“1”表示完整的重叠。其计算公式为：

$Dice = \frac{2\left | A\cap B \right |}{\left | A \right |+\left | B \right | }$

其中 $\left | A\bigcap B \right |$ 表示集合A、B 之间的共同元素，表示 A 中的元素的个数，B也用相似的表示方法。

为了计算预测的分割图的 dice coefficient，将 $\left | A\bigcap B \right |$ 近似为预测图每个类别score和target之间的点乘，并将结果函数中的元素相加。

因为我们的目标是二进制的，因而可以有效地将预测中未在 target mask 中“激活”的所有像素清零。对于剩余的像素，主要是在惩罚低置信度预测; 该表达式的较高值（在分子中）会导致更好的Dice系数。

为了量化计算和，部分研究人员直接使用简单的相加，也有一些做法是取平方求和。

其中，在式子中 Dice系数的分子中有2，因为分母“重复计算” 了两组之间的共同元素。为了形成可以最小化的损失函数，我们将简单地使用1-Dice。这种损失函数被称为 soft dice loss，因为我们直接使用预测概率而不是使用阈值或将它们转换为二进制mask。

关于神经网络输出，分子涉及到我们的预测和 target mask 之间的共同激活，而分母将每个mask中的激活量分开考虑。实际上起到了利用 target mask 的大小来归一化损失的效果，使得 soft dice 损失不会难以从图像中具有较小空间表示的类中学习。

soft dice loss 将每个类别分开考虑，然后平均得到最后结果。

定义如下：

$L_{dice}=1-\frac{1}{m}\sum_{j=1}^{m}\frac{2\sum_{i=1}^{N}y_{ij}\hat{y}_{ij}}{\sum_{i=1}^{N}y_{ij}+\sum_{i=1}^{N}\hat{y}_{ij}}$

pytorch代码实现：

class SoftDiceLoss(nn.Module):
    '''
    Soft_Dice = 2*|dot(A, B)| / (|dot(A, A)| + |dot(B, B)| + eps)
    eps is a small constant to avoid zero division,
    '''

    def __init__(self, weight=None):
        super(SoftDiceLoss, self).__init__()
        self.activation = nn.Softmax2d()

    def forward(self, y_preds, y_truths, eps=1e-8):
        '''

        :param y_preds: [bs,num_classes,768,1024]
        :param y_truths: [bs,num_calsses,768,1024]
        :param eps:
        :return:
        '''
        bs = y_preds.size(0)
        num_classes = y_preds.size(1)
        dices_bs = torch.zeros(bs,num_classes)
        for idx in range(bs):
            y_pred = y_preds[idx] #[num_classes,768,1024]
            y_truth = y_truths[idx] #[num_classes,768,1024]
            intersection = torch.sum(torch.mul(y_pred, y_truth),dim=(1,2)) + eps/2
            union = torch.sum(torch.mul(y_pred, y_pred), dim=(1, 2)) + torch.sum(torch.mul(y_truth, y_truth), dim=(1, 2)) + eps

            dices_sub = 2 * intersection / union
            dices_bs[idx] = dices_sub

        dices = torch.mean(dices_bs,dim=0)
        dice = torch.mean(dices)
        dice_loss = 1 - dice
        return dice_loss

值得注意的是，dice loss比较适用于样本极度不均的情况，一般的情况下，使用 dice loss 会对反向传播造成不利的影响，容易使训练变得不稳定。有时使用dice loss会使训练曲线有时不可信，而且dice loss好的模型并不一定在其他的评价标准上效果更好，例如mean surface distance 或者是Hausdorff surface distance。不可信的原因是梯度，对于softmax或者是log loss其梯度简化而言为p−t，t为目标值，p为预测值。而dice loss为 $\frac{2t^2}{(p+t)^2}$ ，如果p，t过小则会导致梯度变化剧烈，导致训练困难。

4.IOU Loss

IOU类似于Dice，定义如下：

$IOU= \frac{\left | A \bigcap B \right | }{\left | A \right| +\left | B \right| - \left| A \bigcap B \right | }$

pytorch代码实现：

class SoftDiceLoss(nn.Module):
    '''
    Soft_Dice = 2*|dot(A, B)| / (|dot(A, A)| + |dot(B, B)| + eps)
    eps is a small constant to avoid zero division,
    '''

    def __init__(self, weight=None):
        super(SoftDiceLoss, self).__init__()
        self.activation = nn.Softmax2d()

    def forward(self, y_preds, y_truths, eps=1e-8):
        '''

        :param y_preds: [bs,num_classes,768,1024]
        :param y_truths: [bs,num_calsses,768,1024]
        :param eps:
        :return:
        '''
        bs = y_preds.size(0)
        num_classes = y_preds.size(1)
        dices_bs = torch.zeros(bs,num_classes)
        for idx in range(bs):
            y_pred = y_preds[idx] #[num_classes,768,1024]
            y_truth = y_truths[idx] #[num_classes,768,1024]
            intersection = torch.sum(torch.mul(y_pred, y_truth),dim=(1,2)) + eps/2
            union = torch.sum(torch.mul(y_pred, y_pred), dim=(1, 2)) + torch.sum(torch.mul(y_truth, y_truth), dim=(1, 2)) + eps

            ious_sub = intersection / (union-intersection)
            ious_bs[idx] = ious_sub

        ious = torch.mean(ious_bs,dim=0)
        iou = torch.mean(ious)
        iou_loss = 1 - iou
        return iou_loss

IOU loss的缺点呢同DICE loss是相类似的，训练曲线可能并不可信，训练的过程也可能并不稳定，有时不如使用softmax loss等的曲线有直观性，通常而言softmax loss得到的loss下降曲线较为平滑。

5.Focal Loss

作者认为单级结构(YOLO,SSD)准确度低是由类别失衡(class imbalance)引起的。在深入理解这个概念前我们先来强化下“类别”这个概念：计算Loss的bbox可以分为positive和negative两类。当bbox(由anchor加上偏移量得到)与ground truth间的IOU大于上门限时(一般是0.5)，会认为该bbox属于positive example，如果IOU小于下门限就认为该bbox属于negative example。在一张输入image中，目标占的比例一般都远小于背景占的比例，所以两类example中以negative为主，这引发了两个问题：

１、negative example过多造成它的loss太大，以至于把positive的loss都淹没掉了，不利于目标的收敛；

２、大多negative example不在前景和背景的过渡区域上，分类很明确(这种易分类的negative称为easy negative)，训练时对应的背景类score会很大，换个角度看就是单个example的loss很小，反向计算时梯度小。梯度小造成easy negative example对参数的收敛作用很有限，我们更需要loss大的对参数收敛影响也更大的example，即hard positive/negative example。
这里要注意的是前一点我们说了negative的loss很大，是因为negative的绝对数量多，所以总loss大；后一点说easy negative的loss小，是针对单个example而言.

下图是hard positvie、hard negative、easy positive、easy negative四种example的示意图，可以直观的感受到easy negativa占了大多数。

二分类交叉熵定义损失如下：

$L=-\frac{1}{N}\sum_{i=1}^{N}\left ( y_{i}log\left ( \hat{y}_{i} \right )+\left ( 1-y_{i} \right )log\left (1-\hat{y}_{i} \right )\right )=-\frac{1}{N}\sum_{i=1}^{N}\left\{\begin{matrix} log(\hat{y}_{i}), y_{i}=1& \\ log(1-\hat{y}_{i}),y_{i}=0& \end{matrix}\right.$

可见普通的交叉熵对于正样本(positive)而言，输出概率越大损失越小。对于负样本(negative)而言，输出概率越小则损失越小。此时的损失函数在大量简单样本的迭代过程中比较缓慢且可能无法优化至最优.

Focal Loss定义如下：

$L_{fl}=-\frac{1}{N}\sum_{i=1}^{N}\left ( \alpha \left ( 1-\hat{y}_{i} \right )^{\gamma }y_{i}log\left ( \hat{y}_{i} \right )+\left( 1-\alpha\right ) \hat{y}_{i} ^{\gamma }\left ( 1-y_{i} \right )log\left (1-\hat{y}_{i} \right )\right )$ $=-\frac{1}{N}\sum_{i=1}^{N} \left\{\begin{matrix} \alpha \left ( 1-\hat{y}_{i} \right )^{\gamma }log(\hat{y}_{i}), y_{i}=1& \\ \left( 1-\alpha\right ) \hat{y}_{i} ^{\gamma }log(1-\hat{y}_{i}),y_{i}=0& \end{matrix}\right.$

$\hat{y}_{i}$ 是类别的预测概率， $\gamma$ 是个大于0的值， $\alpha$ 是个[0，1]间的小数， $\gamma$ 和 $\alpha$ 都是固定值，不参与训练。从表达式可以看出：
1、对于前景类， $\hat{y}_{i}$ 越大，即越好预测，权重 $\alpha \left ( 1-\hat{y}_{i} \right )^{\gamma }$ 就越小

对于背景类， $\hat{y}_{i}$ 越小， $1-\hat{y}_{i}$ 越大，即越好预测，权重 $\left( 1-\alpha\right ) \hat{y}_{i} ^{\gamma }$ 就越小。

也就是说easy example可以通过权重进行抑制；
2、 $\alpha$ 用于调节positive和negative的比例，前景类别使用 $\alpha$ 时，对应的背景类别使用 $1-\alpha$ ；
3、 $\gamma$ 和 $\alpha$ 的最优值是相互影响的，所以在评估准确度时需要把两者组合起来调节。

目前在图像分割上只是适应于二分类。
代码：https://github.com/mkocabas/focal-loss-keras

from keras import backend as K
'''
Compatible with tensorflow backend
'''
def focal_loss(gamma=2., alpha=.25):
	def focal_loss_fixed(y_true, y_pred):
            #取前景后背景部分预测值，shape和y_true,y_pred相同
            #取前景部分预测值，对背景忽略：设置为1
            pt_1 = tf.where(tf.equal(y_true, 1), y_pred, tf.ones_like(y_pred))
            #取背景部分预测值，对前景忽略：设置为0
            pt_0 = tf.where(tf.equal(y_true, 0), y_pred, tf.zeros_like(y_pred))
            return -K.sum(alpha * K.pow(1. - pt_1, gamma) * K.log(pt_1))-K.sum((1-alpha) * K.pow( pt_0, gamma) * K.log(1. - pt_0))
    return focal_loss_fixed

使用方法：

model_prn.compile(optimizer=optimizer, loss=[focal_loss(alpha=.25, gamma=2)])

6.Generalized Dice loss

在使用DICE loss时，对小目标是十分不利的，因为在只有前景和背景的情况下，小目标一旦有部分像素预测错误，那么就会导致Dice大幅度的变动，从而导致梯度变化剧烈，训练不稳定。

GDL(the generalized Dice loss)公式如下：

$L_{gd}=1-\frac{1}{m}\frac{2\sum_{j=1}^{m}\omega_{j}\sum_{i=1}^{N}y_{ij}\hat{y}_{ij}}{\sum_{j=1}^{m}\omega_{j}\sum_{i=1}^{N}\left ( y_{ij}+\hat{y}_{ij} \right )}$

在dice loss基础上增加了 $\omega=[\omega_{1},\omega_{2},...,\omega_{m}]$ 给每个类别加权，计算公式如下：

$\omega_{j}=\frac{1}{\left ( \sum_{i=1}^{N}y_{ij} \right )^2}$

这样起到了平衡各类(包括背景类)目标区域对loss的贡献。

论文中的给出的分割效果：

但是在AnatomyNet中提到GDL面对极度不均衡的情况下，训练的稳定性仍然不能保证。

代码：

def generalized_dice_coeff(y_true, y_pred):
    #y_true,y_pred shape=[num_label,H,W,C]
    num_label=y_pred.shape[0]
    w=K.zeros(shape=(num_label,))
    w=K.sum(y_true,axis=(1,2,3))
    w=1/(w**2+0.000001)
    # Compute gen dice coef:
    intersection_w = w*K.sum(y_true * y_pred, axis=[1,2,3])
    union_w = w*K.sum(y_true+y_pred, axis=[1,2,3])
    return K.mean( (2. * intersection_w + smooth) / (union_w + smooth), axis=0)    

def generalized_dice_loss(y_true, y_pred):
    return 1 - generalized_dice_coeff(y_true, y_pred)

未完待续......

参考：

医学图像分割常用的损失函数

从loss处理图像分割中类别极度不均衡的状况---keras

Focal Loss for Dense Object Detection解读

Python小项目：利用U-net完成细胞图像分割
利用U-Net完成细胞图像分割的详细指南在生物医学领域，细胞图像分割是一个关键步骤，能够帮助研究人员分析细胞结构和功能。U-Net作为一种强大的卷积神经网络结构，广泛应用于医学图像分割任务。本文将详细介绍如何利用U-Net完成细胞图像分割项目，涵盖从数据准备到模型部署的各个步骤。项目步骤概览数据准备数据预处理构建U-Net模型训练模型模型评估图像分割结果可视化调优和优化部署和应用1.数据准备收集数
图像算法实习生--面经1 小豆包的小朋友0217 算法
系列文章目录文章目录系列文章目录前言一、为什么torch里面要用optimizer.zero_grad()进行梯度置0二、Unet神经网络为什么会在医学图像分割表现好？三、transformer相关问题四、介绍一下胶囊网络的动态路由五、yolo系列出到v9了，介绍一下你最熟悉的yolo算法六、一阶段目标检测算法和二阶段目标检测算法有什么区别？七、讲一下剪枝八、讲一下PTQandQAT量化的区别九、
Mamba-UNet：用于医学图像分割的类似UNet的纯视觉Mamba网络 AI浩高质量人类CV论文翻译深度学习人工智能计算机视觉
摘要在医学图像分析的最新进展中，卷积神经网络（CNN）和视觉转换器（ViT）都取得了显著的基准成绩。前者通过其卷积操作在捕获局部特征方面表现出色，而后者则通过利用自注意力机制实现了出色的全局上下文理解。然而，这两种架构在有效建模医学图像中的长距离依赖关系时都存在局限，这对于精确分割至关重要。受到Mamba架构的启发，该架构因其处理长序列和全局上下文信息的能力以及作为国家空间模型（SSM）的增强计算
三维重建阈值分割 3D可视化医学图像分割 CT图像分割及重建系统可视化编程技术及应用恋恋西风 VTK 毕业设计和论文 qt 三维重建 VTK ITK 图像分割
一、概述此系统实现了常见的VTK四视图，实现了很好的CT图像分割，可以用于骨骼，头部，肺部，脂肪等分割，，并且通过三维重建实现可视化。使用了第三方库VTK，ITK实现分割和生不重建。窗口分为（横断面）、冠状面、矢状面，和3D窗口；包含了体绘制和面绘制；效果：CT分割重建二、开发环境操作系统：Windows10:工具：Qt5.12.4+VisualStudio2017，使用开源库：VTK-8.1IT
3D Slicer-最强大的开源医学图像分割工具简要概述 Tina姐标注软件医学图像分割医学图像深度学习人工智能
3DSlicer-最强大的开源医学图像分割工具简要概述本系列涵盖从3DSlicer医学图像查看器的基础使用到高级自动分割扩展程序的内容（从入门到高阶！），具体包括软件安装、基础使用教程，自动分割扩展（totalsegmentator,monailabel）快速标注数据。我们将学习3DSlicer的基础知识，并熟悉其内置模块、扩展和图像处理工具。熟悉这些工具和3DSlicer工作流程将使我们能够了解
CVPR 2024：在笔记本终端分割一切医学图像挑战赛进行中 Tina姐计算机视觉人工智能深度学习医学图像
竞赛题目：CVPR2024:SEGMENTANYTHINGINMEDICALIMAGESONLAPTOP组织者：Junma([email protected])主办单位：JunMa(多伦多大学)YuyinZhou(加州大学圣克鲁斯分校)BoWang(多伦多大学)比赛概述医学图像分割是临床实践中的关键步骤，有助于准确量化解剖结构和病理区域。该领域目前正在经历范式转变，从为单个任务设计的专用模型转
Swin-UMamba：结合基于ImageNet的预训练和基于Mamba的UNet模型 AI浩人工智能计算机视觉
摘要https://arxiv.org/pdf/2402.03302v1.pdf准确的医学图像分割需要整合从局部特征到全局依赖的多尺度信息。然而，现有方法在建模长距离全局信息方面面临挑战，其中卷积神经网络（CNNs）受限于其局部感受野，而视觉转换器（ViTs）则受到其注意力机制高二次复杂度的困扰。最近，基于Mamba的模型因其在长序列建模中的出色能力而备受关注。多项研究表明，这些模型在各种任务中可
Swin-Unet： Unet-like Pure Transformer forMedical Image Segmentation（用于医学图像分割的纯U型transformer）我在努力学习分割（禁止说我水平差） transformer 深度学习人工智能 1024程序员节
本文的翻译是参考的：[Transformer]Swin-Unet:Unet-likePureTransformerforMedicalImageSegmentation_unet-likepuretransformer-CSDN博客方便自己学习摘要：在过去的几年中，卷积神经网络(cnn)在医学图像分析方面取得了里程碑式的进展。特别是基于u型结构和跳跃连接的深度神经网络在各种医学图像任务中得到了广泛
周报（20240204）来自宇宙的曹先生研究生阶段周报周报
日期：2024.1.29-2024.2.4本周工作：1.阅读论文本周主要对这篇文献进行了阅读：《用可学习的跳跃连接缩小U-Net中的语义差距：以医学图像分割为例》背景医学图像分割和随后对目标对象的定量评估为疾病诊断和治疗规划提供了有价值的信息。最近的语义分割方法通常依赖于类UNet的编码器-解码器架构，其中编码器产生高级语义特征，解码器逐渐对这些隐藏特征进行上采样，以产生具有每像素概率的分割图。大
周报（20240128）来自宇宙的曹先生研究生阶段周报深度学习医学图像分割人工智能
日期：2024.1.22-2024.1.28本周工作：1.阅读论文本周阅读了以下论文：《BRAU-Net：用于医学图像分割的U形混合CNN-Transformer网络》背景精确的医学图像分割对于临床量化、疾病诊断、治疗计划和许多其他应用至关重要。基于卷积和基于Transformer的u形结构在各种医学图像分割任务中都取得了显著的成功。前者可以有效地学习图像的局部信息，同时需要卷积运算所固有的更多特
文献翻译（BRAU-Net++: U-Shaped Hybrid CNN-Transformer Network for Medical Image Segmentation）来自宇宙的曹先生文献翻译 cnn transformer 人工智能
BRAU-Net++:U-ShapedHybridCNN-TransformerNetworkforMedicalImageSegmentationBRAU-Net：用于医学图像分割的U形混合CNN变换网络LibinLan,Member,IEEE,PengzhouCai,LuJiang,XiaojuanLiu,YongmeiLi,andYudongZhang,SeniorMember,IEEE摘要
深度学习实验-3d医学图像分割桶的奇妙冒险深度学习 3d 人工智能
实验四基于nnU-Net模型的3D医学图像分割实验一、实验介绍腹部多器官分割一直是医学图像分析领域最活跃的研究领域之一，其作为一项基础技术，在支持疾病诊断，治疗规划等计算机辅助技术发挥着重要作用。近年来，基于深度学习的方法在该领域中获得了巨大成功。本实验数据集为多模态腹部分割数据集（AMOS），一个大规模，多样性的，收集自真实临床场景下的腹部多器官分割基准数据。本实验在百度飞桨平台上采用nnU-N
ConvFormer: Plug-and-Play CNN-StyleTransformers for Improving Medical ImageSegmentation 我在努力学习分割（禁止说我水平差） cnn 人工智能神经网络
ConvFormer:改进医学图像分割的即插即用CNN风格转换器摘要：Transformer在医学图像分割中被广泛研究，以建立成对的长程依赖关系（像素之间的长程依赖关系）。然而，相对有限的注释良好的医学图像数据使transformer难以提取不同的全局特征，（这句话指的是在医学图像数据中，往往存在着相对较少的注释信息，这些注释信息通常用于描述图像中的不同结构、病变或特征。由于注释信息有限，传统的深
Annotator Consensus Prediction for MedicalImage Segmentation with Diffusion Models 我在努力学习分割（禁止说我水平差）人工智能计算机视觉
基于扩散模型的医学图像分割的注释器共识预测摘要医学图像分割的一个主要挑战是多个专家提供的注释中观察者之间和观察者内部的差异很大。为了解决这一挑战，我们提出了一种利用扩散模型进行多专家预测的新方法。我们的方法利用基于扩散的方法将来自多个注释的信息合并到一个反映多个专家共识的统一分割图中。我们在多个专家注释的医学分割数据集上评估了我们的方法的性能，并将其与最先进的方法进行了比较。结果证明了该方法的有效
MedSegDiff-V2: Diffusion based Medical Image Segmentation with Transformer 我在努力学习分割（禁止说我水平差） transformer 深度学习人工智能
MedSegDiff-V2:基于变压器的扩散医学图像分割摘要扩散概率模型(DiffusionProbabilisticModel,DPM)最近在计算机视觉领域获得了广泛的应用，这要归功于它的图像生成应用，如Imagen、LatentDiffusionModels和StableDiffusion，这些应用已经展示了令人印象深刻的能力，并在社区内引发了许多讨论。最近的研究进一步揭示了DPM在医学图像分
【图像分割】【深度学习】Windows10下UNet代码Pytorch实现与源码讲解牙牙要健康深度学习图像分割深度学习 pytorch 人工智能
【图像分割】【深度学习】Windows10下UNet代码Pytorch实现与源码讲解提示:最近开始在【医学图像分割】方面进行研究,记录相关知识点,分享学习中遇到的问题已经解决的方法。文章目录【图像分割】【深度学习】Windows10下UNet代码Pytorch实现与源码讲解前言UNet模型运行环境搭建UNet模型运行数据集与模型权重下载PFNet训练与测试总结前言UNet是由德国弗赖堡大学的Ola
mask transformer相关论文阅读鱼小丸 transformer 论文阅读深度学习
前面讲了mask-transformer对医学图像分割任务是非常适用的。本文就是总结一些近期看过的mask-transformer方面的论文。因为不知道masktransformer是什么就看了一些论文。后来得出结论，应该就是生成mask的transformer就是masktransformer。DETR很多这些论文都是受到DETR的启发得到的。DETR为数不多的目标检测里端到端的模型，它把目标检
U-Net的原理来自宇宙的曹先生深度学习
U-Net是一种专为医学图像分割而设计的卷积神经网络（CNN）架构。它于2015年由OlafRonneberger、PhilippFischer和ThomasBrox提出，特别适用于需要精确定位的应用场景，比如生物医学图像处理。以下是U-Net的主要原理和组成部分的详细解释：U-Net的结构对称的U形结构：U-Net的主要特点是其U型对称结构，由一个“编码器”（收缩路径）和一个“解码器”（扩张路径
【论文阅读笔记】Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation 咔叽布吉论文阅读学习论文阅读笔记 transformer
1.介绍Swin-Unet:Unet-likePureTransformerforMedicalImageSegmentationSwin-Unet：用于医学图像分割的类Unet纯Transformer2022年发表在ComputerVision–ECCV2022WorkshopsPaperCode2.摘要在过去的几年里，卷积神经网络（CNN）在医学图像分析方面取得了里程碑式的成就。特别是基于U型
【论文阅读笔记】Sam3d: Segment anything model in volumetric medical images[ cskywit SAM类医学图像分割论文阅读笔记
BuiNT,HoangDH,TranMT,etal.Sam3d:Segmentanythingmodelinvolumetricmedicalimages[J].arXivpreprintarXiv:2309.03493,2023.【开源】本文提出的SAM3D模型是针对三维体积医学图像分割的一种新方法。其核心在于将“分割任何事物”（SAM）模型的预训练编码器与一个轻量级的3D解码器相结合。与传统的
U-Net——第一课湘溶溶分割深度学习人工智能深度学习学习 python
一.论文研究背景、成果及意义二、unet论文结构三、算法架构一.论文研究背景、成果及意义医学图像分割是医学图像处理与分析领域的复杂而关键的步骤，目的是将医学图像中具有某些特殊含义的部分分割出来，并提取相关特征，为临床诊疗和病理学研究提供可靠的依据，辅助医生作出更为准确的诊断。①处理对象：各种不同成像机理的医学影像，主要有X-射线成像(X-CT)、核磁共振成像(MRI)、核医学成像(NMI)和超声波
【论文阅读笔记】Prompt Tuning for Parameter-efficient Medical Image Segmentation cskywit 医学图像分割 prompts 论文阅读笔记 prompt
FischerM,BartlerA,YangB.Prompttuningforparameter-efficientmedicalimagesegmentation[J].MedicalImageAnalysis,2024,91:103024.【开源】【核心思想】本文的核心思想是提出了一种用于医学图像分割的参数高效的提示调整（PromptTuning）方法。这种方法基于预训练的神经网络，通过插入可
基于 Level set 方法的医学图像分割凌峰的博客计算机视觉人工智能图像处理
摘要医学图像分割是计算机辅助诊断系统设计中的关键技术。对于医学图像分割问题,它一般可分为两部分:(l)图像中特定目标区域(器官或组织)的识别;(2)目标区域完整性的描述与提取。相比于其他图像,医学图像的复杂性和多样性,使得传统的基于底层图像信息的分割方法很难取得好的分割结果,而结合了高层视觉先验知识和图像底层信息的主动轮廓模型,符合人类视觉认知事物的一般规律,在计算机辅助诊断中得到了广泛的应用。水
MedSegDiff: Medical Image Segmentation withDiffusion Probabilistic Model 我在努力学习分割（禁止说我水平差）神经网络
MedSegDiff:基于扩散概率模型的医学图像分割摘要：扩散概率模型(Diffusionprobabilisticmodel,DPM)是近年来计算机视觉研究的热点之一。它在Imagen、LatentDiffusionModels和StableDiffusion等图像生成应用中表现出了令人印象深刻的生成能力，引起了社区的广泛讨论。最近的许多研究还发现，它在许多其他视觉任务中也很有用，比如图像去模糊
SESV：通过预测和纠错实现精确的医学图像分割火柴狗目标检测人工智能计算机视觉学习生成对抗网络
SESV:AccurateMedicalImageSegmentationbyPredictingandCorrectingErrorsSESV：通过预测和纠错实现精确的医学图像分割背景贡献实验方法ThinkingSESV：通过预测和纠错实现精确的医学图像分割286IEEETRANSACTIONSONMEDICALIMAGING,VOL.40,NO.1,JANUARY2021背景医学图像分割是计算
医学图像分割：UNet++ ronghuaiyang 计算机视觉机器学习深度学习 python 人工智能
点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Jingles(HongJing)编译：ronghuaiyang导读使用一系列的网格状的密集跳跃路径来提升分割的准确性。在这篇文章中，我们将探索UNet++:ANestedU-NetArchitectureforMedicalImageSegmentation这篇文章，作者是亚利桑那州立大学的Zhou等人。本文是U-Net的延续，我们
从入门到精通UNet: 让你快速掌握图像分割算法忆~遂愿算法 python 深度学习神经网络图像处理数据分析语言模型
文章目录一、UNet算法简介1.1什么是UNet算法1.2UNet的优缺点1.3UNet在图像分割领域的应用二、准备工作2.1Python环境配置2.2相关库的安装三、数据处理3.1数据的获取与预处理3.2数据的可视化与分析四、网络结构五、训练模型5.1模型训练流程5.2模型评估指标5.3模型优化方法六、基于UNet的医学图像分割实战案例七、总结与展望7.1UNet的未来发展7.2学习建议由于工作
具有置信度学习的困难感知注意力网络用于医学图像分割火柴狗学习生成对抗网络神经网络计算机视觉人工智能
Difficulty-AwareAttentionNetworkwithConfidenceLearningforMedicalImageSegmentation具有置信度学习的困难感知注意力网络用于医学图像分割背景贡献难点：实验方法分割网络SegmentationNetwork（分割网络）FullyConvolutionalConfidenceLearning（全卷积的置信度学习网络）Relax
UNet、U²Net医学图像分割网络 shuyeah 网络 UNet网络
UNet网络结构对于医学图像的分割任务，这里使用UNet网络实现CT影响的病灶区域分割任务。记一篇学习笔记。1、UNet网络结构原始图片大小为(512,512),根据CT数据像素值分布的特征，对于image保留[-1024,1024]范围内的像素，并归一化处理到[0,1]；对于image和mask，原始数据的大小为(h,w)(512,512)，在h,w维度按照比例缩小为(320,320)，并且在h
Uncertainty-guided dual-views for semi-supervised volumetric medical image segmentation Rad1ant_up Uncertainty 计算机视觉深度学习图像处理
本篇文章发表于NatureMachineIntelligence2023。文章链接：Uncertainty-guideddual-viewsforsemi-supervisedvolumetricmedicalimagesegmentation|NatureMachineIntelligence一、概述1.Backgroundandmotivation医学图像分割是疾病诊断、治疗规划的基石（bui
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1