SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)

***************************************************

码字不易,收藏之余,别忘了给我点个赞吧!

***************************************************

---------Start

关于swinUnet网络的测试部分请移步另一篇博文

官方代码:https://github.com/HuCaoFighting/Swin-Unet

目的:训练Swin-Unet分割肺部区域

数据集位置:https://www.kaggle.com/datasets/nikhilpandey360/chest-xray-masks-and-labels

实现效果:

输入原图
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第1张图片

输出标签
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第2张图片

此文中只用了整个数据集中的345张图像用来完成整个分割任务!

1、下载官方代码并解压

代码地址
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第3张图片

解压后的文件夹:

SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第4张图片

2、下载数据集并解压

数据集地址
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第5张图片

我们只需要用到以下两个文件夹:分别代表图片和标签。原文件中图片有800张,标签只有704张,有部分img没有标签,需要在制作npz文件的时候注意一下。

SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第6张图片
这是本文用到的345张图像和对应的mask
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第7张图片

用于分割任务的标签,

SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第8张图片

3、生成.npz文件

pycharm打开项目文件,配置好python解释器,创建data目录

data目录中,train_npz是用来存放训练所用的npz文件,test_vol_h5用来存放测试所用的npz文件,这是官方命名,可以少改代码。
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第9张图片

将图像和标签转化成.npz文件

将原图像和标签保持在同目录
在这里插入图片描述
转换代码:(根据自己数据的位置修改下路径),若是只有背景+目标两个类别,这个代码可以直接用,若是三个及以上类别的分割,代码应该根据你的图像数据做调整,调整之后保证以下代码的label数组中,背景用0像素,目标用1,2,3,4…像素分别表示,一个像素值代表一种类别。例如(0:背景,1:类别1,2:类别2,3:类别3…)。

def npz():
    #原图像路径
    path = r'G:\dataset\Segmentation\LungSegmentation\npz\images\*.png'
    #项目中存放训练所用的npz文件路径
    path2 = r'G:\dataset\Unet\TransUnet-ori\data\Synapse\train_npz\\'
    for i,img_path in enumerate(glob.glob(path)):
    	#读入图像
        image = cv2.imread(img_path)
        image = cv2.cvtColor(image,cv2.COLOR_BGR2RGB)
        #读入标签
        label_path = img_path.replace('images','labels')
        label = cv2.imread(label_path,flags=0)
        #将非目标像素设置为0
        label[label!=255]=0
        #将目标像素设置为1
        label[label=255]=1
		#保存npz
        np.savez(path2+str(i),image=image,label=label)
        print('------------',i)

    # 加载npz文件
    # data = np.load(r'G:\dataset\Unet\Swin-Unet-ori\data\Synapse\train_npz\0.npz', allow_pickle=True)
    # image, label = data['image'], data['label']

    print('ok')

将训练和测试的图像数据分别生成为train_npz和test_vol_h5中的npz文件
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第10张图片

生成npz文件对应的txt文件

txt文件的内容是模型训练和测试过程中读入图像数据的名称。忽略my_tools.py文件。
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第11张图片
生成txt文件的代码,根据训练和测试的npz文件分别生成train.txt和test_vol.txt文件。

def write_name():
    #npz文件路径
    files = glob.glob(r'C:\Users\22120\Desktop\Swin-Unet-main\data\Synapse\test_vol_h5\*.npz')
    #txt文件路径
    f = open(r'C:\Users\22120\Desktop\Swin-Unet-main\lists\lists_Synapse\test_vol.txt','w')
    for i in files:
        name = i.split('\\')[-1]
        name = name[:-4]+'\n'
        f.write(name)

SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第12张图片

4、下载预训练权重

官方下载地址

csdn免费下载(推荐)

权重下载好之后,放入项目的pretrained_ckpt文件夹下,官方只提供了输入大小为224的模型权重。
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第13张图片

5、修改部分代码

当你的图像数据是单通道时,按照文中写的内容修改后肯定能正常训练。若是三通道及以上的输入图像,也照着文中写的内容修改,若仍有问题,可以评论或私信我,一起解决吧。

5.1 修改train.py

修改常规参数,配置文件路径,注意num_classes等于背景+预测目标类别个数。因为修改之处不多,见谅没有放上修改后的代码,参考图中标识修改即可。
output_dir:训练日志和输出权重保存的路径
root_path:为数据集存放的根目录
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第14张图片
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第15张图片
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第16张图片

5.2 修改dataset_synapse.py

自己生成的npz文件和官方的npz文件格式有差异,在这里做了调整,调整之后完全一致。
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第17张图片

5.3. 修改trainer.py文件

设置trainer.py文件中的DataLoader函数中的num_workers=0
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第18张图片

至此,所有代码修改完毕,执行train.py文件,若控制台有以下输出,即成功跑通!
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第19张图片
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第20张图片
训练完毕后项目文件中的output文件夹里存放着训练的输出日志和模型权重。
SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)_第21张图片

总结: 由于仅文字表述某些操作存在局限性,故只能简略描述,有任何疑问可下方留言评论或私信,回复不及还望见谅,感激不尽!

你可能感兴趣的:(深度学习,python,计算机视觉,人工智能)