Cpdr

【代码复现】(Swin-Transformer)CS-UNet模型解读

文章目录

1. 模型输入
2. 进入模型：class CS_Unet
- 2.1. class ConvSwinTransformerSys()
- 2.2. class ConvSwinTransformerSys()
- - 2.2.1. 类PatchEmbed()
- 2.2.(1)
- - 2.2.2. class BasicLayer()
  - - 2.2.2.1. class ConvSwinTransformerBlock()
    - - 2.2.2.1.1. class WindowAttention()
    - 2.2.2.1.(1)
    - - 2.2.2.1.2. class Mlp()
    - 2.2.2.1.(2)
  - 2.2.2.(1)
  - - - 2.2.2.1.1.(1)
    - 2.2.2.1.(3)
  - 2.2.2.(2)
  - - 2.2.2.2. class PatchMerging()
  - 2.2.2.(3)
- 2.2.(2)
- 2.3. class ConvSwinTransformerSys()
- - 2.3.1. class PatchExpand()
- 2.3.(1)
- - 2.3.2. class BasicLayer_up()
  - - 2.3.2.1. class PatchExpand()
  - 2.3.2.(1)
- 2.3.(2)
- 2.4. class ConvSwinTransformerSys()
- - 2.4.1. def up_x4()
  - - 2.4.1.1. class FinalPatchExpand_X4()
  - 2.4.1.(1)
2.(1) class CS_Unet()
附录. 模型框架图

摘要：对CS-UNet模型进行单步调试，含swin-transformer结构，梳理其实现流程。

1. 模型输入

image_batch是每批次的图片，shape为 $(B, 3, H, W)$ ，B为 batch_size，3表示图片是三通道的（如rgb图片）， $H$ 和 $W$ 分别为图片的高和宽。

outputs = model(image_batch)

然后，进入CS_Unet模型（类class CS_Unet）

2. 进入模型：class CS_Unet

首先从forward开始：

class CS_Unet(nn.Module):
    def __init__(self, config, img_size=224, num_classes=21843, zero_head=False, vis=False):
        super(CS_Unet, self).__init__()
        self.num_classes = num_classes
        self.zero_head = zero_head
        self.config = config

        self.CS_Unet = ConvSwinTransformerSys(img_size=config.DATA.IMG_SIZE,
                                patch_size=config.MODEL.SWIN.PATCH_SIZE,
                                in_chans=config.MODEL.SWIN.IN_CHANS,
                                num_classes=self.num_classes,
                                embed_dim=config.MODEL.SWIN.EMBED_DIM,
                                depths=config.MODEL.SWIN.DEPTHS,
                                num_heads=config.MODEL.SWIN.NUM_HEADS,
                                window_size=config.MODEL.SWIN.WINDOW_SIZE,
                                mlp_ratio=config.MODEL.SWIN.MLP_RATIO,
                                qkv_bias=config.MODEL.SWIN.QKV_BIAS,
                                qk_scale=config.MODEL.SWIN.QK_SCALE,
                                drop_rate=config.MODEL.DROP_RATE,
                                drop_path_rate=config.MODEL.DROP_PATH_RATE,
                                ape=config.MODEL.SWIN.APE,
                                patch_norm=config.MODEL.SWIN.PATCH_NORM,
                                use_checkpoint=config.TRAIN.USE_CHECKPOINT)

    def forward(self, x):
        # 判断图片的channel是否为1, 如果为1就在通道方向上复制3次，使其变成三通道的图片。
        if x.size()[1] == 1: 
            x = x.repeat(1,3,1,1)   # (B,3,H,W)

        # 进入 类ConvSwinTransformerSys,转到2.1小节
        logits = self.CS_Unet(x)
        return logits


    # 下面是载入预训练权重要用到的，训练阶段可以不考虑
    def load_from(self, config):
        pretrained_path = config.MODEL.PRETRAIN_CKPT
        if pretrained_path is not None:
            print("pretrained_path:{}".format(pretrained_path))
            device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
            pretrained_dict = torch.load(pretrained_path, map_location=device)
            if "model" not in pretrained_dict:
                print("---start load pretrained modle by splitting---")
                pretrained_dict = {k[17:]:v for k,v in pretrained_dict.items()}
                print(k)
                for k in list(pretrained_dict.keys()):
                    if "output" in k:
                        print("delete key:{}".format(k))
                        del pretrained_dict[k]
                msg = self.CS_Unet.load_state_dict(pretrained_dict,strict=False)
                print(msg)
                return
            pretrained_dict = pretrained_dict['model']
            print("---start load pretrained modle of swin encoder---")

            model_dict = self.CS_Unet.state_dict()
            # print(self.swin_unet)
            full_dict = copy.deepcopy(pretrained_dict)
            for k, v in pretrained_dict.items():
                if "layers." in k:
                    current_layer_num = 3-int(k[7:8])
                    current_k = "layers_up." + str(current_layer_num) + k[8:]
                    full_dict.update({current_k:v})
            for k in list(full_dict.keys()):
                if k in model_dict:
                    if full_dict[k].shape != model_dict[k].shape:
                        print("delete:{};shape pretrain:{};shape model:{}".format(k,v.shape,model_dict[k].shape))
                        del full_dict[k]

            msg = self.CS_Unet.load_state_dict(full_dict, strict=False)
            # print(msg)
        else:
            print("none pretrain")

2.1. class ConvSwinTransformerSys()

类ConvSwinTransformerSys()
从forward中x, x_downsample = self.forward_features(x)开始看

class ConvSwinTransformerSys(nn.Module):
    """
    Args:
        img_size (int | tuple(int)): Input image size. Default 224
        patch_size (int | tuple(int)): Patch size. Default: 4
        in_chans (int): Number of input image channels. Default: 3
        num_classes (int): Number of classes for classification head. Default: 1000
        embed_dim (int): Patch embedding dimension. Default: 96
        depths (tuple(int)): Depth of each Swin Transformer layer.
        num_heads (tuple(int)): Number of attention heads in different layers.
        window_size (int): Window size. Default: 7
        mlp_ratio (float): Ratio of mlp hidden dim to embedding dim. Default: 4
        qkv_bias (bool): If True, add a learnable bias to query, key, value. Default: True
        qk_scale (float): Override default qk scale of head_dim ** -0.5 if set. Default: None
        drop_rate (float): Dropout rate. Default: 0
        attn_drop_rate (float): Attention dropout rate. Default: 0
        drop_path_rate (float): Stochastic depth rate. Default: 0.1
        norm_layer (nn.Module): Normalization layer. Default: nn.LayerNorm.
        ape (bool): If True, add absolute position embedding to the patch embedding. Default: False
        patch_norm (bool): If True, add normalization after patch embedding. Default: True
        use_checkpoint (bool): Whether to use checkpointing to save memory. Default: False
    """

    def __init__(self, img_size=224, patch_size=4, in_chans=3, num_classes=1000,
                 embed_dim=96, depths=[2, 2, 2, 2], depths_decoder=[1, 2, 2, 2], num_heads=[3, 3, 3, 3],
                 window_size=7, mlp_ratio=4., qkv_bias=True, qk_scale=None,
                 drop_rate=0., attn_drop_rate=0., drop_path_rate=0.1,
                 norm_layer=nn.LayerNorm, ape=False, patch_norm=True,
                 use_checkpoint=False, final_upsample="expand_first", **kwargs):
        super().__init__()

        print(
            "ConvSwinTransformerSys expand initial----depths:{};depths_decoder:{};num_heads=:{};drop_path_rate:{};num_classes:{}".format(
                depths,
                depths_decoder, num_heads, drop_path_rate, num_classes))

        self.num_classes = num_classes
        self.num_layers = len(depths)
        self.embed_dim = embed_dim
        self.ape = ape
        self.patch_norm = patch_norm
        self.num_features = int(embed_dim * 2 ** (self.num_layers - 1))
        self.num_features_up = int(embed_dim * 2)
        self.mlp_ratio = mlp_ratio
        self.final_upsample = final_upsample

        # split image into overlapping patches
        self.patch_embed = PatchEmbed(
            img_size=img_size, patch_size=patch_size, in_chans=in_chans, embed_dim=embed_dim,
            norm_layer=norm_layer if self.patch_norm else None)
        num_patches = self.patch_embed.num_patches
        patches_resolution = self.patch_embed.patches_resolution
        self.patches_resolution = patches_resolution

        # absolute position embedding
        if self.ape:
            self.absolute_pos_embed = nn.Parameter(torch.zeros(1, num_patches, embed_dim))
            trunc_normal_(self.absolute_pos_embed, std=.02)

        self.pos_drop = nn.Dropout(p=drop_rate)

        # stochastic depth
        dpr = [x.item() for x in torch.linspace(0, drop_path_rate, sum(depths))]  # stochastic depth decay rule

        # build encoder and bottleneck layers
        self.layers = nn.ModuleList()
        for i_layer in range(self.num_layers):
            layer = BasicLayer(dim=int(embed_dim * 2 ** i_layer),
                               input_resolution=(patches_resolution[0] // (2 ** i_layer),
                                                 patches_resolution[1] // (2 ** i_layer)),
                               depth=depths[i_layer],
                               num_heads=num_heads[i_layer],
                               window_size=window_size,
                               mlp_ratio=self.mlp_ratio,
                               qkv_bias=qkv_bias, qk_scale=qk_scale,
                               drop=drop_rate, attn_drop=attn_drop_rate,
                               drop_path=dpr[sum(depths[:i_layer]):sum(depths[:i_layer + 1])],
                               norm_layer=norm_layer,
                               downsample=PatchMerging if (i_layer < self.num_layers - 1) else None,
                               use_checkpoint=use_checkpoint)
            self.layers.append(layer)

        # build decoder layers
        self.layers_up = nn.ModuleList()
        self.concat_back_dim = nn.ModuleList()
        for i_layer in range(self.num_layers):
            concat_cov = self.up = nn.Sequential(Rearrange('b (h w) c -> b c h w', h=patches_resolution[0] // (2 ** (self.num_layers - 1 - i_layer)), w=patches_resolution[1] // (2 ** (self.num_layers - 1 - i_layer))),
                                                 nn.Conv2d(2 * int(embed_dim * 2 ** (self.num_layers - 1 - i_layer)),
                                                           int(embed_dim * 2 ** (self.num_layers - 1 - i_layer)),
                                                           kernel_size=3, stride=1, padding=1), nn.GELU(),
                                                 nn.Conv2d(int(embed_dim * 2 ** (self.num_layers - 1 - i_layer)),
                                                           int(embed_dim * 2 ** (self.num_layers - 1 - i_layer)),
                                                           kernel_size=3, stride=1, padding=1), nn.GELU(),
                                                 nn.Dropout(p=0.2),
                                                 Rearrange('b c h w -> b (h w) c', h=patches_resolution[0] // (
                                                             2 ** (self.num_layers - 1 - i_layer)),
                                                           w=patches_resolution[1] // (
                                                                       2 ** (self.num_layers - 1 - i_layer))))
            if i_layer == 0:
                layer_up = PatchExpand(
                    input_resolution=(patches_resolution[0] // (2 ** (self.num_layers - 1 - i_layer)),
                                      patches_resolution[1] // (2 ** (self.num_layers - 1 - i_layer))),
                    dim=int(embed_dim * 2 ** (self.num_layers - 1 - i_layer)), dim_scale=2, norm_layer=norm_layer)
            else:
                layer_up = BasicLayer_up(dim=int(embed_dim * 2 ** (self.num_layers - 1 - i_layer)),
                                         input_resolution=(
                                         patches_resolution[0] // (2 ** (self.num_layers - 1 - i_layer)),
                                         patches_resolution[1] // (2 ** (self.num_layers - 1 - i_layer))),
                                         depth=depths[(self.num_layers - 1 - i_layer)],
                                         num_heads=num_heads[(self.num_layers - 1 - i_layer)],
                                         window_size=window_size,
                                         mlp_ratio=self.mlp_ratio,
                                         qkv_bias=qkv_bias, qk_scale=qk_scale,
                                         drop=drop_rate, attn_drop=attn_drop_rate,
                                         drop_path=dpr[sum(depths[:(self.num_layers - 1 - i_layer)]):sum(
                                             depths[:(self.num_layers - 1 - i_layer) + 1])],
                                         norm_layer=norm_layer,
                                         upsample=PatchExpand if (i_layer < self.num_layers - 1) else None,
                                         use_checkpoint=use_checkpoint)
            self.layers_up.append(layer_up)
            self.concat_back_dim.append(concat_cov)

        self.norm = norm_layer(self.num_features)
        self.norm_up = norm_layer(self.embed_dim)

        if self.final_upsample == "expand_first":
            print("---final upsample expand_first---")
            self.up = FinalPatchExpand_X4(input_resolution=(img_size // patch_size, img_size // patch_size),
                                          dim_scale=4, dim=embed_dim)
            self.output = nn.Conv2d(in_channels=embed_dim, out_channels=self.num_classes, kernel_size=1, bias=False)

        self.apply(self._init_weights)

    def _init_weights(self, m):
        if isinstance(m, (nn.Conv2d, nn.Linear)):
            trunc_normal_(m.weight, std=.02)
            if isinstance(m, nn.Linear) and m.bias is not None:
                nn.init.constant_(m.bias, 0)
        elif isinstance(m, nn.LayerNorm):
            nn.init.constant_(m.bias, 0)
            nn.init.constant_(m.weight, 1.0)

    @torch.jit.ignore
    def no_weight_decay(self):
        return {'absolute_pos_embed'}

    @torch.jit.ignore
    def no_weight_decay_keywords(self):
        return {'relative_position_bias_table'}

    # Encoder and Bottleneck
    def forward_features(self, x):
        x = self.patch_embed(x)      # (B,3,H,W)
        if self.ape:
            x = x + self.absolute_pos_embed
        x = self.pos_drop(x)
        x_downsample = []

        for layer in self.layers:
            x_downsample.append(x)
            x = layer(x)

        x = self.norm(x)  # B L C

        return x, x_downsample

    # Dencoder and Skip connection
    def forward_up_features(self, x, x_downsample):
        for inx, layer_up in enumerate(self.layers_up):
            if inx == 0:
                x = layer_up(x)
            else:
                x = torch.cat([x, x_downsample[3 - inx]], -1)
                x = self.concat_back_dim[inx](x)
                x = layer_up(x)

        x = self.norm_up(x)  # B L C
        return x

    def up_x4(self, x):
        H, W = self.patches_resolution
        B, L, C = x.shape
        assert L == H * W, "input features has wrong size"

        if self.final_upsample == "expand_first":
            x = self.up(x)
            x = x.view(B, 4 * H, 4 * W, -1)
            x = x.permute(0, 3, 1, 2)  # B,C,H,W
            x = self.output(x)

        return x

    def forward(self, x):
        # 跳到self.forward_features部分, 转到2.2小节
        x, x_downsample = self.forward_features(x)   # (B,3,H,W)
        x = self.forward_up_features(x, x_downsample)
        x = self.up_x4(x)

        return x

2.2. class ConvSwinTransformerSys()

类ConvSwinTransformerSys()与2.1小节相同，在这里只展示要用到的代码段
从forward_features中x = self.patch_embed(x)开始看

class ConvSwinTransformerSys(nn.Module):
  
    def __init__(self, img_size=224, patch_size=4, in_chans=3, num_classes=1000,
                 embed_dim=96, depths=[2, 2, 2, 2], depths_decoder=[1, 2, 2, 2], num_heads=[3, 3, 3, 3],
                 window_size=7, mlp_ratio=4., qkv_bias=True, qk_scale=None,
                 drop_rate=0., attn_drop_rate=0., drop_path_rate=0.1,
                 norm_layer=nn.LayerNorm, ape=False, patch_norm=True,
                 use_checkpoint=False, final_upsample="expand_first", **kwargs):
        super().__init__()

        print(
            "ConvSwinTransformerSys expand initial----depths:{};depths_decoder:{};num_heads=:{};drop_path_rate:{};num_classes:{}".format(
                depths,
                depths_decoder, num_heads, drop_path_rate, num_classes))

        self.num_classes = num_classes
        self.num_layers = len(depths)
        self.embed_dim = embed_dim
        self.ape = ape
        self.patch_norm = patch_norm
        self.num_features = int(embed_dim * 2 ** (self.num_layers - 1))
        self.num_features_up = int(embed_dim * 2)
        self.mlp_ratio = mlp_ratio
        self.final_upsample = final_upsample

        # split image into overlapping patches
        self.patch_embed = PatchEmbed(
            img_size=img_size, patch_size=patch_size, in_chans=in_chans, embed_dim=embed_dim,
            norm_layer=norm_layer if self.patch_norm else None)

    # Encoder and Bottleneck
    def forward_features(self, x):
        # 这里 x 还是在原始batch图片上进行三通道扩展后的数据
        # 转到2.2.1小节 PatchEmbed
        x = self.patch_embed(x)      # (B,3,H,W)
        if self.ape:
            x = x + self.absolute_pos_embed
        x = self.pos_drop(x)
        x_downsample = []

        for layer in self.layers:
            x_downsample.append(x)
            x = layer(x)

        x = self.norm(x)  # B L C

        return x, x_downsample

2.2.1. 类PatchEmbed()

类PatchEmbed()
从forward中B, C, H, W = x.shape开始看

class PatchEmbed(nn.Module):
    r""" Image to Patch Embedding

    Args:
        img_size (int): Image size.  Default: 224.
        patch_size (int): Patch token size. Default: 4.
        in_chans (int): Number of input image channels. Default: 3.
        embed_dim (int): Number of linear projection output channels. Default: 96.
        norm_layer (nn.Module, optional): Normalization layer. Default: None
    """

    def __init__(self, img_size=224, patch_size=4, in_chans=3, embed_dim=96, norm_layer=None):
        super().__init__()
        img_size = to_2tuple(img_size)
        patch_size = to_2tuple(patch_size)
        patches_resolution = [img_size[0] // patch_size[0], img_size[1] // patch_size[1]]
        self.img_size = img_size
        self.patch_size = patch_size
        self.patches_resolution = patches_resolution
        self.num_patches = patches_resolution[0] * patches_resolution[1]

        self.in_chans = in_chans
        self.embed_dim = embed_dim

        self.proj = nn.Sequential(nn.Conv2d(in_chans, embed_dim // 2, kernel_size=3, stride=1, padding=1), nn.GELU(),
                                  nn.Conv2d(embed_dim // 2, embed_dim // 2, kernel_size=3, stride=2, padding=1),
                                  nn.GELU(),
                                  Rearrange('b c h w -> b h w c'),
                                  norm_layer(embed_dim // 2),
                                  Rearrange('b h w c -> b c h w'),
                                  nn.Conv2d(embed_dim // 2, embed_dim, kernel_size=3, stride=1, padding=1), nn.GELU(),
                                  nn.Conv2d(embed_dim, embed_dim, kernel_size=3, stride=2, padding=1), nn.GELU())
        if norm_layer is not None:
            self.norm = norm_layer(in_chans)
            self.norm2 = norm_layer(embed_dim)
        else:
            self.norm = None
        self.drop = nn.Dropout(p=0.2)

    def forward(self, x):
        B, C, H, W = x.shape          # (B,3,H,W)
        # 判断图片的H和W是否和我们设置的img_size相同，如果不相同就中断程序运行
        assert H == self.img_size[0] and W == self.img_size[1], \
            f"Input image size ({H}*{W}) doesn't match model ({self.img_size[0]}*{self.img_size[1]})."

        '''
         proj中含有四层卷积，每层卷积实现的效果如下：
         (1):(B,3,H,W)->(B,48,H,W)
         (2):(B,48,H,W)->(B,48,H/2,W/2)
         (3):(B,48,H/2,W/2)->(B,96,H/2,W/2)
         (4):(B,96,H/2,W/2)->(B,96,H/4,W/4)
         '''
        x = self.proj(x)                             # (B, 3, H, W)->(B, 96, H/4, W/4)
        x = self.drop(x).flatten(2).transpose(1, 2)  # (B, 96, H/4, W/4)->(B, H/4 * W/4, 96)
        if self.norm is not None:                    # True
            x = self.norm2(x)                        # (B, H/4 * W/4, 96)
        return x   # (B, H/4 * W/4, 96)
        # PatchEmbed执行结束，下面转到2.2小节

2.2.(1)

类ConvSwinTransformerSys()与2.1小节相同，在这里只展示要用到的代码段
从forward_features中if self.ape:开始看

class ConvSwinTransformerSys(nn.Module):
  
    def __init__(self, img_size=224, patch_size=4, in_chans=3, num_classes=1000,
                 embed_dim=96, depths=[2, 2, 2, 2], depths_decoder=[1, 2, 2, 2], num_heads=[3, 3, 3, 3],
                 window_size=7, mlp_ratio=4., qkv_bias=True, qk_scale=None,
                 drop_rate=0., attn_drop_rate=0., drop_path_rate=0.1,
                 norm_layer=nn.LayerNorm, ape=False, patch_norm=True,
                 use_checkpoint=False, final_upsample="expand_first", **kwargs):
        super().__init__()

        print(
            "ConvSwinTransformerSys expand initial----depths:{};depths_decoder:{};num_heads=:{};drop_path_rate:{};num_classes:{}".format(
                depths,
                depths_decoder, num_heads, drop_path_rate, num_classes))

        self.num_classes = num_classes
        self.num_layers = len(depths)
        self.embed_dim = embed_dim
        self.ape = ape
        self.patch_norm = patch_norm
        self.num_features = int(embed_dim * 2 ** (self.num_layers - 1))
        self.num_features_up = int(embed_dim * 2)
        self.mlp_ratio = mlp_ratio
        self.final_upsample = final_upsample

        # split image into overlapping patches
        self.patch_embed = PatchEmbed(
            img_size=img_size, patch_size=patch_size, in_chans=in_chans, embed_dim=embed_dim,
            norm_layer=norm_layer if self.patch_norm else None)
        num_patches = self.patch_embed.num_patches
        patches_resolution = self.patch_embed.patches_resolution
        self.patches_resolution = patches_resolution

        # absolute position embedding
        if self.ape:
            self.absolute_pos_embed = nn.Parameter(torch.zeros(1, num_patches, embed_dim))
            trunc_normal_(self.absolute_pos_embed, std=.02)

        self.pos_drop = nn.Dropout(p=drop_rate)
        
        # stochastic depth
        dpr = [x.item() for x in torch.linspace(0, drop_path_rate, sum(depths))]  # stochastic depth decay rule

        # build encoder and bottleneck layers
        self.layers = nn.ModuleList()
        for i_layer in range(self.num_layers):
            layer = BasicLayer(dim=int(embed_dim * 2 ** i_layer),
                               input_resolution=(patches_resolution[0] // (2 ** i_layer),
                                                 patches_resolution[1] // (2 ** i_layer)),
                               depth=depths[i_layer],
                               num_heads=num_heads[i_layer],
                               window_size=window_size,
                               mlp_ratio=self.mlp_ratio,
                               qkv_bias=qkv_bias, qk_scale=qk_scale,
                               drop=drop_rate, attn_drop=attn_drop_rate,
                               drop_path=dpr[sum(depths[:i_layer]):sum(depths[:i_layer + 1])],
                               norm_layer=norm_layer,
                               downsample=PatchMerging if (i_layer < self.num_layers - 1) else None,
                               use_checkpoint=use_checkpoint)
            self.layers.append(layer)
            

    # Encoder and Bottleneck
    def forward_features(self, x):
        # 这里 x 还是在原始batch图片上进行三通道扩展后的数据
        # 转到2.2.1小节 PatchEmbed
        x = self.patch_embed(x)      # (B,3,H,W)->(B, H/4 * W/4, 96)

        # 是否加入绝对位置索引
        if self.ape:       # Flase
            x = x + self.absolute_pos_embed

        x = self.pos_drop(x)  # 减少过拟合
        x_downsample = []

        '''
        self.layer总共有4层：前三层含 CST_Block×2 和 Patch_merging×1，第四层只含有 CST_Block×2;
        '''
        for layer in self.layers:   
            x_downsample.append(x)  # (B, H*W/16, 96)
            
            # 跳转到 BasicLayer，见2.2.2小节
            x = layer(x)

        x = self.norm(x)  # B L C

        return x, x_downsample

2.2.2. class BasicLayer()

类BasicLayer：实现CST_Block和Patch_merging
从forward中的for blk in self.blocks:开始看：

class BasicLayer(nn.Module):
    """ A basic convolutional Swin Transformer layer for one stage.

    Args:
        dim (int): Number of input channels.
        input_resolution (tuple[int]): Input resolution.
        depth (int): Number of blocks.
        num_heads (int): Number of attention heads.
        window_size (int): Local window size.
        mlp_ratio (float): Ratio of mlp hidden dim to embedding dim.
        qkv_bias (bool, optional): If True, add a learnable bias to query, key, value. Default: True
        qk_scale (float | None, optional): Override default qk scale of head_dim ** -0.5 if set.
        drop (float, optional): Dropout rate. Default: 0.0
        attn_drop (float, optional): Attention dropout rate. Default: 0.0
        drop_path (float | tuple[float], optional): Stochastic depth rate. Default: 0.0
        norm_layer (nn.Module, optional): Normalization layer. Default: nn.LayerNorm
        downsample (nn.Module | None, optional): Downsample layer at the end of the layer. Default: None
        use_checkpoint (bool): Whether to use checkpointing to save memory. Default: False.
    """

    def __init__(self, dim, input_resolution, depth, num_heads, window_size,
                 mlp_ratio=4., qkv_bias=True, qk_scale=None, drop=0., attn_drop=0.,
                 drop_path=0., norm_layer=nn.LayerNorm, downsample=None, use_checkpoint=False):

        super().__init__()
        self.dim = dim
        self.input_resolution = input_resolution
        self.depth = depth
        self.use_checkpoint = use_checkpoint

        # build blocks
        self.blocks = nn.ModuleList([
            ConvSwinTransformerBlock(dim=dim, input_resolution=input_resolution,
                                 num_heads=num_heads, window_size=window_size,
                                 shift_size=0 if (i % 2 == 0) else window_size // 2,
                                 mlp_ratio=mlp_ratio,
                                 qkv_bias=qkv_bias, qk_scale=qk_scale,
                                 drop=drop, attn_drop=attn_drop,
                                 drop_path=drop_path[i] if isinstance(drop_path, list) else drop_path,
                                 norm_layer=norm_layer)
            for i in range(depth)])

        # patch merging layer
        if downsample is not None:
            self.downsample = downsample(input_resolution, dim=dim, norm_layer=norm_layer)
        else:
            self.downsample = None

    def forward(self, x):   #  (B, H*W/16, 96)
    
        # self.blocks有2个ConvSwinTransformerBlock，即for循环执行 2 次
        for blk in self.blocks:
        
            if self.use_checkpoint:  # False
                x = checkpoint.checkpoint(blk, x)
            else:

                # 跳转到2.2.2.1小节,执行ConvSwinTransformerBlock
                x = blk(x)
        if self.downsample is not None:
            x = self.downsample(x)
        return x

    def extra_repr(self) -> str:
        return f"dim={self.dim}, input_resolution={self.input_resolution}, depth={self.depth}"

2.2.2.1. class ConvSwinTransformerBlock()

类ConvSwinTransformerBlock()：
从forward中的H, W = self.input_resolution开始看：

class ConvSwinTransformerBlock(nn.Module):
    r""" Conv Swin Transformer Block.

    Args:
        dim (int): Number of input channels.
        input_resolution (tuple[int]): Input resulotion.
        num_heads (int): Number of attention heads.
        window_size (int): Window size.
        shift_size (int): Shift size for SW-MSA.
        mlp_ratio (float): Ratio of mlp hidden dim to embedding dim.
        qkv_bias (bool, optional): If True, add a learnable bias to query, key, value. Default: True
        qk_scale (float | None, optional): Override default qk scale of head_dim ** -0.5 if set.
        drop (float, optional): Dropout rate. Default: 0.0
        attn_drop (float, optional): Attention dropout rate. Default: 0.0
        drop_path (float, optional): Stochastic depth rate. Default: 0.0
        norm_layer (nn.Module, optional): Normalization layer.  Default: nn.LayerNorm
    """

    def __init__(self, dim, input_resolution, num_heads, window_size=7, shift_size=0,
                 mlp_ratio=4., qkv_bias=True, qk_scale=None, drop=0., attn_drop=0., drop_path=0.,
                 norm_layer=nn.LayerNorm):
        super().__init__()
        self.dim = dim
        self.input_resolution = input_resolution
        self.num_heads = num_heads
        self.window_size = window_size
        self.shift_size = shift_size
        self.mlp_ratio = mlp_ratio
        if min(self.input_resolution) <= self.window_size:
            # if window size is larger than input resolution, we don't partition windows
            self.shift_size = 0
            self.window_size = min(self.input_resolution)
        assert 0 <= self.shift_size < self.window_size, "shift_size must in 0-window_size"

        self.norm1 = norm_layer(dim)
        self.attn = WindowAttention(
            dim, window_size=to_2tuple(self.window_size), num_heads=num_heads,
            qkv_bias=qkv_bias, qk_scale=qk_scale, attn_drop=attn_drop, proj_drop=drop)

        self.drop_path = DropPath(drop_path) if drop_path > 0. else nn.Identity()
        self.mlp = Mlp(dim=dim, drop_path=drop)

        if self.shift_size > 0:
            # calculate attention mask for SW-CMSA
            H, W = self.input_resolution
            img_mask = torch.zeros((1, H, W, 1))  # 1 H W 1
            h_slices = (slice(0, -self.window_size),
                        slice(-self.window_size, -self.shift_size),
                        slice(-self.shift_size, None))
            w_slices = (slice(0, -self.window_size),
                        slice(-self.window_size, -self.shift_size),
                        slice(-self.shift_size, None))
            cnt = 0
            for h in h_slices:
                for w in w_slices:
                    img_mask[:, h, w, :] = cnt
                    cnt += 1

            mask_windows = window_partition(img_mask, self.window_size)  # nW, window_size, window_size, 1
            mask_windows = mask_windows.view(-1, self.window_size * self.window_size)
            attn_mask = mask_windows.unsqueeze(1) - mask_windows.unsqueeze(2)
            attn_mask = attn_mask.masked_fill(attn_mask != 0, float(-100.0)).masked_fill(attn_mask == 0, float(0.0))
        else:
            attn_mask = None

        self.register_buffer("attn_mask", attn_mask)

    def forward(self, x):
 
        '''
        这里self.input_resolution在ConvSwinTransformerSys中定义:
        input_resolution[0]=H/(2^i_layer);input_resolution[1]=W/(2^i_layer)
        其中, i_layer=2
        '''
        H, W = self.input_resolution   # H/4, W/4
        B, L, C = x.shape              # (B, H*W/16, 96)
        assert L == H * W, "input feature has wrong size"  # 判断数据是否正确

        shortcut = x                  # (B, H*W/16, 96)
        
        x = self.norm1(x)             # (B, H*W/16, 96)
        x = x.view(B, H, W, C)        # (B, H/4, W/4, 96)

        # cyclic shift
        if self.shift_size > 0:    # 0
            shifted_x = torch.roll(x, shifts=(-self.shift_size, -self.shift_size), dims=(1, 2))
        else:
            shifted_x = x         # (B, H/4, W/4, 96)

        '''
        分割窗口:
        shifted_x=(B, H/4, W/4, 96); self.window_size=7
        具体算法：
        (1)将shifted_x的H和W分别除以window_size得到张量得shape为：
           (B, H/4/window_size, window_size, w/4/window_size, window_size, 96)
        (2)改变上面新张量的shape为: windows=(B * H/4/window_size * w/4/window_size, window_size, window_size, 96)
        其中，H/4/window_size * w/4/window_size为窗口数量，下面用nW表示窗口数量。即上式=(nW*B,window_size, window_size, 96)
        '''  # window_partition函数的实现在这段代码后面给出
        x_windows = window_partition(shifted_x, self.window_size)  # nW*B, window_size, window_size, C
        # 改变shape，第1、2维相乘
        x_windows = x_windows.view(-1, self.window_size * self.window_size, C)  # nW*B, window_size*window_size, C

        # W-MSA/SW-MSA
        # self.attn = WindowAttention()，跳转到2.2.2.1.1小节
        attn_windows = self.attn(x_windows, mask=self.attn_mask)  # nW*B, window_size*window_size, C

        # merge windows
        attn_windows = attn_windows.view(-1, self.window_size, self.window_size, C)
        shifted_x = window_reverse(attn_windows, self.window_size, H, W)  # B H' W' C

        # reverse cyclic shift
        if self.shift_size > 0:
            x = torch.roll(shifted_x, shifts=(self.shift_size, self.shift_size), dims=(1, 2))
        else:
            x = shifted_x
        x = x.view(B, H * W, C)
        x = shortcut + self.drop_path(x)

        # FFN
        x = x.view(B, H, W, C)
        x = self.mlp(x)
        x = x.view(B, H * W, C)
        return x

    def extra_repr(self) -> str:
        return f"dim={self.dim}, input_resolution={self.input_resolution}, num_heads={self.num_heads}, " \
               f"window_size={self.window_size}, shift_size={self.shift_size}, mlp_ratio={self.mlp_ratio}"

函数window_partition的实现：

def window_partition(x, window_size):
    """
    Args:
        x: (B, H, W, C)
        window_size (int): window size

    Returns:
        windows: (num_windows*B, window_size, window_size, C)
    """
    B, H, W, C = x.shape
    x = x.view(B, H // window_size, window_size, W // window_size, window_size, C)
    windows = x.permute(0, 1, 3, 2, 4, 5).contiguous().view(-1, window_size, window_size, C)
    return windows

2.2.2.1.1. class WindowAttention()

类class WindowAttention()：
从forward中的B_, N, C = x.shape开始看：

class WindowAttention(nn.Module):
    r""" Window based multi-head self attention (W-MSA) module with relative position bias.
    It supports both of shifted and non-shifted window.

    Args:
        dim (int): Number of input channels.
        window_size (tuple[int]): The height and width of the window.
        num_heads (int): Number of attention heads.
        qkv_bias (bool, optional):  If True, add a learnable bias to query, key, value. Default: True
        qk_scale (float | None, optional): Override default qk scale of head_dim ** -0.5 if set
        attn_drop (float, optional): Dropout ratio of attention weight. Default: 0.0
        proj_drop (float, optional): Dropout ratio of output. Default: 0.0
    """

    def __init__(self, dim, window_size, num_heads, qkv_bias=True, qk_scale=None, attn_drop=0., proj_drop=0.):

        super().__init__()
        self.dim = dim
        self.window_size = window_size  # Wh, Ww
        self.num_heads = num_heads
        head_dim = dim // num_heads
        self.scale = qk_scale or head_dim ** -0.5

        self.conv_proj_q = self._build_projection(dim, kernel_size=3, stride=1, padding=1)
        self.conv_proj_k = self._build_projection(dim, kernel_size=3, stride=1, padding=1)
        self.conv_proj_v = self._build_projection(dim, kernel_size=3, stride=1, padding=1)

        self.attn_drop = nn.Dropout(attn_drop)
        self.proj = nn.Sequential(nn.Conv2d(dim, dim, kernel_size=3, padding=1, stride=1, bias=False, groups=dim), nn.GELU())
        self.proj_drop = nn.Dropout(proj_drop)

        self.softmax = nn.Softmax(dim=-1)

    def _build_projection(self, dim_in, kernel_size=3, stride=1, padding=1):
        proj = nn.Sequential(
            nn.Conv2d(dim_in, dim_in, kernel_size, padding=padding, stride=stride, bias=False, groups=dim_in),
            Rearrange('b c h w -> b (h w) c'),
            nn.LayerNorm(dim_in))
        return proj

    def forward(self, x, mask=None):
        """
        Args:
            x: input features with shape of (num_windows*B, N, C)
            mask: (0/-inf) mask with shape of (num_windows, Wh*Ww, Wh*Ww) or None
        """
        # [batch_size*num_windows, Mh*Mw, total_embed_dim]
        B_, N, C = x.shape                # nW*B, window_size*window_size, C
        Mh = int(N ** .5)                 # Mh = window_size
        x = x.view(B_, Mh, Mh, C).permute(0, 3, 1, 2)  # [nW*B, Mh, Mw, C]->[nW*B, C, Mh, Mw]
        
        # when we use conv the shape should be B, C, H, W. so use permute,其中num_heads=3
        # self.conv_proj_q具体实现在这段代码后面说明
        '''
        q、k、v的生成：分 3 步
        (1)conv_proj_q的功能: 经过一个3×3的卷积核(但不改变尺寸和通道数) ,然后经过Rearrange:[nW*B, C, Mh, Mw]->[nW*B, Mh*Mw, C],最后经过一个LayerNorm层
        (2)reshape：[nW*B, Mh*Mw, C]->[nW*B, Mh*Mw, num_heads, C/num_heads]=[nW*B, Mh*Mw, 3, C/3]
        (3)permute: [nW*B, 3, Mh*Mw, C/3]
        '''
        q = self.conv_proj_q(x).reshape(B_, N, self.num_heads, C // self.num_heads).permute(0, 2, 1,3)  # [batch_size*num_windows, num_heads, Mh*Mw, embed_dim_per_head]
        k = self.conv_proj_k(x).reshape(B_, N, self.num_heads, C // self.num_heads).permute(0, 2, 1, 3)
        v = self.conv_proj_v(x).reshape(B_, N, self.num_heads, C // self.num_heads).permute(0, 2, 1, 3)

        '''self.scale的计算过程：
        (1)head_dim = dim // num_heads    # 96/3 = 32
        (2)self.scale = head_dim ** -0.5   # 1/√32 ≈ 0.1768
        '''
        q = q * self.scale                        # [nW*B, num_heads, Mh*Mw, C/num_heads]=[nW*B, 3, Mh*Mw, C/3]
        attn = (q @ k.transpose(-2, -1))          # [nW*B, num_heads, Mh*Mw, Mh*Mw]
        # transpose: -> [batch_size*num_windows, num_heads, embed_dim_per_head, Mh*Mw]
        # @:multiply -> [batch_size*num_windows, num_heads, Mh*Mw, Mh*Mw]


        if mask is not None:   # None
            # mask: [nW, Mh*Mw, Mh*Mw]
            nW = mask.shape[0]  # num_windows
            # attn.view: [batch_size, num_windows, num_heads, Mh*Mw, Mh*Mw]
            # mask.unsqueeze: [1, nW, 1, Mh*Mw, Mh*Mw]
            attn = attn.view(B_ // nW, nW, self.num_heads, N, N) + mask.unsqueeze(1).unsqueeze(0)
            attn = attn.view(-1, self.num_heads, N, N)
            attn = self.softmax(attn)
            
        else:
            attn = self.softmax(attn)   # [nW*B, num_heads, Mh*Mw, Mh*Mw]
        attn = self.attn_drop(attn)     # [nW*B, num_heads, Mh*Mw, Mh*Mw]

        '''Mh = Mw
        (1)[nW*B, num_heads, Mh*Mw, Mh*Mw] @ [nW*B, num_heads, Mh*Mw, C/num_heads]=[nW*B, num_heads, Mh*Mw, C/num_heads]
        (2)transpose(2, 3): [nW*B, num_heads, C/num_heads, Mh*Mw]
        (3)reshape(B_, C, Mh, Mh): [nW*B, C, Mh, Mw]
        '''
        x = (attn @ v).transpose(2, 3).reshape(B_, C, Mh, Mh)     # [nW*B, C, Mh, Mw]
        
        x = self.proj(x)     # 3×3的卷积和Relu层,特征图shape不变。 # [nW*B, C, Mh, Mw] = [nW*B, 96, 7, 7]
        x = x.reshape(B_, C, N).transpose(1, 2)  # [nW*B, C, Mh, Mw]->[nW*B, C, Mh*Mw]->[nW*B, Mh*Mw, C]
        x = self.proj_drop(x)                    # [nW*B, Mh*Mw, C]

        return x          # [nW*B, Mh*Mw, C]
        # 到这里class WindowAttention()执行结束，下面跳到2.2.2.1.(1)小节

    def extra_repr(self) -> str:
        return f'dim={self.dim}, window_size={self.window_size}, num_heads={self.num_heads}'

self.conv_proj_q的实现：

self.conv_proj_k = self._build_projection(dim, kernel_size=3, stride=1, padding=1) 
# 跳到self._build_projection, 见下面

    def _build_projection(self, dim_in, kernel_size=3, stride=1, padding=1):
        proj = nn.Sequential(
            nn.Conv2d(dim_in, dim_in, kernel_size, padding=padding, stride=stride, bias=False, groups=dim_in),
            Rearrange('b c h w -> b (h w) c'),    # [nW*B, C, Mh, Mw]->[nW*B, Mh, Mw,C]
            nn.LayerNorm(dim_in))
        return proj

2.2.2.1.(1)

类ConvSwinTransformerBlock()：简洁起见，只显示forward部分
从forward中的attn_windows = attn_windows.view(-1, self.window_size, self.window_size, C)开始看：

    def forward(self, x):
        H, W = self.input_resolution
        B, L, C = x.shape
        assert L == H * W, "input feature has wrong size"

        shortcut = x
        x = self.norm1(x)
        x = x.view(B, H, W, C)

        # cyclic shift
        if self.shift_size > 0:
            shifted_x = torch.roll(x, shifts=(-self.shift_size, -self.shift_size), dims=(1, 2))
        else:
            shifted_x = x

        # partition windows
        x_windows = window_partition(shifted_x, self.window_size)  # nW*B, window_size, window_size, C
        x_windows = x_windows.view(-1, self.window_size * self.window_size, C)  # nW*B, window_size*window_size, C

        # W-MSA/SW-MSA: WindowAttention
        attn_windows = self.attn(x_windows, mask=self.attn_mask)  # nW*B, window_size*window_size, C

        # merge windows
        attn_windows = attn_windows.view(-1, self.window_size, self.window_size, C) # [nW*B, Mh*Mw, C]->[nW*B, Mh, Mw, C]

        '''window_reverse: 还原特征图[B, H, W, C],这里的H和W为原尺寸的1/4
        其中attn_windows=[nW*B, Mh, Mw, C],window_size=7, H=W=img_size/4(56)
        (1)B = int(windows.shape[0] / (H * W / window_size / window_size)):得到batch_size
        (2)x = windows.view: [B, H/window_size, W/window_size,Mh, Mw, C]
        (3) [B, H/window_size, W/window_size,Mh, Mw, C]-> [B, H/window_size*Mh, W/window_size*Mw, C]->[B, H, W, C]
        '''# window_reverse的实现在这段代码的下面
        shifted_x = window_reverse(attn_windows, self.window_size, H, W)  # [B, H, W, C]

        # reverse cyclic shift
        if self.shift_size > 0:   # 0
            x = torch.roll(shifted_x, shifts=(self.shift_size, self.shift_size), dims=(1, 2))
            
        else:
            x = shifted_x                 # [B, H, W, C]
        x = x.view(B, H * W, C)           # [B, H*W, C]
        x = shortcut + self.drop_path(x)  # [B, H*W, C]+drop([B, H*W, C])=[B, H*W, C]

        # FFN
        x = x.view(B, H, W, C)      # [B, H, W, C]

        # 类Mlp，接下来跳转到2.2.2.1.2.小节 
        x = self.mlp(x)           # [B, H, W, C]->
        x = x.view(B, H * W, C)
        return x

    def extra_repr(self) -> str:
        return f"dim={self.dim}, input_resolution={self.input_resolution}, num_heads={self.num_heads}, " \
               f"window_size={self.window_size}, shift_size={self.shift_size}, mlp_ratio={self.mlp_ratio}"

函数window_reverse：

def window_reverse(windows, window_size, H, W):
    """
    Args:
        windows: (num_windows*B, window_size, window_size, C)
        window_size (int): Window size
        H (int): Height of image
        W (int): Width of image

    Returns:
        x: (B, H, W, C)
    """
    B = int(windows.shape[0] / (H * W / window_size / window_size))
    x = windows.view(B, H // window_size, W // window_size, window_size, window_size, -1)
    x = x.permute(0, 1, 3, 2, 4, 5).contiguous().view(B, H, W, -1)
    return x

2.2.2.1.2. class Mlp()

类Mlp
从forward中的input = x 开始看

class Mlp(nn.Module):
    def __init__(self, dim, drop_path=0.2, layer_scale_init_value=0.7):
        super().__init__()
        self.dwconv = nn.Conv2d(dim, dim, kernel_size=7, padding=3, groups=dim)  # depthwise conv 7,3  5,2  3,1
        self.norm = nn.LayerNorm(dim, eps=1e-6)
        self.pwconv1 = nn.Conv2d(dim, 4 * dim, kernel_size=1)
        self.act = nn.GELU()
        self.pwconv2 = nn.Conv2d(4 * dim, dim, kernel_size=1)  # nn.Linear(4 * dim, dim)
        self.gamma = nn.Parameter(layer_scale_init_value * torch.ones((dim)),
                                  requires_grad=True) if layer_scale_init_value > 0 else None
        self.drop_path = DropPath(drop_path) if drop_path > 0. else nn.Identity()

    def forward(self, x):   # 这里的H和W为原尺寸的1/4
        input = x  # [B, H, W, C]
        x = x.permute(0, 3, 1, 2)  # [B, H, W, C] -> [B, C, H, W]

        # 7×7的卷积核,图像尺寸和channels不变
        x = self.dwconv(x)         # [B, C, H, W]
        x = x.permute(0, 2, 3, 1)  # [B, H, W, C]
        x = self.norm(x)
        x = x.permute(0, 3, 1, 2)  # [B, C, H, W]

        # 1×1的pointwise卷积:channels -> channels×4
        x = self.pwconv1(x)        # [B, 4C, H, W]
        x = self.act(x)            # GELU层

        # 1×1的pointwise卷积:channels×4 -> channels
        x = self.pwconv2(x)        # [B, C, H, W]
        x = x.permute(0, 2, 3, 1)  # [B, C, H, W] -> [B, H, W, C]

        # gamma在上面声明不为None
        if self.gamma is not None:     # 
            x = self.gamma * x         # [B, H, W, C]
        x = input + self.drop_path(x)  # [B, H, W, C]
        return x        # [B, H, W, C]
        # Mlp执行结束,接下来跳到2.2.2.1.(2)小节

2.2.2.1.(2)

类ConvSwinTransformerBlock()：简洁起见，只显示forward部分
从forward中的x = x.view(B, H * W, C)开始看：

    def forward(self, x):
        H, W = self.input_resolution
        B, L, C = x.shape
        assert L == H * W, "input feature has wrong size"

        shortcut = x
        x = self.norm1(x)
        x = x.view(B, H, W, C)

        # cyclic shift
        if self.shift_size > 0:
            shifted_x = torch.roll(x, shifts=(-self.shift_size, -self.shift_size), dims=(1, 2))
        else:
            shifted_x = x

        # partition windows
        x_windows = window_partition(shifted_x, self.window_size)  # nW*B, window_size, window_size, C
        x_windows = x_windows.view(-1, self.window_size * self.window_size, C)  # nW*B, window_size*window_size, C

        # W-MSA/SW-MSA
        attn_windows = self.attn(x_windows, mask=self.attn_mask)  # nW*B, window_size*window_size, C

        # merge windows
        attn_windows = attn_windows.view(-1, self.window_size, self.window_size, C)
        shifted_x = window_reverse(attn_windows, self.window_size, H, W)  # B H' W' C

        # reverse cyclic shift
        if self.shift_size > 0:
            x = torch.roll(shifted_x, shifts=(self.shift_size, self.shift_size), dims=(1, 2))
        else:
            x = shifted_x
        x = x.view(B, H * W, C)
        x = shortcut + self.drop_path(x)

        # FFN
        x = x.view(B, H, W, C)
        x = self.mlp(x)          # [B, H, W, C]
        x = x.view(B, H * W, C)  # [B, H*W, C]
        return x                 # [B, H*W, C]
        # 到这里 类ConvSwinTransformerBlock()执行结束，接下来跳转到2.2.2.(1) class BasicLayer()

2.2.2.(1)

类BasicLayer：实现CST_Block和Patch_merging
从forward中的for blk in self.blocks:开始看：到这blk开始执行第2次

    def forward(self, x):   #  (B, H*W/16, 96)
    
        # self.blocks有2个ConvSwinTransformerBlock，即for循环执行 2 次
        for blk in self.blocks:
        
            if self.use_checkpoint:  # False
                x = checkpoint.checkpoint(blk, x)
            else:

                # 跳转到2.2.2.1小节,执行ConvSwinTransformerBlock
                '''循环的第二次和第一次基本一样，但是在class WindowAttention()中mask不为None,接下来从2.2.2.1.1.(1)这里开始
                '''
                x = blk(x)
        if self.downsample is not None:
            x = self.downsample(x)
        return x

    def extra_repr(self) -> str:
        return f"dim={self.dim}, input_resolution={self.input_resolution}, depth={self.depth}"

2.2.2.1.1.(1)

类class WindowAttention()：简洁起见，只看forward过程
从forward中的B_, N, C = x.shape开始看：

    def forward(self, x, mask=None):
        """
        Args:
            x: input features with shape of (num_windows*B, N, C)
            mask: (0/-inf) mask with shape of (num_windows, Wh*Ww, Wh*Ww) or None
        """
        # [batch_size*num_windows, Mh*Mw, total_embed_dim]
        B_, N, C = x.shape                # nW*B, window_size*window_size, C
        Mh = int(N ** .5)                 # Mh = window_size
        x = x.view(B_, Mh, Mh, C).permute(0, 3, 1, 2)  # [nW*B, Mh, Mw, C]->[nW*B, C, Mh, Mw]
        
        # when we use conv the shape should be B, C, H, W. so use permute,其中num_heads=3
        # self.conv_proj_q具体实现在这段代码后面说明
        '''
        q、k、v的生成：分 3 步
        (1)conv_proj_q的功能: 经过一个3×3的卷积核(但不改变尺寸和通道数) ,然后经过Rearrange:[nW*B, C, Mh, Mw]->[nW*B, Mh*Mw, C],最后经过一个LayerNorm层
        (2)reshape：[nW*B, Mh*Mw, C]->[nW*B, Mh*Mw, num_heads, C/num_heads]=[nW*B, Mh*Mw, 3, C/3]
        (3)permute: [nW*B, 3, Mh*Mw, C/3]
        '''
        q = self.conv_proj_q(x).reshape(B_, N, self.num_heads, C // self.num_heads).permute(0, 2, 1,3)  # [batch_size*num_windows, num_heads, Mh*Mw, embed_dim_per_head]
        k = self.conv_proj_k(x).reshape(B_, N, self.num_heads, C // self.num_heads).permute(0, 2, 1, 3)
        v = self.conv_proj_v(x).reshape(B_, N, self.num_heads, C // self.num_heads).permute(0, 2, 1, 3)

        '''self.scale的计算过程：
        (1)head_dim = dim // num_heads    # 96/3 = 32
        (2)self.scale = head_dim ** -0.5   # 1/√32 ≈ 0.1768
        '''
        q = q * self.scale                        # [nW*B, num_heads, Mh*Mw, C/num_heads]=[nW*B, 3, Mh*Mw, C/3]
        attn = (q @ k.transpose(-2, -1))          # [nW*B, num_heads, Mh*Mw, Mh*Mw]
        # transpose: -> [batch_size*num_windows, num_heads, embed_dim_per_head, Mh*Mw]
        # @:multiply -> [batch_size*num_windows, num_heads, Mh*Mw, Mh*Mw]


        if mask is not None:   # mask: [nW, Mh*Mw, Mh*Mw], N = Mh*Mw, B_ = nW*B
            nW = mask.shape[0]  # num_windows
            
            '''
            attn.view: [B, nW, num_heads, Mh*Mw, Mh*Mw]
            mask.unsqueeze: [1, nW, 1, Mh*Mw, Mh*Mw]
            attn.view + mask.unsqueeze: [B, nW, num_heads, Mh*Mw, Mh*Mw]
            '''
            attn = attn.view(B_ // nW, nW, self.num_heads, N, N) + mask.unsqueeze(1).unsqueeze(0)
            
            attn = attn.view(-1, self.num_heads, N, N) # [B_, num_heads, Mh*Mw, Mh*Mw]
            attn = self.softmax(attn)                  # [B_, num_heads, Mh*Mw, Mh*Mw]
            # 到这里，后面和blk循环的第一次基本相同,但是在ConvSwinTransformerBlock中shift_size≠0,接下来跳转到2.2.2.1.(1)
            
            
        else:
            attn = self.softmax(attn)   
            
        attn = self.attn_drop(attn)                    # [nW*B, num_heads, Mh*Mw, Mh*Mw]

        '''Mh = Mw
        (1)[nW*B, num_heads, Mh*Mw, Mh*Mw] @ [nW*B, num_heads, Mh*Mw, C/num_heads]=[nW*B, num_heads, Mh*Mw, C/num_heads]
        (2)transpose(2, 3): [nW*B, num_heads, C/num_heads, Mh*Mw]
        (3)reshape(B_, C, Mh, Mh): [nW*B, C, Mh, Mw]
        '''
        x = (attn @ v).transpose(2, 3).reshape(B_, C, Mh, Mh)     # [nW*B, C, Mh, Mw]
        
        x = self.proj(x)     # 3×3的卷积和Relu层,特征图shape不变。 # [nW*B, C, Mh, Mw] = [nW*B, 96, 7, 7]
        x = x.reshape(B_, C, N).transpose(1, 2)  # [nW*B, C, Mh, Mw]->[nW*B, C, Mh*Mw]->[nW*B, Mh*Mw, C]
        x = self.proj_drop(x)                    # [nW*B, Mh*Mw, C]

        return x          # [nW*B, Mh*Mw, C]
        # 到这里class WindowAttention()执行结束，下面跳到2.2.2.1.(3)小节

    def extra_repr(self) -> str:
        return f'dim={self.dim}, window_size={self.window_size}, num_heads={self.num_heads}'

2.2.2.1.(3)

类ConvSwinTransformerBlock()：
从forward中的# cyclic shift开始看：

    def forward(self, x):
 
        '''
        这里self.input_resolution在ConvSwinTransformerSys中定义:
        input_resolution[0]=H/(2^i_layer);input_resolution[1]=W/(2^i_layer)
        其中, i_layer=2
        '''
        H, W = self.input_resolution   # H/4, W/4
        B, L, C = x.shape              # (B, H*W/16, 96)
        assert L == H * W, "input feature has wrong size"  # 判断数据是否正确

        shortcut = x                  # (B, H*W/16, 96)
        
        x = self.norm1(x)             # (B, H*W/16, 96)
        x = x.view(B, H, W, C)        # (B, H/4, W/4, 96)

        # cyclic shift
        '''
        torch.roll 函数接受两个参数：输入张量和滚动的偏移量。在这里，shifts=(-self.shift_size, -self.shift_size) 表示向左
        上方滚动 self.shift_size 个位置。这意味着 x 中的元素将被沿着第一个维度（dim=1）和第二个维度（dim=2）同时向左移动
        self.shift_size 个位置。
        注意: 滚动操作不会改变张量的形状和元素的顺序，只是将元素按照指定的偏移量进行重新排列。
        '''
        if self.shift_size > 0:    # 3
            shifted_x = torch.roll(x, shifts=(-self.shift_size, -self.shift_size), dims=(1, 2))
        # 这里采用滚动，后面还要反滚动(reverse cyclic shift)复原窗口

        else:
            shifted_x = x         # (B, H/4, W/4, 96)

        '''
        分割窗口:
        shifted_x=(B, H/4, W/4, 96); self.window_size=7
        具体算法：
        (1)将shifted_x的H和W分别除以window_size得到张量得shape为：
           (B, H/4/window_size, window_size, w/4/window_size, window_size, 96)
        (2)改变上面新张量的shape为: windows=(B * H/4/window_size * w/4/window_size, window_size, window_size, 96)
        其中，H/4/window_size * w/4/window_size为窗口数量，下面用nW表示窗口数量。即上式=(nW*B,window_size, window_size, 96)
        '''  # window_partition函数的实现在这段代码后面给出
        x_windows = window_partition(shifted_x, self.window_size)  # nW*B, window_size, window_size, C
        # 改变shape，第1、2维相乘
        x_windows = x_windows.view(-1, self.window_size * self.window_size, C)  # nW*B, window_size*window_size, C

        # W-MSA/SW-MSA
        # self.attn = WindowAttention()，跳转到2.2.2.1.1小节
        attn_windows = self.attn(x_windows, mask=self.attn_mask)  # nW*B, window_size*window_size, C

        # merge windows
        attn_windows = attn_windows.view(-1, self.window_size, self.window_size, C)
        shifted_x = window_reverse(attn_windows, self.window_size, H, W)  # B H' W' C

        # reverse cyclic shift
        if self.shift_size > 0:
            x = torch.roll(shifted_x, shifts=(self.shift_size, self.shift_size), dims=(1, 2))
        else:
            x = shifted_x
            
        x = x.view(B, H * W, C)           # [B, H*W, C]
        x = shortcut + self.drop_path(x)  # [B, H*W, C]+drop([B, H*W, C])=[B, H*W, C]

        # FFN
        x = x.view(B, H, W, C)
        x = self.mlp(x)          # [B, H, W, C]
        x = x.view(B, H * W, C)  # [B, H*W, C]
        return x                 # [B, H*W, C]
        # 到这里blk的循环就结束了, 跳转到2.2.2.(2)小节

2.2.2.(2)

类BasicLayer：实现CST_Block和Patch_merging
从forward中的if self.downsample is not None:开始看：

    def forward(self, x):   #  (B, H*W/16, 96)
    
        # self.blocks有2个ConvSwinTransformerBlock，即for循环执行 2 次
        for blk in self.blocks:
        
            if self.use_checkpoint:  # False
                x = checkpoint.checkpoint(blk, x)
            else:
                x = blk(x)     # [B, H*W, C]

        
        if self.downsample is not None:   # Patch_Merging
            # downsample=PatchMerging, 接下来跳转到类PatchMerging
            x = self.downsample(x)      # [B, H*W, C]->[B,]
        return x

    def extra_repr(self) -> str:
        return f"dim={self.dim}, input_resolution={self.input_resolution}, depth={self.depth}"

2.2.2.2. class PatchMerging()

类PatchMerging()：
从forward中的H, W = self.input_resolution开始看

class PatchMerging(nn.Module):
    r""" Patch Merging Layer.

    Args:
        input_resolution (tuple[int]): Resolution of input feature.
        dim (int): Number of input channels.
        norm_layer (nn.Module, optional): Normalization layer.  Default: nn.LayerNorm
    """
    def __init__(self, input_resolution, dim, norm_layer=nn.LayerNorm):
        super().__init__()
        self.input_resolution = input_resolution
        self.dim = dim
        self.reduction = nn.Linear(4 * dim, 2 * dim, bias=False)
        self.norm = norm_layer(4 * dim)

    def forward(self, x):  # [B, H*W, C]
        H, W = self.input_resolution
        B, L, C = x.shape             # L = H*W
        assert L == H * W, "input feature has wrong size"
        assert H % 2 == 0 and W % 2 == 0, f"x size ({H}*{W}) are not even."

        x = x.view(B, H, W, C)

        '''
        解释一下操作符 "::" 的含义:
        在 Python 中，start:stop:step 表示从索引 start 开始，到索引 stop-1 结束，每隔 step 个元素取
        一个。如果不指定 start 和 stop，则默认从头开始或者到末尾结束。
        举个例子解释代码：
        x0 = x[:, 0::2, 0::2, :]：这行代码从输入张量 x 中按照步长为 2 在第一个维度、第二个维度进行子采样。
        它选择了索引为偶数的行和列，得到的结果是原张量的一半高度和一半宽度，形状为 B (batch size) × H/2 × W/2 × C。
        '''
        x0 = x[:, 0::2, 0::2, :]  # B H/2 W/2 C
        x1 = x[:, 1::2, 0::2, :]  # B H/2 W/2 C
        x2 = x[:, 0::2, 1::2, :]  # B H/2 W/2 C
        x3 = x[:, 1::2, 1::2, :]  # B H/2 W/2 C

        # 
        x = torch.cat([x0, x1, x2, x3], -1)  # [B, H/2, W/2, 4*C]
        x = x.view(B, -1, 4 * C)  # [B, H/2*W/2, 4*C]
        x = self.norm(x)          # [B, H/2*W/2, 4*C]
        x = self.reduction(x)     # [B, H/2*W/2, 4*C]->[B, H/2*W/2, 2*C]
        return x      # [B, H/2*W/2, 2*C]
        # 到这里PatchMerging执行结束, 接下来跳转到2.2.2.(3)小节类BasicLayer

2.2.2.(3)

类BasicLayer：实现CST_Block和Patch_merging
从forward中的return x开始看：到这里其实类BasicLayer也执行结束了，返回的张量shape为 [B, H/2 * W/2, 2 * C]。

    def forward(self, x):   #  (B, H*W/16, 96)
    
        # self.blocks有2个ConvSwinTransformerBlock，即for循环执行 2 次
        for blk in self.blocks:
        
            if self.use_checkpoint:  # False
                x = checkpoint.checkpoint(blk, x)
            else:
                x = blk(x)     # [B, H*W, C]

        
        if self.downsample is not None:   # Patch_Merging
            # downsample=PatchMerging, 接下来跳转到类PatchMerging
            x = self.downsample(x)      # [B, H*W, C]->[B, H/2*W/2, 2*C]
        return x       # [B, H/2*W/2, 2*C]
        # 执行结束, 跳转到2.2.(2)小节 class ConvSwinTransformerSys()

2.2.(2)

类ConvSwinTransformerSys()与2.1小节相同，为简洁起见，在这里只展示要用到的代码段
从forward_features中for layer in self.layers:开始看

    # Encoder and Bottleneck
    def forward_features(self, x):
        # 这里 x 还是在原始batch图片上进行三通道扩展后的数据
        # 转到2.2.1小节 PatchEmbed
        x = self.patch_embed(x)      # (B,3,H,W)->(B, H/4 * W/4, 96)

        # 是否加入绝对位置索引
        if self.ape:       # Flase
            x = x + self.absolute_pos_embed

        x = self.pos_drop(x)  # 减少过拟合
        x_downsample = []

        '''
        self.layer总共有4层：前三层含 CST_Block×2 和 Patch_merging×1，第四层只含有 CST_Block×2;
        这里的 H 和 W 是图像原尺寸的高和宽
        '''# 总共执行4次
        for layer in self.layers:   
            x_downsample.append(x)  # (B, H*W/16, C);(B, H*W/64, 2*C);(B, H*W/256, 4*C);(B, H*W/1024, 8*C)
            
            # 跳转到 BasicLayer，见2.2.2小节
            x = layer(x)      

        '''
        上面layer循环结束后，得到两个参数：
        (1)x_downsample[0]: (B, H*W/16, C);(B, H*W/64, 2*C);(B, H*W/256, 4*C);(B, H*W/1024, 8*C)
           x_downsample[1]: (B, H*W/64, 2*C);(B, H*W/256, 4*C);(B, H*W/1024, 8*C)
           x_downsample[2]: (B, H*W/256, 4*C);(B, H*W/1024, 8*C)
           x_downsample[3]: (B, H*W/1024, 8*C)
        (2)x:(B, H*W/1024, 8*C)
        '''
        x = self.norm(x)  # (B, H*W/1024, 8*C) ：B L C

        return x, x_downsample
        # 到这里类ConvSwinTransformerSys()中的forward_features执行结束，接下来跳转到2.3小节class ConvSwinTransformerSys()的forward部分

2.3. class ConvSwinTransformerSys()

类ConvSwinTransformerSys()与2.1小节相同，在这里只展示要用到的代码段
从forward中x = self.forward_up_features(x, x_downsample)开始看

    def forward(self, x):
        x, x_downsample = self.forward_features(x)   # (B,3,H,W)

        '''
        (1)x_downsample[0]: (B, H*W/16, C)
           x_downsample[1]: (B, H*W/64, 2*C)
           x_downsample[2]: (B, H*W/256, 4*C)
           x_downsample[3]: (B, H*W/1024, 8*C)
        (2)x:(B, H*W/1024, 8*C)
        '''# 跳转到forward_up_features，见下面代码
        x = self.forward_up_features(x, x_downsample) 
        x = self.up_x4(x)
        return x

函数forward_up_features：从for inx, layer_up in enumerate(self.layers_up):开始看

    def forward_up_features(self, x, x_downsample):

        '''
        layers_up共有4层，详细结构在这段代码的后面
        其中，
        PatchExpand：
        '''
        for inx, layer_up in enumerate(self.layers_up):
            if inx == 0:
                # layer_up=PatchExpand, 接下来跳转到2.3.1小节class PatchExpand
                x = layer_up(x)   # (B, H*W/1024, 8*C)
            else:
                x = torch.cat([x, x_downsample[3 - inx]], -1)
                x = self.concat_back_dim[inx](x)
                x = layer_up(x)

        x = self.norm_up(x)  # B L C
        return x

self.layers_up的结构：

ModuleList(
  (0): PatchExpand(
    (up): Sequential(
      (0): ConvTranspose2d(768, 384, kernel_size=(2, 2), stride=(2, 2))
      (1): GELU()
    )
    (norm): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
    (drop): Dropout(p=0.2, inplace=False)
  )
  (1): BasicLayer_up(
    (blocks): ModuleList(
      (0): ConvSwinTransformerBlock(
        dim=384, input_resolution=(14, 14), num_heads=12, window_size=7, shift_size=0, mlp_ratio=4.0
        (norm1): LayerNorm((384,), eps=1e-05, elementwise_affine=True)
        (attn): WindowAttention(
          dim=384, window_size=(7, 7), num_heads=12
          (conv_proj_q): Sequential(
            (0): Conv2d(384, 384, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=384, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((384,), eps=1e-05, elementwise_affine=True)
          )
          (conv_proj_k): Sequential(
            (0): Conv2d(384, 384, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=384, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((384,), eps=1e-05, elementwise_affine=True)
          )
          (conv_proj_v): Sequential(
            (0): Conv2d(384, 384, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=384, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((384,), eps=1e-05, elementwise_affine=True)
          )
          (attn_drop): Dropout(p=0.0, inplace=False)
          (proj): Sequential(
            (0): Conv2d(384, 384, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=384, bias=False)
            (1): GELU()
          )
          (proj_drop): Dropout(p=0.0, inplace=False)
          (softmax): Softmax(dim=-1)
        )
        (drop_path): DropPath()
        (mlp): Mlp(
          (dwconv): Conv2d(384, 384, kernel_size=(7, 7), stride=(1, 1), padding=(3, 3), groups=384)
          (norm): LayerNorm((384,), eps=1e-06, elementwise_affine=True)
          (pwconv1): Conv2d(384, 1536, kernel_size=(1, 1), stride=(1, 1))
          (act): GELU()
          (pwconv2): Conv2d(1536, 384, kernel_size=(1, 1), stride=(1, 1))
          (drop_path): Identity()
        )
      )
      (1): ConvSwinTransformerBlock(
        dim=384, input_resolution=(14, 14), num_heads=12, window_size=7, shift_size=3, mlp_ratio=4.0
        (norm1): LayerNorm((384,), eps=1e-05, elementwise_affine=True)
        (attn): WindowAttention(
          dim=384, window_size=(7, 7), num_heads=12
          (conv_proj_q): Sequential(
            (0): Conv2d(384, 384, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=384, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((384,), eps=1e-05, elementwise_affine=True)
          )
          (conv_proj_k): Sequential(
            (0): Conv2d(384, 384, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=384, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((384,), eps=1e-05, elementwise_affine=True)
          )
          (conv_proj_v): Sequential(
            (0): Conv2d(384, 384, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=384, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((384,), eps=1e-05, elementwise_affine=True)
          )
          (attn_drop): Dropout(p=0.0, inplace=False)
          (proj): Sequential(
            (0): Conv2d(384, 384, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=384, bias=False)
            (1): GELU()
          )
          (proj_drop): Dropout(p=0.0, inplace=False)
          (softmax): Softmax(dim=-1)
        )
        (drop_path): DropPath()
        (mlp): Mlp(
          (dwconv): Conv2d(384, 384, kernel_size=(7, 7), stride=(1, 1), padding=(3, 3), groups=384)
          (norm): LayerNorm((384,), eps=1e-06, elementwise_affine=True)
          (pwconv1): Conv2d(384, 1536, kernel_size=(1, 1), stride=(1, 1))
          (act): GELU()
          (pwconv2): Conv2d(1536, 384, kernel_size=(1, 1), stride=(1, 1))
          (drop_path): Identity()
        )
      )
    )
    (upsample): PatchExpand(
      (up): Sequential(
        (0): ConvTranspose2d(384, 192, kernel_size=(2, 2), stride=(2, 2))
        (1): GELU()
      )
      (norm): LayerNorm((384,), eps=1e-05, elementwise_affine=True)
      (drop): Dropout(p=0.2, inplace=False)
    )
  )
  (2): BasicLayer_up(
    (blocks): ModuleList(
      (0): ConvSwinTransformerBlock(
        dim=192, input_resolution=(28, 28), num_heads=6, window_size=7, shift_size=0, mlp_ratio=4.0
        (norm1): LayerNorm((192,), eps=1e-05, elementwise_affine=True)
        (attn): WindowAttention(
          dim=192, window_size=(7, 7), num_heads=6
          (conv_proj_q): Sequential(
            (0): Conv2d(192, 192, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=192, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((192,), eps=1e-05, elementwise_affine=True)
          )
          (conv_proj_k): Sequential(
            (0): Conv2d(192, 192, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=192, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((192,), eps=1e-05, elementwise_affine=True)
          )
          (conv_proj_v): Sequential(
            (0): Conv2d(192, 192, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=192, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((192,), eps=1e-05, elementwise_affine=True)
          )
          (attn_drop): Dropout(p=0.0, inplace=False)
          (proj): Sequential(
            (0): Conv2d(192, 192, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=192, bias=False)
            (1): GELU()
          )
          (proj_drop): Dropout(p=0.0, inplace=False)
          (softmax): Softmax(dim=-1)
        )
        (drop_path): DropPath()
        (mlp): Mlp(
          (dwconv): Conv2d(192, 192, kernel_size=(7, 7), stride=(1, 1), padding=(3, 3), groups=192)
          (norm): LayerNorm((192,), eps=1e-06, elementwise_affine=True)
          (pwconv1): Conv2d(192, 768, kernel_size=(1, 1), stride=(1, 1))
          (act): GELU()
          (pwconv2): Conv2d(768, 192, kernel_size=(1, 1), stride=(1, 1))
          (drop_path): Identity()
        )
      )
      (1): ConvSwinTransformerBlock(
        dim=192, input_resolution=(28, 28), num_heads=6, window_size=7, shift_size=3, mlp_ratio=4.0
        (norm1): LayerNorm((192,), eps=1e-05, elementwise_affine=True)
        (attn): WindowAttention(
          dim=192, window_size=(7, 7), num_heads=6
          (conv_proj_q): Sequential(
            (0): Conv2d(192, 192, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=192, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((192,), eps=1e-05, elementwise_affine=True)
          )
          (conv_proj_k): Sequential(
            (0): Conv2d(192, 192, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=192, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((192,), eps=1e-05, elementwise_affine=True)
          )
          (conv_proj_v): Sequential(
            (0): Conv2d(192, 192, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=192, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((192,), eps=1e-05, elementwise_affine=True)
          )
          (attn_drop): Dropout(p=0.0, inplace=False)
          (proj): Sequential(
            (0): Conv2d(192, 192, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=192, bias=False)
            (1): GELU()
          )
          (proj_drop): Dropout(p=0.0, inplace=False)
          (softmax): Softmax(dim=-1)
        )
        (drop_path): DropPath()
        (mlp): Mlp(
          (dwconv): Conv2d(192, 192, kernel_size=(7, 7), stride=(1, 1), padding=(3, 3), groups=192)
          (norm): LayerNorm((192,), eps=1e-06, elementwise_affine=True)
          (pwconv1): Conv2d(192, 768, kernel_size=(1, 1), stride=(1, 1))
          (act): GELU()
          (pwconv2): Conv2d(768, 192, kernel_size=(1, 1), stride=(1, 1))
          (drop_path): Identity()
        )
      )
    )
    (upsample): PatchExpand(
      (up): Sequential(
        (0): ConvTranspose2d(192, 96, kernel_size=(2, 2), stride=(2, 2))
        (1): GELU()
      )
      (norm): LayerNorm((192,), eps=1e-05, elementwise_affine=True)
      (drop): Dropout(p=0.2, inplace=False)
    )
  )
  (3): BasicLayer_up(
    (blocks): ModuleList(
      (0): ConvSwinTransformerBlock(
        dim=96, input_resolution=(56, 56), num_heads=3, window_size=7, shift_size=0, mlp_ratio=4.0
        (norm1): LayerNorm((96,), eps=1e-05, elementwise_affine=True)
        (attn): WindowAttention(
          dim=96, window_size=(7, 7), num_heads=3
          (conv_proj_q): Sequential(
            (0): Conv2d(96, 96, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=96, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((96,), eps=1e-05, elementwise_affine=True)
          )
          (conv_proj_k): Sequential(
            (0): Conv2d(96, 96, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=96, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((96,), eps=1e-05, elementwise_affine=True)
          )
          (conv_proj_v): Sequential(
            (0): Conv2d(96, 96, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=96, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((96,), eps=1e-05, elementwise_affine=True)
          )
          (attn_drop): Dropout(p=0.0, inplace=False)
          (proj): Sequential(
            (0): Conv2d(96, 96, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=96, bias=False)
            (1): GELU()
          )
          (proj_drop): Dropout(p=0.0, inplace=False)
          (softmax): Softmax(dim=-1)
        )
        (drop_path): Identity()
        (mlp): Mlp(
          (dwconv): Conv2d(96, 96, kernel_size=(7, 7), stride=(1, 1), padding=(3, 3), groups=96)
          (norm): LayerNorm((96,), eps=1e-06, elementwise_affine=True)
          (pwconv1): Conv2d(96, 384, kernel_size=(1, 1), stride=(1, 1))
          (act): GELU()
          (pwconv2): Conv2d(384, 96, kernel_size=(1, 1), stride=(1, 1))
          (drop_path): Identity()
        )
      )
      (1): ConvSwinTransformerBlock(
        dim=96, input_resolution=(56, 56), num_heads=3, window_size=7, shift_size=3, mlp_ratio=4.0
        (norm1): LayerNorm((96,), eps=1e-05, elementwise_affine=True)
        (attn): WindowAttention(
          dim=96, window_size=(7, 7), num_heads=3
          (conv_proj_q): Sequential(
            (0): Conv2d(96, 96, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=96, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((96,), eps=1e-05, elementwise_affine=True)
          )
          (conv_proj_k): Sequential(
            (0): Conv2d(96, 96, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=96, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((96,), eps=1e-05, elementwise_affine=True)
          )
          (conv_proj_v): Sequential(
            (0): Conv2d(96, 96, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=96, bias=False)
            (1): Rearrange('b c h w -> b (h w) c')
            (2): LayerNorm((96,), eps=1e-05, elementwise_affine=True)
          )
          (attn_drop): Dropout(p=0.0, inplace=False)
          (proj): Sequential(
            (0): Conv2d(96, 96, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), groups=96, bias=False)
            (1): GELU()
          )
          (proj_drop): Dropout(p=0.0, inplace=False)
          (softmax): Softmax(dim=-1)
        )
        (drop_path): DropPath()
        (mlp): Mlp(
          (dwconv): Conv2d(96, 96, kernel_size=(7, 7), stride=(1, 1), padding=(3, 3), groups=96)
          (norm): LayerNorm((96,), eps=1e-06, elementwise_affine=True)
          (pwconv1): Conv2d(96, 384, kernel_size=(1, 1), stride=(1, 1))
          (act): GELU()
          (pwconv2): Conv2d(384, 96, kernel_size=(1, 1), stride=(1, 1))
          (drop_path): Identity()
        )
      )
    )
  )
)

2.3.1. class PatchExpand()

类PatchExpand：
从forward中的H, W = self.input_resolution开始看

class PatchExpand(nn.Module):
    def __init__(self, input_resolution, dim, dim_scale=2, norm_layer=nn.LayerNorm):
        super().__init__()
        self.input_resolution = input_resolution
        self.dim = dim
        self.up = nn.Sequential(nn.ConvTranspose2d(dim, dim // dim_scale, kernel_size=2, stride=2), nn.GELU())
        self.norm = norm_layer(dim)
        self.drop = nn.Dropout(p=0.2)
      

    def forward(self, x):
        """
        x: B, H*W, C → B, H*2*W*2, C/2
        """
        H, W = self.input_resolution   # H/32, W/32
        B, L, C = x.shape              # (B, H*W/1024, 8*C)
        assert L == H * W, "input feature has wrong size"

        x = x.view(B, H, W, C)         # (B, H/32, W/32, 8*C)
        x = self.norm(x)
        x = x.permute(0, 3, 1, 2)  # (B, H/32, W/32, 8*C) -> (B, 8*C, H/32, W/32)

        '''self.up:
         (1)转置卷积ConvTranspose2d(8*C, 4*C, kernel_size=(2,2), stride=(2,2))
         (2)GELU()
         '''
        x = self.up(x)     # (B, 8*C, H/32, W/32)->(B, 4*C, H/16, W/16)

        x = self.drop(x)   # (B, 4*C, H/16, W/16)

        # 代码里的C是x中的8*C
        x = x.permute(0, 2, 3, 1).contiguous().view(B, -1, C // 2)   # (B, H/16 * W/16, 4*C)
        return x      # (B, H/16 * W/16, 4*C)
        # 到这里执行结束，接下来跳转到2.3.(1)

2.3.(1)

函数forward_up_features：
从forward_up_features中for inx, layer_up in enumerate(self.layers_up):开始看

    def forward_up_features(self, x, x_downsample):
        '''
        layers_up共有4层，详细结构在这段代码的后面
        其中，
        PatchExpand：
        '''
        # inx=1的情况
        for inx, layer_up in enumerate(self.layers_up):
            if inx == 0:
                x = layer_up(x)   # (B, H*W/1024, 8*C)
                
            '''inx=1
           (1)x_downsample[0]: (B, H*W/16, C)
              x_downsample[1]: (B, H*W/64, 2*C)
              x_downsample[2]: (B, H*W/256, 4*C)
              x_downsample[3]: (B, H*W/1024, 8*C)
           (2)x:(B, H/16 * W/16, 4*C)
            '''    
            else: 
                x = torch.cat([x, x_downsample[3 - inx]], -1)  # (B, H/16 * W/16, 8*C)

                '''concat_back_dim的结构在该代码下面展示
                concat_back_dim[1]: (B, H/16 * W/16, 8*C)->(B, H/16 * W/16, 4*C)
                '''
                x = self.concat_back_dim[inx](x)

                # 跳转到2.3.2小节的class BasicLayer_up
                x = layer_up(x)

        x = self.norm_up(x)  # B L C
        return x

concat_back_dim结构：

ModuleList(
  (0): Sequential(
    (0): Rearrange('b (h w) c -> b c h w', h=7, w=7)
    (1): Conv2d(1536, 768, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (2): GELU()
    (3): Conv2d(768, 768, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (4): GELU()
    (5): Dropout(p=0.2, inplace=False)
    (6): Rearrange('b c h w -> b (h w) c', h=7, w=7)
  )
  (1): Sequential(
    (0): Rearrange('b (h w) c -> b c h w', h=14, w=14)
    (1): Conv2d(768, 384, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (2): GELU()
    (3): Conv2d(384, 384, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (4): GELU()
    (5): Dropout(p=0.2, inplace=False)
    (6): Rearrange('b c h w -> b (h w) c', h=14, w=14)
  )
  (2): Sequential(
    (0): Rearrange('b (h w) c -> b c h w', h=28, w=28)
    (1): Conv2d(384, 192, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (2): GELU()
    (3): Conv2d(192, 192, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (4): GELU()
    (5): Dropout(p=0.2, inplace=False)
    (6): Rearrange('b c h w -> b (h w) c', h=28, w=28)
  )
  (3): Sequential(
    (0): Rearrange('b (h w) c -> b c h w', h=56, w=56)
    (1): Conv2d(192, 96, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (2): GELU()
    (3): Conv2d(96, 96, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (4): GELU()
    (5): Dropout(p=0.2, inplace=False)
    (6): Rearrange('b c h w -> b (h w) c', h=56, w=56)
  )
)

2.3.2. class BasicLayer_up()

类BasicLayer_up：进入Decoder阶段
从forward中的for blk in self.blocks:开始看

class BasicLayer_up(nn.Module):
    """ A basic Convolutional Swin Transformer layer for one stage.
    Args:
        dim (int): Number of input channels.
        input_resolution (tuple[int]): Input resolution.
        depth (int): Number of blocks.
        num_heads (int): Number of attention heads.
        window_size (int): Local window size.
        mlp_ratio (float): Ratio of mlp hidden dim to embedding dim.
        qkv_bias (bool, optional): If True, add a learnable bias to query, key, value. Default: True
        qk_scale (float | None, optional): Override default qk scale of head_dim ** -0.5 if set.
        drop (float, optional): Dropout rate. Default: 0.0
        attn_drop (float, optional): Attention dropout rate. Default: 0.0
        drop_path (float | tuple[float], optional): Stochastic depth rate. Default: 0.0
        norm_layer (nn.Module, optional): Normalization layer. Default: nn.LayerNorm
        downsample (nn.Module | None, optional): Downsample layer at the end of the layer. Default: None
        use_checkpoint (bool): Whether to use checkpointing to save memory. Default: False.
    """

    def __init__(self, dim, input_resolution, depth, num_heads, window_size,
                 mlp_ratio=4., qkv_bias=True, qk_scale=None, drop=0., attn_drop=0.,
                 drop_path=0., norm_layer=nn.LayerNorm, upsample=None, use_checkpoint=False):

        super().__init__()
        self.dim = dim
        self.input_resolution = input_resolution
        self.depth = depth
        self.use_checkpoint = use_checkpoint

        # build blocks
        self.blocks = nn.ModuleList([
            ConvSwinTransformerBlock(dim=dim, input_resolution=input_resolution,
                                 num_heads=num_heads, window_size=window_size,
                                 shift_size=0 if (i % 2 == 0) else window_size // 2,
                                 mlp_ratio=mlp_ratio,
                                 qkv_bias=qkv_bias, qk_scale=qk_scale,
                                 drop=drop, attn_drop=attn_drop,
                                 drop_path=drop_path[i] if isinstance(drop_path, list) else drop_path,
                                 norm_layer=norm_layer)
            for i in range(depth)])

        # patch merging layer
        if upsample is not None:
            self.upsample = PatchExpand(input_resolution, dim=dim, dim_scale=2, norm_layer=norm_layer)
        else:
            self.upsample = None

    def forward(self, x):   #(B, H/16 * W/16, 4*C)
        for blk in self.blocks:
            if self.use_checkpoint:
                x = checkpoint.checkpoint(blk, x)
            
            '''blk:class ConvSwinTransformerBlock,即CST×2
            这里是解码器阶段的CST,后面跟着一个上采样
            '''    
            else:
                x = blk(x)            # (B, H/16 * W/16, 4*C)

        # upsample = PatchExpand, 跳转到2.3.2.1小节
        if self.upsample is not None:
            x = self.upsample(x)
        return x

2.3.2.1. class PatchExpand()

类PatchExpand：作为解码器的上采样
从forward中的H, W = self.input_resolution开始

class PatchExpand(nn.Module):
    def __init__(self, input_resolution, dim, dim_scale=2, norm_layer=nn.LayerNorm):
        super().__init__()
        self.input_resolution = input_resolution
        self.dim = dim
        self.up = nn.Sequential(nn.ConvTranspose2d(dim, dim // dim_scale, kernel_size=2, stride=2), nn.GELU())
        self.norm = norm_layer(dim)
        self.drop = nn.Dropout(p=0.2)
      

    def forward(self, x):
        """这里的H、W不是图像的原尺寸
        x: B, H*W, C → B, H*2*W*2, C/2
        """
        H, W = self.input_resolution   # H/16, W/16
        B, L, C = x.shape              # B, H/16 * W/16, 4C   # C是原C
        assert L == H * W, "input feature has wrong size"

        x = x.view(B, H, W, C)   # (B, H/16, W/16, 4*C)
        x = self.norm(x)
        x = x.permute(0, 3, 1, 2)  # (B, 4*C, H/16, W/16)

        # 实现上采样
        x = self.up(x)     # (B, 2*C, H/8, W/8)=(16,192,28,28)
        x = self.drop(x)
        x = x.permute(0, 2, 3, 1).contiguous().view(B, -1, C // 2) # (B, H/8 * W/8, 2C)=(16,28*28,192)
        return x   # (B, H/8 * W/8, 2C)
        # 到这里，类BasicLayer_up中的self.upsample执行结束,接下来跳转到2.3.2.(1)节，即回到类BasicLayer_up中

2.3.2.(1)

类BasicLayer_up：Decoder阶段
从forward中的return x开始看，即BasicLayer_up也执行结束了

    def forward(self, x):   #(B, H/16 * W/16, 4*C)
        for blk in self.blocks:
            if self.use_checkpoint:
                x = checkpoint.checkpoint(blk, x)
            
            '''blk:class ConvSwinTransformerBlock,即CST×2
            这里是解码器阶段的CST,后面跟着一个上采样
            '''    
            else:
                x = blk(x)            # (B, H/16 * W/16, 4*C)

        # upsample = PatchExpand, 跳转到2.3.2.1小节
        if self.upsample is not None:
            x = self.upsample(x)
        return x    # (B, H/8 * W/8, 2C)
        # 执行结束，接下来跳转到2.3.(2)小节

2.3.(2)

函数forward_up_features：
从forward_up_features中for inx, layer_up in enumerate(self.layers_up):开始看，到这inx=2

    def forward_up_features(self, x, x_downsample):
        '''
        layers_up共有4层，详细结构在这段代码的后面
        其中，
        PatchExpand：
        '''
        # inx=1的情况
        for inx, layer_up in enumerate(self.layers_up):
            if inx == 0:
                x = layer_up(x)   # (B, H/32 * W/32, 8*C)
                
            '''inx=2
           (1)x_downsample[0]: (B, H*W/16, C)
              x_downsample[1]: (B, H*W/64, 2*C)
              x_downsample[2]: (B, H*W/256, 4*C)
              x_downsample[3]: (B, H*W/1024, 8*C)
           (2)x:(B, H/16 * W/16, 2*C)
            '''    
            else:   # 下面注释中的三个张量shape分别对应inx=1,inx=2,inx=3
                x = torch.cat([x, x_downsample[3 - inx]], -1)  # (B, H/16 * W/16, 8C); (B, H/8 * W/8, 4C);(B, H/4 * W/4, 2C)

                '''concat_back_dim的结构在该代码下面展示
                concat_back_dim[1]: (B, H/16 * W/16, 8*C)->(B, H/16 * W/16, 4*C)
                concat_back_dim[2]: (B, H/8 * W/8, 4*C)->(B, H/8 * W/8, 2*C)
                concat_back_dim[3]: (B, H/4 * W/4, 2*C)->(B, H/4 * W/4, C)
                '''
                x = self.concat_back_dim[inx](x)  # (B, H/8 * W/8, 4*C)->(B, H/8 * W/8, 2*C)

                # 跳转到class BasicLayer_up,再次进行CST×2,操作与上个阶段相同
                x = layer_up(x)       # inx=3后的结果: (B, H/4 * W/4, C),跳出循环

        # (B, H/4 * W/4, C)
        x = self.norm_up(x)  # B L C: (B, H/4 * W/4, C)
        return x
        # 到这里forward_up_features执行结束,接下来跳转到2.4小节

2.4. class ConvSwinTransformerSys()

类ConvSwinTransformerSys()与2.1小节相同，在这里只展示要用到的代码段
从forward中x = self.up_x4(x)开始看

    def forward(self, x):
        x, x_downsample = self.forward_features(x)   # (B,3,H,W)

        '''
        (1)x_downsample[0]: (B, H*W/16, C)
           x_downsample[1]: (B, H*W/64, 2*C)
           x_downsample[2]: (B, H*W/256, 4*C)
           x_downsample[3]: (B, H*W/1024, 8*C)
        (2)x:(B, H*W/1024, 8*C)
        '''# 跳转到forward_up_features，见下面代码
        x = self.forward_up_features(x, x_downsample) 

        # 函数up_x4,接下来跳转到2.4.1小节
        x = self.up_x4(x)  # (B, H/4 * W/4, C)
        return x

2.4.1. def up_x4()

函数up_x4：

    def up_x4(self, x):   # (B, H/4 * W/4, C)
        H, W = self.patches_resolution  # H/4 * W/4
        B, L, C = x.shape               # B, H/4 * W/4, C
        assert L == H * W, "input features has wrong size"

        if self.final_upsample == "expand_first": # True

            # up=FinalPatchExpand_X4,接下来跳转到2.4.1.1小节
            x = self.up(x)
            x = x.view(B, 4 * H, 4 * W, -1)
            x = x.permute(0, 3, 1, 2)  # B,C,H,W
            x = self.output(x)

        return x

2.4.1.1. class FinalPatchExpand_X4()

类FinalPatchExpand_X4：

class FinalPatchExpand_X4(nn.Module):
    def __init__(self, input_resolution, dim, dim_scale=4, norm_layer=nn.LayerNorm):
        super().__init__()
        self.input_resolution = input_resolution
        self.dim = dim
        self.dim_scale = dim_scale
        self.expand = nn.Linear(dim, 16 * dim, bias=False)
        self.output_dim = dim
        self.norm = norm_layer(self.output_dim)

    def forward(self, x):   # (B, H/4 * W/4, C):(16,3136,96)
        """
        x: B, H*W, C → B, H*4*W*4, C
        """
        H, W = self.input_resolution  # H/4 , W/4
        x = self.expand(x)            # (B, H/4 * W/4, C)->(B, H/4 * W/4, 16*C)
        B, L, C = x.shape             # B, H/4 * W/4, 16C
        assert L == H * W, "input feature has wrong size"

        x = x.view(B, H, W, C)        # (B, H/4, W/4, 16C)

        '''rearrange:
        p1=4; p2=4; c=96:即原C
        b h w (p1 p2 c): B H/4 W/4 16C
        b (h p1) (w p2) c: B H W C
        '''
        x = rearrange(x, 'b h w (p1 p2 c)-> b (h p1) (w p2) c', p1=self.dim_scale, p2=self.dim_scale,
                      c=C // (self.dim_scale ** 2))     # (B,H,W,C):(B,224,224,96)
        x = x.view(B, -1, self.output_dim)              # (B,H*W,C):(B,224*224,96)
        x = self.norm(x)

        return x    # (B,H*W,C)
        # 到这里FinalPatchExpand_X4执行结束，接下来跳转到2.4.1.(1)小节 def up_x4()

2.4.1.(1)

函数up_x4：
从x = x.view(B, 4 * H, 4 * W, -1)开始看

    def up_x4(self, x):   # (B, H/4 * W/4, C)
        H, W = self.patches_resolution  # H/4 * W/4
        B, L, C = x.shape               # B, H/4 * W/4, C
        assert L == H * W, "input features has wrong size"

        if self.final_upsample == "expand_first": # True

            # up=FinalPatchExpand_X4,接下来跳转到2.4.1.1小节
            x = self.up(x)                    # (B, H/4 * W/4, C)->(B,H*W,C)

            # 这里的H和W是原尺寸的1/4
            x = x.view(B, 4 * H, 4 * W, -1)   # (B,H,W,C)
            x = x.permute(0, 3, 1, 2)  # (B,C,H,W)
            x = self.output(x)

        return x     # (B,C,H,W)
        # 到这里up_×4结束,然后跳转到class ConvSwinTransformerSys中forward结束部分，如下代码

class ConvSwinTransformerSys结束：
从return x开始，即已经执行结束了

    def forward(self, x):
        x, x_downsample = self.forward_features(x)   # (B,3,H,W)
        x = self.forward_up_features(x, x_downsample)
        x = self.up_x4(x)     #  (B, H/4 * W/4, C)->(B,C,H,W)

        return x  # (B,C,H,W)
        # 类class ConvSwinTransformerSys执行结束,接下来跳转到2.1小节

2.(1) class CS_Unet()

类CS_Unet：
从forward中的return logits开始，即执行结束


    def forward(self, x):
        # 判断图片的channel是否为1, 如果为1就在通道方向上复制3次，使其变成三通道的图片。
        if x.size()[1] == 1: 
            x = x.repeat(1,3,1,1)   # (B,3,H,W)

        # 进入 类ConvSwinTransformerSys,转到2.1小节
        logits = self.CS_Unet(x)     # (B,C,H,W)
        return logits  # (B,C,H,W)
        # 终于,整个model流程完成

最后跳出outputs = model(image_batch)语句！
到这里，model实现完成！！！！

附录. 模型框架图

你可能感兴趣的:(模型代码解读,transformer,python,人工智能)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
ThinkSound V2版 - 一键给无声视频配音，为AI视频生成匹配音效支持50系显卡一键整合包下载昨日之日2006 ai语音音视频人工智能
ThinkSound是阿里通义实验室开源的首个音频生成模型，它能够让AI像专业“音效师”一样，根据视频内容生成高度逼真、与视觉内容完美契合的音频。ThinkSound可直接应用于影视后期制作，为AI生成的视频自动匹配精准的环境噪音与爆炸声效；服务于游戏开发领域，实时生成雨势变化等动态场景的自适应音效；同时可以无障碍视频生产，为视障用户同步生成画面描述与环境音效。今天分享的ThinkSoundV2版
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
Kimi Chat 1.5 与 2.0 架构升级对比 charles666666 人工智能 transformer 深度学习产品经理 chatgpt
1.5版的MoE架构优化KimiChat1.5采用了优化后的MoE架构，其核心在于“专家网络动态路由”。这一机制类似于快递系统智能选择最优路径，能够根据输入数据的特性动态分配计算资源。这种优化显著提升了模型的计算效率，同时降低了硬件资源的浪费。在实际应用中，这意味着开发者可以在相同的硬件配置下处理更复杂的任务，或者在有限的资源下实现更高的性能。2.0的混合专家系统创新点与1.5版相比，KimiCh
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n