Swin Transformer

论文原文:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

官方开源代码:Swin-Transformer

用于语义分割的官方代码为:Swin-Transformer-Semantic-Segmentation
timm库中的代码和这篇博客中的差不多,参考:图解Swin Transformer

一、timm库中的swin transformer

Swin Transformer_第1张图片
它的forward_features和forward函数:
Swin Transformer_第2张图片

  • 输入x先经过x = self.patch_embed(x)Swin Transformer_第3张图片
  • 经过基础块x = self.layers(x)SwinTransformerBlock类BasicLayer类中用到了,而PatchMerging类BasicLayer类也在SwinTransformer类中用到了,所以最后都在SwinTransformer类中的forward中出现了】Swin Transformer_第4张图片

你可能感兴趣的:(深度学习,transformer,深度学习,人工智能)