简单有趣的变形金刚网络(VIT) Vision Transformer(可以直接替换自己数据集)-直接放置自己的数据集就能直接跑(网络结构详解+详细注释代码+核心思想讲解)——pytorch实现
论文题目:AnImageIsWorth16x16Words:TransformersForImageRecognitionAtScale原论文下载链接:https://arxiv.org/abs/2010.11929本博客代码可以直接生成训练集和测试集的损失和准确率的折线图,便于写论文使用。Transformer最先应用于在NIP领域,并且取得了巨大的成功,事实上NIP和CV作为深度学习应用最广的