arXiv 2021《Transformer in Transformer》论文笔记

目录

  • 简介
  • 动机
  • 方法
  • 实验

简介

本文出自华为诺亚方舟,作者是韩凯。
文章链接
arXiv 2021《Transformer in Transformer》论文笔记_第1张图片

动机

本文动机是,在ViT基础上,编码patch内的pixel之间的结构信息。
arXiv 2021《Transformer in Transformer》论文笔记_第2张图片

方法

使用两个transformer,外transformer负责编码大小为 16 × 16 16 \times 16 16×16的patch之间的关系,内transformer负责编码大小为 4 × 4 4 \times 4 4×4的super-pixel之间的关系。
arXiv 2021《Transformer in Transformer》论文笔记_第3张图片
arXiv 2021《Transformer in Transformer》论文笔记_第4张图片
arXiv 2021《Transformer in Transformer》论文笔记_第5张图片

实验

本文方法的实验结果也很好。
arXiv 2021《Transformer in Transformer》论文笔记_第6张图片
arXiv 2021《Transformer in Transformer》论文笔记_第7张图片
arXiv 2021《Transformer in Transformer》论文笔记_第8张图片
arXiv 2021《Transformer in Transformer》论文笔记_第9张图片
arXiv 2021《Transformer in Transformer》论文笔记_第10张图片

你可能感兴趣的:(#,visual,BERT,Transformer)