FAIR 何恺明、Piotr、Ross等新作,MAE才是YYDS!仅用ImageNet1K,Top-1准确率87.8%!
关注公众号,发现CV技术之美介绍一篇今天新出的论文。▊写在前面在本文中,作者证明了maskedautoencoders(MAE)是一种可扩展的计算机视觉自监督学习方法。本文的MAE方法很简单:mask输入图像的随机patch,并重建丢失的像素。它基于两个核心设计的。首先,作者开发了一种非对称的编码器-解码器体系结构,其中的编码器只对可见的patch子集(没有mask的token)进行操作,同时还有