如何看待Meta(恺明)最新论文ViTDet:如何看待Meta(恺明)论文ViTDet:只用ViT做backbone的检测模型?...
链接:https://www.zhihu.com/question/525167811编辑:深度学习与计算机视觉声明:仅做学术分享,侵删作者:陈小康https://www.zhihu.com/question/525167811/answer/2419797948从文中的Tab.4,Tab.5的结果来看,同样是IN-21K预训练,ViT-base和Swin-base差距还挺大的。这波结果做上去主要