transformer与视觉

Transformer 超详细解读,一图胜千言

一张图等于 16x16 个字,计算机视觉也用上 Transformer 了

华为联合北大、悉尼大学对 Visual Transformer 的最新综述

Facebook开源高效图像Transformer,速度、准确率与泛化性能媲美SOTA CNN

图像版GPT3问世,一句话就能变成图!打破语言与视觉界线,AI将更加聪明

Transformer 再下一城,Facebook 等提出多目标跟踪算法 TrackFormer

源代码

vision transformer 源代码

你可能感兴趣的:(深度学习,transformer,视觉)