【Transformer】医学分隔领域的应用与扩展(论文阅读)(一)

声明:仅学习使用~

Transformer学习

对于一个图像来讲,为什么要先对它进行卷积CNN的操作,然后再进行Transformer呢?

Transformer的计算,是跟图像当中有多少个点,位置当中有多少个点,是高度相关的。

比如是256x256个点,每个点呢,都要跟其他的点去计算关系。那这时候复杂度是多少呢,显然是 m 2 m^2 m2

你可能感兴趣的:(【小小的项目,(实战+案例)】,transformer,论文阅读,深度学习,SelfAttention,AxialAttention)