2021-11-11

Transformer 的理解
Transformer 解决 RNN效率问题 和传递中的缺陷, RNN是串行,不能进行并行计算

每个transformer 单位 有两个重要子层 self-attention 和 Feed foward 层

你可能感兴趣的:(2021-11-11)