DERT原理

DERT原理_第1张图片

 DERT原理_第2张图片

DERT原理_第3张图片 decoder并行同时进行。

DERT原理_第4张图片

DERT原理_第5张图片 

decoder没有mask,不需要遮盖后面的q,同时输入输出。

DERT原理_第6张图片 

 匈牙利匹配,损失最小的方法作为目标框,剩下为背景。

 

你可能感兴趣的:(transformer,transformer)