基于attention的ocr


基于attention的ocr_第1张图片

encoder 部分包括特征提取cnn,attention分布a。

f是cnn提取的特征。

a是特征的attention分布,将a和cnn特征做内积

rnn的输入:

attention分布a的计算方式如下:


为了保留图片特征的位置信息,这个模型将特征的每个坐标做了onehot编码输入模型,ei,ej为坐标x,y的onehot编码:


基于attention的ocr_第2张图片

论文:https://arxiv.org/pdf/1704.03549.pdf

你可能感兴趣的:(基于attention的ocr)