论文阅读《LGPMA:Complicated Table Structure Recognition with Local and Global Pyramid Mask Alignment》
摘要表格识别是一项很有挑战的任务。以前的方法从不同粒度的元素(行/列,文本区域)开始处理问题,这从某种程度上有损启发式规则,忽略了空细胞分裂等问题。基于表结构特征,我们发现获取文本区域的对齐boundingbox可以有效地保持不同单元格的整个相关范围。然而,由于视觉歧义,很难准确预测对齐的boundingbox。在这篇文章中,我们通过充分利用局部特征蕴含的文本信息和全局特征蕴含的单元格关系,来获得