CVPR 2023: GeoLayoutLM Geometric Pre-Training for Visual Information Extraction
我们使用以下6个分类标准对本文的研究选题进行分析:1.预训练与微调:预训练:模型在未适应特定任务之前如何从大量的未标记数据中学习通用表示。GeoLayoutLM侧重于“几何预训练”,其涉及设计明确教给模型词语和图像元素之间空间关系的任务。例如,预测相对位置、距离甚至几何变换。这些任务的有效性和它们捕获的几何信息类型是评估的关键方面。微调:这是调整预训练模型以适应特定的VIE任务,例如SER或RE。