【文字超分辨率】Improving Text Image Resolution using a Deep Generative Adversarial Network for OCR 阅读笔记

会议:2019 International Conference on Document Analysis and Recognition (ICDAR)

Abstract

为了提高OCR的准确率,本文提出了一种基于GAN的方法。
使用了perceptual loss,包括an adversarial loss, a content loss and an L1 loss.


INTRODUCTION

随着深度学习的发展,许多用于提高识别精度的字符识别模型被提出。但是,除了用于字符识别的模型外,识别精度主要取决于图像分辨率,这在早期工作中很少被研究。
对于相同的识别模型,我们在高分辨率(HR)图像上可以获得比在低分辨率(LR)图像上更好的结果。 对于某些LR图像,仅通过重新设计识别模型很难获得预期的识别精度。 因此,有必要在识别之前使用超分辨率方法进行预处理。

本文提出了一种基于条件生成对抗网络(cGAN)的提高文本图像分辨率的方法,在网络训练中采用了更为复杂的损失函数。

在我们基于cGAN的方法中,有两个子网络,即生成器和判别器,它们是使用基于游戏的方式进行训练的。 训练后,生成器网络用于将LR文本图像映射到HR文本图像。
使用的感知损失函数包括对抗损失内容损失L1损失。对抗损失用于确保生成的SR图像接近于真实的

你可能感兴趣的:(超分辨率,深度学习,计算机视觉)