机器学习笔记 - Ocr识别中的文本检测EAST网络概述

一、文本检测

        文本检测简单来说就是找到图像中可以出现文本的区域。例如,请参见下图,其中在检测到的文本周围绘制了绿色边框。

机器学习笔记 - Ocr识别中的文本检测EAST网络概述_第1张图片

        在进行文本检测时,你可能会遇到两种情况

  • 具有结构化文本的图像:这是指具有干净/均匀背景和常规字体的图像。文本大多密集,行结构正确,文本颜色均匀。

机器学习笔记 - Ocr识别中的文本检测EAST网络概述_第2张图片

  • 带有非结构化文本的图像:这是指复杂背景上带有稀疏文本的图像。文本可以具有不同的颜色、大小、字体和方向,并且可以出现在图像中的任何位置。对这些图像执行文本检测称为场景文本检测。

机器学习笔记 - Ocr识别中的文本检测EAST网络概述_第3张图片

        上述两种情况中哪一种看起来更具挑战性。显然,由于如上所述的各种复杂性,答案将是场景文本检测。这就是为什么这是计算机视觉领域的一个活跃研究课题。

1、文本检测器(EAST)

        在文本检测领域引入深度学习之前,大多数文本分割方法很难在具有挑战性的场景中执行。传统方法使用手动设计的特

你可能感兴趣的:(深度学习从入门到精通,OCR,深度学习,文本检测,神经网络,文本检测模型,NMS)