ICDAR 2019 CROHME + TFD比赛 手写数学表达识别与排版公式检测的竞争

ICDAR 2019 CROHME + TFD比赛

手写数学表达识别与排版公式检测的竞争

 

有用的链接

  • 最后的CROHME数据集
  • 以前的CROHME
  • 在线提交工具
  • 出版物

下载

现在可以下载培训数据集和评估工具了。请不要分发此非官方数据集。CROHME网站即将推出官方版本。

  • (新)要下载任务1和任务2的crohme 2019测试集,请单击此处: 下载CROHME2019针对Task1和Task2的测试集
  • 要下载IOU评估工具,请单击此处: 下载IOU评估工具
  • 要下载任务2中列车和验证集的symLG基础事实,请单击此处: 下载Task2的符号LG文件
  • 要下载任务1中的训练和验证集的OR格式的LG文件(基元可用),请单击此处: 以OR格式下载任务1的LG文件
  • 要下载转换器到符号LG(lg2symlg,mml2symlg,tex2symlg),请单击此处: 下载符号LG转换器
  • 要下载任务1和任务2的crohme 2019数据集包,请单击此处: 下载CROHME2019识别数据集
  • 要下载任务3的crohme 2019数据集包,请单击此处: 下载CROHME2019检测数据集
  • 要下载工具,请单击此处: 下载评估工具

CROHME 2019提交说明

CROHME 2019的结果将由参与者直接在线提交。可以针对每个任务更新提交的结果,并且如果必要,可以多次更新。注意:每个竞赛任务都有一个用于计算竞赛结果的“测试”版本,以及用于错误和健全性检查的“验证”版本。
要阅读更多说明,请单击此处: 说明
提交结果:在线提交工具

数据集

手写的公式

手写公式数据将以两种格式(在线和离线)提供。在线数据将采用与上一次CROHME期间使用的相同的InkML和标签图(.lg)格式。我们在下面描述在线数据; 离线数据将作为灰度图像提供。这些图像将自动从在线数据中呈现。请注意,对于具有5像素填充的方程(MainTask和SubTask-b),具有相同填充(5像素)的隔离符号(SubTask-a)的分辨率为28x28像素,默认值为1000x1000像素。

***离线数据集的分辨率是固定的,但参与者可以随时调整原始图像的大小,作为其系统的预处理步骤。***

手写的培训数据。行程数据由(x,y)坐标列表定义,表示在写入每个笔划时的采样点。将符号划分为符号(段)以及每个符号的真实类别的分组以两种格式提供:InkML和Label Graphs(.lg)。两者都提供表达符号和结构的表示。InkML格式表示Presentation MathML(基于XML标记的表示)中的公式结构,其中标签图文件使用更简单的基于CSV的表示。请注意,MathMl和LG文件都可以用作基本事实,但是LaTex表示并不是官方的基本事实,因为它们没有标准化。

手写测试数据。包含笔划数据,但不包含任何段(笔划组),符号类或已识别的结构(以MathML表示)。对于给定的测试表达式,参与系统必须识别符号位置和标识,然后生成表示表达式结构的文件。参与者可以使用训练数据中给出的CROHME InkML / MathML格式,或者更简单的标签图(CSV)格式,表示输入中笔划的分段,布局和分类(这是由笔划上的标签定义的邻接矩阵)。将一种格式转换为另一种格式的工具是公开的,参与者将获得这些格式的链接(参见dprl)。

我们通过添加先前的测试集(2013年,2012年)扩展了针对CROHME 2019的培训集。这三个将用作本次比赛的列车(上一班火车+测试2012 +测试2013)。2019年的验证集是2014年的先前测试集。最后,我们为主要任务提供了新的测试集。请注意,2016年测试集将用作比较系统与最后竞争结果的参考,不应用于当前系统的培训或验证。SubTask-a和SubTask-b的测试集由2016年测试集制成。您可以在下面下载CROHME2019包。

要下载任务1和任务2的crohme 2019数据集包,请单击此处: 下载CROHME2019识别数据集

文件图片

对于文档图像中的数学检测,我们将利用最近发布的GTDB数据集,其中包括从科学期刊和教科书中收集的文档页面图像。该数据集在知识共享下通过-nc-nd licenese共享,允许以任何媒介或格式复制和重新分发材料,用于非商业目的,前提是不发布衍生产品(没有一个将用于竞赛)。

这些数据集由创建着名的infty系统和数据集的组产生(即Masakazu Suzuki等人)。GTDB-1数据集包含31篇关于PDF文件数学的英文文章。GTDB-2数据集包含16篇文章。我们将提供自动生成固定大小的页面图像的工具。

在这些文章中使用了不同的字体面和数学符号样式。CSV文件中提供的地面实况注释。它们包括文档中的字符位置,标签和公式结构。对于此任务,我们仅考虑公式位置; 基本事实允许比较原始图像或字符级别的检测区域。

要下载任务3的crohme 2019数据集包,请单击此处: 下载CROHME2019检测数据集

评估工具

CROHME组织者提供数学表达式选择,运行测试阶段,评估和可视化的工具:

  • CROHMELib
  • InkML查看器
  • lgEval
  • IOUeval

要下载工具,请单击此处:
下载评估工具 
下载符号LG转换器
下载IOU评估工具

你可能感兴趣的:(深度学习)