西瓜玲子5.20打卡日记

Datawhale 零基础入门CV赛事-Task1 赛题理解

  • 街景字符识别比赛(赛题理解)
    • 1.比赛及数据介绍
    • 2.数据格式介绍
    • 3.解题思路

街景字符识别比赛(赛题理解)

比赛链接:https://tianchi.aliyun.com/competition/entrance/531795/introduction?tdsourcetag=s_pctim_aiomsg

1.比赛及数据介绍

该比赛主要是预测街道字符编码,是一个典型的字符识别问题,采用数据为SVHN。需要下载的数据如下:
下载文件列表及下载地址
下载完成后如下图所示。其中json文件是标注的ground truth,zip文件中为图片数据。.csv中则是提交所需文件的示例。
西瓜玲子5.20打卡日记_第1张图片

2.数据格式介绍

图片数据为.png格式
标签数据则表示为:
“图片名":
{“height”: [第一个字符的高度W1, 第二个字符的左上角坐标X2,…,第n个字符的高度Wn],
“label”: [第一个字符的标签L1, 第二个字符的标签L2,…,第n个字符的标签Ln],
“left”: [第一个字符的左上角坐标Y1, 第二个字符的左上角坐标Y2,…,第n个字符的左上角坐标Yn],
“top”: [第一个字符的左上角坐标X1, 第二个字符的左上角坐标X2,…,第n个字符的左上角坐标Xn],
“width”: [第一个字符的宽度W1, 第二个字符的左上角坐标X2,…,第n个字符的宽度Wn]}

3.解题思路

将每个字符作为目标进行检测,先检测出每个字符,再进行分类,最后通过字符的位置进行从左至右的排序,输出最终图片中包含的字符。

你可能感兴趣的:(深度学习,计算机视觉)