VOC数据集 XML 和 txt标注文本的理解

VOC数据集 XML 和 txt标注文本的理解

以VOC数据集中VOC2007中的000001.jpg图片为例,分析下其对应的Annotations文件夹下的000001.xml文件和labels文件夹下的000001.txt文件

VOC数据集 XML 和 txt标注文本的理解_第1张图片

整幅图片的尺寸为
宽353,高500.

XML文件中:

353*500 是这张000001.jpg图片的宽和高object狗在图片中左上角坐标为(48,240),右下角坐标为(195,371)object人在图片中左上角坐标为(8,12),右下角坐标为(352,498)

在voc.name文件中:

object狗所在的ID为11;
object人所在的ID为14;

txt文件中:

类别一

11 0.341359773371 0.609 0.416430594901 0.262

其中,
11是【 ID】:object狗,

0.341359773371 :【中心点X的比例标注】,353*0.341359773371 = 120.5 pixel, 约等于图像中的直接计算值:(195-48)/2 + 48 = 121.5

0.609 :【中心点Y的比例标注】 500*0.609=304.5, 约等于图像中的直接计算值: (371-240)/2 + 240 = 305.5

0.416430594901: 【BOX宽比例标注】(195-48)/353 = 0.4164

0.262: 【BOX高比例标注】(371-240)/500 = 0.262

类别二

14 0.507082152975 0.508 0.974504249292 0.972

14是 【ID】:object人
后面四个数值代表的意义与计算方式同上,依次是
【中心点X的比例标注】
【中心点Y的比例标注】
【BOX宽比例标注】
【BOX高比例标注】

你可能感兴趣的:(深度学习,VOC数据集)