目标检测中,图片中object的坐标

xml文件中显示object的位置信息与图片如何对应的
机器学习深度学习中在目标检测和识别时需要在训练模型时对大量的图片进行学习。在监督训炼中,需要对图进行label,通过软件或者脚本标注出图片中object(物体)的位置信息,然后保存为xml文件,配合图片为模型的训练而服务。那么xml文件中object的位置信息是怎么来的呢。下面就做个介绍:
首先,介绍的图片的pixel(像素),可以通过点击图片右键在属性中查看,下面的图片是355*500,也就是图片的宽为355(x轴)高为500(y轴)。其中,在对图片里面的object进行标记的时候,是假设图片的左上角作为原点也就是这个点的像素坐标为(0,0),右下角是图片宽高最大的点就是(355,500)。
目标检测中,图片中object的坐标_第1张图片
已经知道图片的像素以及坐标的建立是根据图片大小建立的,那就不难的出图片上任何位置的坐标值。如下图,当你标记person和dog时,生成的xml文件会记录你绘制的矩形框的右上角和左下角的坐标值。
目标检测中,图片中object的坐标_第2张图片
通过标记软件标记之后会自动生成xml文件,这里我们只关注图片标记的坐标,生成的xml文件中坐标的形式如下图,左上角的坐标和右下角的坐标值。如下图所示
目标检测中,图片中object的坐标_第3张图片
1:图片的大小
2:包围狗的矩形框的左上角和右下角的坐标
3:包围人的矩形框的左上角和右下角的坐标
软件使用链接和参考博客

你可能感兴趣的:(机器学习,深度学习,目标检测,图片label)