PASCAL VOC 格式

文章目录

  • ImageSets 文件夹
    • Main 文件夹:
    • Segmentation 文件夹:
    • Layout 文件夹:
    • Action 文件夹:
  • Annotations 文件夹
    • 主要标签:
    • 物体标签:
  • SegmentationClass 文件夹
  • SegmentationObject 文件夹

PASCAL VOC(Visual Object Classes)是一个经典的计算机视觉数据集,它对于物体检测、图像分割和分类等任务都提供了标注数据。"PASCAL VOC 格式"是指该数据集中用于存储标注信息的XML格式。

文件夹构成如下:
PASCAL VOC 格式_第1张图片

以下是PASCAL VOC格式的主要组件:

ImageSets 文件夹

ImageSets 文件夹是用于定义数据集的不同子集(例如训练、验证和测试集)的地方。它也用于区分不同的任务,如分类 (Main), 检测 (Main), 分割 (Segmentation) 等。

以下是 ImageSets 中的一些主要内容:
PASCAL VOC 格式_第2张图片

Main 文件夹:

对于每个类别,你会看到四个文件,这些文件定义了每个任务(如训练、验证、测试)的图像子集。

  • classname_train.txt,
  • classname_val.txt,
  • classname_trainval.txt
  • classname_test.txt。

每个文件中的每一行都包含一个图像文件名和一个标记,标记为 1、-1 或 0。
1 表示该图像包含该类别的一个实例。
-1 表示该图像不包含该类别的实例。
0 通常不在这些文件中,但如果出现,它通常意味着“不确定”。

Segmentation 文件夹:

包含用于语义分割任务的图像子集定义。通常,你会看到 train.txt, val.txt, trainval.txt 和可能的 test.txt。

Layout 文件夹:

Layout 文件夹中的标注任务与物体的部分和布局有关。此任务的目的是识别和定位图像中的主要物体的不同部分,例如人的“头”、“手”和“脚”。

在 Layout 文件夹中,你会找到与 Main 文件夹类似的文件,例如 train.txt, val.txt, trainval.txt 和可能的 test.txt。这些文件定义了应该用于布局任务的图像子集。

对于每个图像,标注文件中会包含每个物体部分的边界框,例如人的头或手的位置。

Action 文件夹:

Action 文件夹中的标注任务与图像中人的动作或行为有关。此任务的目标是识别图像中人的特定动作,例如“跑步”、“跳跃”或“坐着”。

在 Action 文件夹中,你会找到与 Main 文件夹类似的文件,但它们是为动作分类任务定义的。每个文件中的每一行都包含一个图像文件名和一个与特定动作相关的标记。标记为 1 表示该图像中的人正在执行该动作,标记为 -1 表示不是。

例如,文件 running_train.txt 可能会列出所有标记为“跑步”动作的训练图像。
在进行实验和训练模型时,这些文件使得轻松地选择和使用数据集的特定子集成为可能。例如,当你使用一个工具或框架来训练一个物体检测模型时,它可能会引用 ImageSets/Main/person_train.txt 来知道哪些图像应该用于“人”类别的训练。

Annotations 文件夹

基本结构:每个图像对应一个XML文件,其中包含有关图像中物体的标注信息。

主要标签:

  • annotation : 标注的根标签。
  • folder : 图像所在的文件夹名称。
  • filename : 图像文件的名称。
  • source : 关于图像来源的信息。
  • size : 包含图像的尺寸信息,例如宽度、高度和深度(通常为3,对应RGB通道)。
  • segmented : 表示是否进行了语义分割。1表示进行了分割,0表示没有。
  • object : 包含单个物体的标注信息。对于图像中的每个物体,都有一个此类标签。

物体标签:

  • name : 物体的类别名称。
  • pose : 物体的姿势(通常是"Unspecified")。
  • truncated : 表示物体是否被截断(部分在图像之外)。1表示被截断,0表示没有。
  • difficult : 表示物体是否难以识别。1表示难以识别,0表示容易识别。
  • bndbox : 包含物体边界框的坐标。这四个坐标是 xmin , ymin , xmax , 和 ymax 。

SegmentationClass 文件夹

语义分割:如果图像进行了语义分割,那么在VOC数据集的SegmentationClass文件夹中会有一个与标注的XML文件相对应的PNG图像,其中每个像素的颜色值对应一个类别。

SegmentationObject 文件夹

实例分割:VOC数据集还提供了实例分割标注,在SegmentationObject文件夹中有与标注的XML文件相对应的PNG图像,其中每个物体都有一个独特的颜色。

你可能感兴趣的:(计算机视觉)