Pytorch深度学习和目标检测实战笔记

原视频链接:PyTorch深度学习目标检测入门实战系列【土堆 x 布尔艺数】

下载VOC数据集

下载地址:http://host.robots.ox.ac.uk/pascal/VOC/

数据集里面都有什么

Pytorch深度学习和目标检测实战笔记_第1张图片

  • Annotations 标注文件夹(包含xml文件,图片的各种信息)
  • ImageSets 图片集合(主要关注Main文件夹的内容)
  • JPEGImages 数据集包含的图片
  • SegmentationClass 语义分割图片
  • SegmentationObject 实例分割图片

需要关注的是ImageSets

打开ImageSets-Main-aeroplane_train.txt
Pytorch深度学习和目标检测实战笔记_第2张图片
可以看到32和33为1,在JPEGImages中,32号的图片
Pytorch深度学习和目标检测实战笔记_第3张图片

打开Annotations

打开Annotations-000032.xml

<object>
		<name>aeroplane</name><图片类别名字>
		<pose>Frontal</pose><拍摄物体的角度,可以看出是在前面拍的>
		<truncated>0</truncated><有无被截断,0是无>
		<difficult>0</difficult><识别出来是否困难,0代表不困难>
		<bndbox>
			<xmin>104</xmin><物体在图片上横坐标最小值>
			<ymin>78</ymin><物体在图片上纵坐标最小值>
			<xmax>375</xmax><物体在图片上横坐标最大值>
			<ymax>183</ymax><物体在图片上纵坐标最大值>
				</bndbox>
</object>

下载COCO数据集

官网:https://cocodataset.org/#home

解读Annotations

Pytorch深度学习和目标检测实战笔记_第4张图片
从第一行开始扫描,是46格像素,到第三行才出现白色的像素,一行一行的扫描
“counts”:[147,3,1…]

未完待续

你可能感兴趣的:(目标检测,深度学习,pytorch)