地址:https://github.com/theAIGuysCode/OIDv4_ToolKit
(1)Github下载到本地
(2)cd到OIDv4_Toolkit-master 安装requirements相关的包
pip install -r requirements.txt
OpenImage 网站:https://storage.googleapis.com/openimages/web/index.html
搜索相关类别(fiftyone下载数据集那一篇有记录)
例:指定下载图像数量(100),图像类别名称(Glove Helmet这两类),数据集种类(train)
python main.py downloader --classes Helmet Glove --type_csv train --limit 100
这样下载下来Glove和Helmet是分别保存在OID\Dataset\train底下两个不同文件夹(Glove一个,Helmet一个)
#用空格替代单图像类别名称中间的空格,
例:下载Bell _Pepper
python main.py downloader --classes Bell_pepper --type_csv train --limit 100
如果想把两类图片保存在同一个文件夹下
python main.py downloader --classes Helmet Glove --type_csv test --limit 100 --multiclasses 1
目前下来的数据集是有csv和txt格式的
用类别名称作为类,也没有对坐标进行归一化,这里的坐标顺序是xmin,xmax,ymin,ymax
但是yolov5-master的txt是用0,1,……表示类别的,后面分别是中心点的xy坐标和宽w,高h
在根目录有一个classes.txt,把类别修改成自己的,比如我是Helmet Glove
直接运行里面的convert_annotations.py,就可以修改成yolov5-master需要的txt格式。
修改好的txt标签文件保存在images里面,和图片放在一块。