目录
前言
一、计算机视觉四大任务?
二、常用标注软件
1.vott
1.2.入门基本使用
2.labelImg
2.1.下载与安装
2.2.入门基本使用
3.labelme
3.1.下载与安装
3.2.入门基本使用
图像标注常用来制造自己的数据集,方便进行学习,比较常用的图像标注软件有Vott、labelImg、labelme,labelTool、sloth等等
1.图像分类(Image Classification):
是什么?对给定的图片或视频判断其中包括了什么类别的目标。
2.目标定位(Object Location):
在哪里?定位出目标的位置
3.目标检测(Object Detection):
判断图片中目标是什么,分别在哪里?定位出目标的位置,用矩形框框住,判断是什么。
4.语义分割(Semantic Segmentation):
通常意义下的目标分割就是语义分割,需要区分到图中的像素点,而不仅仅是使用矩形框框住目标。判断每一个像素属于那个目标物或者这场景。
1.1下载与安装
下载:
1.官方Github
2.realse提供的编译好的可执行文件
1.2.1.准备工作:
1.2.2.新建项目
需要填写的信息:
1.2.3.connection
connection就是数据的路径,Vott中提供了三种分类:Azure Blob Storage、Bin Image Search、Local File System,一般选择Local File System即可。然后填写名称,提供文件路径即可。
connection在左侧菜单栏可以直接进入
1.2.4.标注bbox
选择左侧的图像/视频帧,使用矩形画框工具画框,然后选择对用的标签即可,在选取/删除选框、设置/删除标签后,会制动保存。除了使用矩形框之外,还可使用多边形选点来进行标记。
画框时可以采用内置的SSD模型自动获取bbox(左侧菜单栏的帽子图标),精度不是很高,但是也可以节省力气。
1.2.5.导出标注结果
labelImg是可视化的图像标注工具,可以标注图像中的目标,生成XML、JSON、txt格式的文件
conda install pyqt=5
pyrcc5 -o libs/resources.py resources.qrc
python labelImg.py
打开后的界面如下所示:
选中待标注图像的文件夹,在图像上点击w或者Create RectBox创建矩形框,选中区域,添加标签,保存即可。
在左侧菜单栏文件保存格式可以选择Yolo、CreatXML、PascalVoc三种,分别对应txt、XML、JSON三种数据格式。另外,在顶部的菜单栏选择view,然后勾选Auto Save Mode,可以在每张图像添加标签后自动保存,不再需要自己手动保存。
conda create --name=labelme python=3.6
source activate labelme
pip install pyqt5
pip install labelme
conda install pillow=4.0.0
执行完这几个语句后,在该窗口输入labelme即可打开该工具,打开界面如下:
labelme的具体使用与上述的labelImg类似,就不再赘述。不过与labelImg相比,labelme除了矩形框之外,还可以使用圆形框,多边形框,点,线等来对图像进行标注,用于目标检测、图像分割等任务;可以对图像进行flag形式的标注,用于图像分类和清理任务。各个功能的在GitHub有具体实现的用法。
与labelImg相比,labelme标注工具更加丰富,更加灵活,可以适用于更多任务。