数据集——个人收集标注与使用过的数据集

前言

这是一个我个人在工作和学习中使用过以数据集的一部分,有语义分割,目标识别,人像抠图等几个大类,这只是我用过数据集中的一部分,这些数据集有小一部分是来源自网络,很大一部分都是我自己收集。

一、语义分割

1.书本

这个数据集标注了书本的中线与边缘的数据集,数据是用labelme标注的,数据集有2500张图像,是用来训练文档扫描的边缘检测与中线识别的。之前用ENet训练过,效果还蛮可以的。数据集标注样例如下:

 

2.皮肤

2.1 皱纹和眼袋(164张图像)

数据集标注了皱纹和眼袋的位置,数据集有转换好的mask图,可用于医美的皮肤皱纹检测与眼袋检测分割。训练方法和效果可参考我之前的博客:

基于语义分割实现人脸图像的皱纹检测定位与分割_皱纹检测算法_知来者逆的博客-CSDN博客

数据集——个人收集标注与使用过的数据集_第1张图片

2.2 痘痘、红斑、雀斑(221张)

数据集 包含了痘痘、红斑、雀斑这几种标注,可用来训练实实例分割,每个目标都有唯一的ID。

数据集——个人收集标注与使用过的数据集_第2张图片

痘痘

数据集——个人收集标注与使用过的数据集_第3张图片 红斑

数据集——个人收集标注与使用过的数据集_第4张图片 雀斑

2.3 毛孔

 毛孔的数据集里面只有毛孔,只能用于训练语义分割。

数据集——个人收集标注与使用过的数据集_第5张图片

数据集——个人收集标注与使用过的数据集_第6张图片

3. 拍照文档清晰二值

数据集是用于文档拍照清晰二值化,在某些APP里,这个功能叫省墨模式,样本是用来训练该滤镜的,训练的效果可以参与我之前的博客:

使用深度学习解决拍照文档复杂背景二值化问题_背景较深的图像怎么二值化_知来者逆的博客-CSDN博客

 数据集——个人收集标注与使用过的数据集_第7张图片

4.拍照文档阴影检测分割

数据集是用labelme标注的,标注了拍照文档的阴影部分,用来做拍照文档扫描的阴影检测去祛除用的,总共有1000张图像。

数据集——个人收集标注与使用过的数据集_第8张图片

二、目标识别

1.智慧城市

1.1 手机

标注的是手机,数据格式是xml和转过的yolo的txt格式,有2000张。

1.2 安全帽

 数据标注了戴安全的人头和不带安全帽的人头,数据格式是xml和转过的yolo的txt格式,总共有7800张图像。训练效果可参考我之前的博客:

安全帽佩戴检测——从数据处理、训练数据到模型部署落地(带有数据集、训练代码,可使用GPU的C++模型部署代码)_c++ ipc检测安全帽_知来者逆的博客-CSDN博客

1.3 烟火

 数据标注了明火和起烟两个标签,数据格式是xml和转过的yolo的txt格式,总共有7600张图像。训练效果可参考我之前的博客:

基于Yolov5的烟火检测——模型训练与C++实现部署_yolov5 c++部署_知来者逆的博客-CSDN博客

数据集——个人收集标注与使用过的数据集_第9张图片

1.4 抽烟

 数据标注了人头和抽烟两个标签,数据格式是xml和转过的yolo的txt格式,总共有4800张图像。

1.5 文档

文档的目标检测检测了两个目标,双开的书与单张的文档。标注工具是labelImg,数据格式是xml和yolo的txt。

 单张的文档

数据集——个人收集标注与使用过的数据集_第10张图片

双张的书本 

1.6 身份证

数据集包含了身份证正面和身份背面,身份证正面标注了正面和头像,身份证背面标注了背面和国徽,总共四个目标。标注工具是labelImg,数据格式是xml和yolo的txt。训练效果可以参考我之后的博客:

证件拍照扫描——基于C++与深度神经网络实现证件识别扫描并1比1还原证件到A4纸上_知来者逆的博客-CSDN博客

 

1.7 银行卡

数据集包含了银行正面和银行背面,银联logo,IC芯片,总共四个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

数据集——个人收集标注与使用过的数据集_第11张图片

数据集——个人收集标注与使用过的数据集_第12张图片

1.8 护照

护照标注了护照翻开的第一页和人物头像,总共两个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

数据集——个人收集标注与使用过的数据集_第13张图片

1.9 港澳通行证

港澳通行证标注了护正面、头像、背面,总共三个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

1.10 居住证

居住证标注了护正面、头像,总共两个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

数据集——个人收集标注与使用过的数据集_第14张图片

1.11 驾驶证

驾驶证标注了护正面、头像,总共两个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

数据集——个人收集标注与使用过的数据集_第15张图片

1.12 社保卡

社保卡标注了头像,银联logo,IC卡,社保卡正面,社保卡反面,国徽总共五个目标。标注工具是labelImg,数据格式是xml和yolo的txt。

 数据集——个人收集标注与使用过的数据集_第16张图片

三、抠图

1.人像抠图

人像抠图有半身抠图,大概5万张左右,格式是mask图,这个是之前用于智能证件照。

数据集——个人收集标注与使用过的数据集_第17张图片

待续更新................................

你可能感兴趣的:(数据集,人像抠图,语义分割,目标识别,文字识别)