yolov5-face

network

dataloader

_ _ g e t i t e m _ _ ( ) \_\_getitem\_\_() __getitem__()时,对每张图片,对应标注的数据维度为 [ n u m _ o b j e c t s , 14 ] [num\_objects, 14] [num_objects,14],每一行的数据格式为[x, y, w, h, x1, y1, x2, y2, x3, y3, x4, y4, x5, y5]. 前四个为归一化的人脸bbox的中心和宽高,后面10个为归一化的人脸5点关键点的坐标。

读入并进过一系列数据增强后,再将bbox和5点landmark归一化到[0, 1]范围内。

归一化的方式就是x方向除以图像宽度,y方向除以图像高度。

你可能感兴趣的:(torch,深度学习,神经网络,android)