王小凡wxf

pytorch----retinaface(data文件)

data

文件目录

FDDB文件存放fddb数据集：
这里不做说明。
config.py:

# config.py

cfg_mnet = {
    'name': 'mobilenet0.25',
    'min_sizes': [[16, 32], [64, 128], [256, 512]],
    'steps': [8, 16, 32],##步幅与论文中有所不同
    'variance': [0.1, 0.2],##方差
    'clip': False,##梯度消失和梯度爆炸
    'loc_weight': 2.0,
    'gpu_train': True,
    'batch_size': 32,#批大小
    'ngpu': 1,
    'epoch': 250,#单次epoch的迭代次数减少，提高运行速度。（单次epoch=(全部训练样本/batchsize)/iteration=1）
    'decay1': 190,
    'decay2': 220,#衰变
    'image_size': 640,
    'pretrain': True,
    'return_layers': {'stage1': 1, 'stage2': 2, 'stage3': 3},
    'in_channel': 32,#输入通道
    'out_channel': 64#输出通道
}

cfg_re50 = {
    'name': 'Resnet50',
    'min_sizes': [[16, 32], [64, 128], [256, 512]],
    'steps': [8, 16, 32],
    'variance': [0.1, 0.2],
    'clip': False,
    'loc_weight': 2.0,
    'gpu_train': True,
    'batch_size': 24,
    'ngpu': 4,
    'epoch': 100,
    'decay1': 70,
    'decay2': 90,
    'image_size': 840,
    'pretrain': True,
    'return_layers': {'layer2': 1, 'layer3': 2, 'layer4': 3},
    'in_channel': 256,
    'out_channel': 256
}

这个文件是一些网络配置与超参数。
data_augment.py

import cv2
import numpy as np
import random
from utils.box_utils import matrix_iof
"""
训练过程中如果要做到多张图片一起训练需要保持每张图片的大小一致，且与网络的输入层尺寸一致，即训练过程中所有图片的大小均为640×640×3。
"""

def _crop(image, boxes, labels, landm, img_dim):
    height, width, _ = image.shape
    pad_image_flag = True

    for _ in range(250):#最大重复裁剪250次，直到某次裁剪合格
        """
        if random.uniform(0, 1) <= 0.2:
            scale = 1.0
        else:
            scale = random.uniform(0.3, 1.0)
        训练数据集的准备引入了数据增强的策略，对于图片做不同尺度的缩放，图片的基准尺寸用的是网络的输入大小640，首先将输入图片较短的维度缩放成基础尺寸640， 在此基础上根据PRE_SCALES = [0.3, 0.45, 0.6, 0.8, 1.0]再进行缩放，每张图片都会随机匹配一个PRE_SCALE，将图像短边缩放成640 / PRE_SCALE, 即图像的短边尺寸的取值包括[640, 800, 1067, 1422, 2133]
        """
        PRE_SCALES = [0.3, 0.45, 0.6, 0.8, 1.0]
        scale = random.choice(PRE_SCALES)
        short_side = min(width, height)
        w = int(scale * short_side)
        h = w

        if width == w:
            l = 0
        else:
            l = random.randrange(width - w)
        if height == h:
            t = 0
        else:
            t = random.randrange(height - h)
        roi = np.array((l, t, l + w, t + h))#剪裁后的roi

        value = matrix_iof(boxes, roi[np.newaxis])
        flag = (value >= 1)
        if not flag.any():
            continue

        ## 仅保留GT中心在img_n的img_n，若没有，则重新裁剪
        centers = (boxes[:, :2] + boxes[:, 2:]) / 2#求中心
        mask_a = np.logical_and(roi[:2] < centers, centers < roi[2:]).all(axis=1)
        boxes_t = boxes[mask_a].copy()
        labels_t = labels[mask_a].copy()
        landms_t = landm[mask_a].copy()
        landms_t = landms_t.reshape([-1, 5, 2])

        if boxes_t.shape[0] == 0:
            continue
        # 获取img_t的像素信息，注意height是第一维
        image_t = image[roi[1]:roi[3], roi[0]:roi[2]]
        # 对GT的坐标重新限定，主要是因为边界问题
        boxes_t[:, :2] = np.maximum(boxes_t[:, :2], roi[:2])
        boxes_t[:, :2] -= roi[:2]
        boxes_t[:, 2:] = np.minimum(boxes_t[:, 2:], roi[2:])
        boxes_t[:, 2:] -= roi[:2]

        # landm
        landms_t[:, :, :2] = landms_t[:, :, :2] - roi[:2]
        landms_t[:, :, :2] = np.maximum(landms_t[:, :, :2], np.array([0, 0]))
        landms_t[:, :, :2] = np.minimum(landms_t[:, :, :2], roi[2:] - roi[:2])
        landms_t = landms_t.reshape([-1, 10])


	# make sure that the cropped image contains at least one face > 16 pixel at training image scale
        #确保裁剪后的图像在训练图像比例上至少包含一个大于16像素的面
        b_w_t = (boxes_t[:, 2] - boxes_t[:, 0] + 1) / w * img_dim
        b_h_t = (boxes_t[:, 3] - boxes_t[:, 1] + 1) / h * img_dim
        mask_b = np.minimum(b_w_t, b_h_t) > 0.0
        boxes_t = boxes_t[mask_b]
        labels_t = labels_t[mask_b]
        landms_t = landms_t[mask_b]

        if boxes_t.shape[0] == 0:
            continue

        pad_image_flag = False

        return image_t, boxes_t, labels_t, landms_t, pad_image_flag
    return image, boxes, labels, landm, pad_image_flag

# 亮度对比度在RGB空间调整，色相饱和度在HSV空间调整，都是以0.5的概率
def _distort(image):

    def _convert(image, alpha=1, beta=0):
        tmp = image.astype(float) * alpha + beta
        tmp[tmp < 0] = 0
        tmp[tmp > 255] = 255
        image[:] = tmp

    image = image.copy()

    if random.randrange(2):

        #brightness distortion
        if random.randrange(2):
            _convert(image, beta=random.uniform(-32, 32))

        #contrast distortion
        if random.randrange(2):
            _convert(image, alpha=random.uniform(0.5, 1.5))

        image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)

        #saturation distortion
        if random.randrange(2):
            _convert(image[:, :, 1], alpha=random.uniform(0.5, 1.5))

        #hue distortion
        if random.randrange(2):
            tmp = image[:, :, 0].astype(int) + random.randint(-18, 18)
            tmp %= 180
            image[:, :, 0] = tmp

        image = cv2.cvtColor(image, cv2.COLOR_HSV2BGR)

    else:

        #brightness distortion
        if random.randrange(2):
            _convert(image, beta=random.uniform(-32, 32))

        image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)

        #saturation distortion
        if random.randrange(2):
            _convert(image[:, :, 1], alpha=random.uniform(0.5, 1.5))

        #hue distortion
        if random.randrange(2):
            tmp = image[:, :, 0].astype(int) + random.randint(-18, 18)
            tmp %= 180
            image[:, :, 0] = tmp

        image = cv2.cvtColor(image, cv2.COLOR_HSV2BGR)

        #contrast distortion
        if random.randrange(2):
            _convert(image, alpha=random.uniform(0.5, 1.5))

    return image

# 扩展图片，以p的概率，caffe中p=0.5，pytorch中p=0.6
def _expand(image, boxes, fill, p):
    if random.randrange(2):
        return image, boxes

    height, width, depth = image.shape#获得图片信息

    scale = random.uniform(1, p)#将随机生成下一个实数，它在 [x, y] 范围内
    w = int(scale * width)
    h = int(scale * height)
    ## 随机生成左上角的点的坐标
    left = random.randint(0, w - width)
    top = random.randint(0, h - height)
    # 对GT的坐标的调整
    boxes_t = boxes.copy()
    boxes_t[:, :2] += (left, top)
    boxes_t[:, 2:] += (left, top)
    ## 扩展后的图像，和原图重叠部分原像素填充；其他部分填充均值，因为后续需要减去均值，所以等价于0填充，即为黑边
    expand_image = np.empty(
        (h, w, depth),
        dtype=image.dtype)
    expand_image[:, :] = fill
    expand_image[top:top + height, left:left + width] = image
    image = expand_image

    return image, boxes_t

# 以0.5的概率水平翻转,返回处理后的图片和GT信息，landms
def _mirror(image, boxes, landms):
    _, width, _ = image.shape
    if random.randrange(2):
        image = image[:, ::-1]
        boxes = boxes.copy()
        boxes[:, 0::2] = width - boxes[:, 2::-2]

        # landm
        landms = landms.copy()
        landms = landms.reshape([-1, 5, 2])
        landms[:, :, 0] = width - landms[:, :, 0]
        tmp = landms[:, 1, :].copy()
        landms[:, 1, :] = landms[:, 0, :]
        landms[:, 0, :] = tmp
        tmp1 = landms[:, 4, :].copy()
        landms[:, 4, :] = landms[:, 3, :]
        landms[:, 3, :] = tmp1
        landms = landms.reshape([-1, 10])

    return image, boxes, landms


def _pad_to_square(image, rgb_mean, pad_image_flag):
    if not pad_image_flag:
        return image
    height, width, _ = image.shape
    long_side = max(width, height)
    image_t = np.empty((long_side, long_side, 3), dtype=image.dtype)
    image_t[:, :] = rgb_mean
    image_t[0:0 + height, 0:0 + width] = image
    return image_t

# 随机选择一种resize方式，进行resize，并将channel维度调到第一维
def _resize_subtract_mean(image, insize, rgb_mean):
    interp_methods = [cv2.INTER_LINEAR, cv2.INTER_CUBIC, cv2.INTER_AREA, cv2.INTER_NEAREST, cv2.INTER_LANCZOS4]
    interp_method = interp_methods[random.randrange(5)]
    image = cv2.resize(image, (insize, insize), interpolation=interp_method)
    image = image.astype(np.float32)
    image -= rgb_mean
    return image.transpose(2, 0, 1)

# 数据增强类
class preproc(object):

    def __init__(self, img_dim, rgb_means):
        self.img_dim = img_dim
        self.rgb_means = rgb_means

    def __call__(self, image, targets):
        assert targets.shape[0] > 0, "this image does not have gt"
        # 下面的代码段实现拷贝作用，备份。
        boxes = targets[:, :4].copy()
        labels = targets[:, -1].copy()
        landm = targets[:, 4:-1].copy()

        # 数据增强部分
        image_t, boxes_t, labels_t, landm_t, pad_image_flag = _crop(image, boxes, labels, landm, self.img_dim)#剪裁
        image_t = _distort(image_t)# 亮度对比度色相饱和度等属性调整
        image_t = _pad_to_square(image_t,self.rgb_means, pad_image_flag)#裁剪后再扩展
        image_t, boxes_t, landm_t = _mirror(image_t, boxes_t, landm_t)# 水平翻转
        height, width, _ = image_t.shape
        image_t = _resize_subtract_mean(image_t, self.img_dim, self.rgb_means)# aug后的img进行resize并减去均值
        boxes_t[:, 0::2] /= width
        boxes_t[:, 1::2] /= height

        landm_t[:, 0::2] /= width
        landm_t[:, 1::2] /= height

        #np.expand_dims:用于扩展数组的形状
        labels_t = np.expand_dims(labels_t, 1)
        #np.hstack():在水平方向上平铺
        targets_t = np.hstack((boxes_t, landm_t, labels_t))#整合targets信息

        return image_t, targets_t

wider_face.py

import os
import os.path
import sys
import torch
import torch.utils.data as data
import cv2
import numpy as np
#封装数据集
class WiderFaceDetection(data.Dataset):
    def __init__(self, txt_path, preproc=None):
        self.preproc = preproc
        self.imgs_path = []
        self.words = []
        f = open(txt_path,'r')
        lines = f.readlines()
        isFirst = True
        labels = []
        for line in lines:
            line = line.rstrip()
            if line.startswith('#'):
                if isFirst is True:
                    isFirst = False
                else:
                    labels_copy = labels.copy()
                    self.words.append(labels_copy)
                    labels.clear()
                path = line[2:]
                path = txt_path.replace('label.txt','images/') + path
                self.imgs_path.append(path)
            else:
                line = line.split(' ')
                label = [float(x) for x in line]
                labels.append(label)

        self.words.append(labels)

    def __len__(self):
        return len(self.imgs_path)

    def __getitem__(self, index):
        img = cv2.imread(self.imgs_path[index])
        height, width, _ = img.shape

        labels = self.words[index]
        annotations = np.zeros((0, 15))
        if len(labels) == 0:
            return annotations
        for idx, label in enumerate(labels):
            annotation = np.zeros((1, 15))
            # bbox
            annotation[0, 0] = label[0]  # x1
            annotation[0, 1] = label[1]  # y1
            annotation[0, 2] = label[0] + label[2]  # x2
            annotation[0, 3] = label[1] + label[3]  # y2

            # landmarks
            annotation[0, 4] = label[4]    # l0_x
            annotation[0, 5] = label[5]    # l0_y
            annotation[0, 6] = label[7]    # l1_x
            annotation[0, 7] = label[8]    # l1_y
            annotation[0, 8] = label[10]   # l2_x
            annotation[0, 9] = label[11]   # l2_y
            annotation[0, 10] = label[13]  # l3_x
            annotation[0, 11] = label[14]  # l3_y
            annotation[0, 12] = label[16]  # l4_x
            annotation[0, 13] = label[17]  # l4_y
            if (annotation[0, 4]<0):
                annotation[0, 14] = -1
            else:
                annotation[0, 14] = 1

            annotations = np.append(annotations, annotation, axis=0)#为原始array添加一些values
        target = np.array(annotations)
        if self.preproc is not None:
            img, target = self.preproc(img, target)

        return torch.from_numpy(img), target

def detection_collate(batch):
    """Custom collate fn for dealing with batches of images that have a different
    number of associated object annotations (bounding boxes).
    自定义处理在同一个batch,含有不同数量的目标框的情况

    Arguments:
        batch: (tuple) A tuple of tensor images and lists of annotations

    Return:
        A tuple containing:
            1) (tensor) batch of images stacked on their 0 dim
            2) (list of tensors) annotations for a given image are stacked on 0 dim
    """
    targets = []
    imgs = []
    for _, sample in enumerate(batch):
        for _, tup in enumerate(sample):
            if torch.is_tensor(tup):
                imgs.append(tup)
            elif isinstance(tup, type(np.empty(0))):#isinstance() 函数来判断一个对象是否是一个已知的类型
                annos = torch.from_numpy(tup).float()
                targets.append(annos)

    return (torch.stack(imgs, 0), targets)

【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别---第三部分DeepFace库使用介绍之人脸检测模型介绍 Hello_WOAIAI CV 人脸识别目标检测计算机视觉视觉检测图像处理 YOLO opencv
【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别---第三部分DeepFace库使用介绍之人脸检测器介绍前言DeepFace库人脸检测器OpenCV人脸检测器RetinaFace人脸检测器mtcnn人脸检测器sdd人脸检测器dlib人脸检测器mediapipe人脸检测器yolov8人脸检测器人脸识别系列其他文章【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别—第一部
基于RetinaFace+Jetson Nano的智能门锁系统——第一篇（烧录系统） Sol-itude Jetson Nano 嵌入式硬件人工智能机器学习 ubuntu linux
文章目录设备1.首先在PC端安装VMware虚拟机和Ubuntu182.安装VMwareTools3.安装SDKManager第二篇开始配置环境：[基于RetinaFace+JetsonNano的智能门锁系统——第二篇（配置环境）](https://blog.csdn.net/qq_42887663/article/details/135336376)设备JetsonNanoMicro-USB-U
基于RetinaFace+Jetson Nano的智能门锁系统——第二篇（配置环境） Sol-itude Jetson Nano 学习信息与通信嵌入式硬件人工智能机器学习
文章目录设备一、安装远程登录终端Xshell1.1下载Xshell1.2新建回话1.3查询ip地址1.4启动连接二、安装远程文件管理WinScp2.1下载WinScp2.2连接JetsonNano2.3连接成功三、安装远程桌面VNCViewer3.1下载VNCViewer3.2在JetsonNano安装VNCViewer3.3设置VINO登录选项3.4将网卡加入VINO服务3.5在JetsonNa
Retinaface实现人脸检测与关键点定位-深度学习学习笔记-1 friklogff python 深度学习深度学习学习笔记
前言本文基于人工智能领域大佬Bubbliiiing睿智的目标检测42——Pytorch搭建Retinaface人脸检测与关键点定位平台原文链接：https://blog.csdn.net/weixin_44791964/article/details/106872072这是是我的学习笔记，记录我复现与拓展的学习过程，万分感谢大佬的开源和无私奉献。本文部分内容来自网上搜集与个人实践。如果任何信息存在
RetinaFace人脸检测模型-Gradio界面设计 friklogff gradio python 深度学习 python 深度学习
前言本文基于人工智能领域大佬Bubbliiiing睿智的目标检测42——Pytorch搭建Retinaface人脸检测与关键点定位平台原文链接：https://blog.csdn.net/weixin_44791964/article/details/106872072这是是我的学习笔记，记录我对开源项目的本地复现，重新封装和功能拓展的学习历程，万分感谢大佬的开源和无私奉献。本文部分内容来自网上搜
极智项目 | 实战retinaface人脸检测极智视界极智项目人脸检测 retinaface pytorch 人工智能深度学习
欢迎关注我，获取我的更多经验分享大家好，我是极智视界，本文介绍实战retinaface人脸检测，并提供完整项目源码。本文介绍的实战retinaface人脸检测项目，提供完整的可以一键训练、测试的项目工程源码，获取方式有两个：(1)我整理的项目资源下载，链接：人脸检测项目-retinaface-pytorch-深度学习文档类资源-CSDN下载(2)加入我的知识星球「极智视界」，星球内有更多项目源码下
[论文翻译]RetinaFace: Single-stage Dense Face Localisation in the Wild 颖惠儿计算机视觉机器学习
论文来源:RetinaFace:Single-stageDenseFaceLocalisationintheWildRetinaFace:Single-stageDenseFaceLocalisationintheWildJiankangDeng*1,2,4JiaGuo*2YuxiangZhou1JinkeYu2IreneKotsia3StefanosZafeiriou1,41ImperialCo
【论文翻译】RetinaFace: Single-stage Dense Face Localisation in the Wild 大数据机器学习实验室机器学习计算机视觉人工智能机器学习
论文题目：RetinaFace:Single-stageDenseFaceLocalisationintheWild论文来源:RetinaFace:Single-stageDenseFaceLocalisationintheWild翻译人：BDML@CQUT实验室RetinaFace:Single-stageDenseFaceLocalisationintheWildJiankangDeng*1,
python 调用onnxruntime 实现单输入多输出 Ceri 模型部署深度学习神经网络 python
做模型部署的时候需要将模型转换为onnx，转换好之后需要将图像传入验证对比原来的pth看输出参数是否一致。我的模型输出有三部分，直接贴出代码了，注释那部分可以实现指定输出部分。importonnxruntimeasortort_session=ort.InferenceSession('./RetinaFace.onnx')#加载模型并且初始化input_name=ort_session.get_
HRNet-RetinaFace备忘 qizhen816
重要参数RetinaFace是一个密集回归的检测模型，关于预选框的配置会影响模型性能默认的RetinaFace将会在FPN之后生成3个尺寸的特征图，在使用HRNet时返回尺寸倍数分别为1/4，1/8，1/16，其他骨干网络为1/8，1/16，1/32，即STEPS对应在每个特征图中每个预选框的尺寸为MIN_SIZES，这是相对于输入原图的尺寸，这些预选框将与gt做IoU计算，根据IoU最大框xyw
聪明的人脸识别4——Pytorch 利用Retinaface+Facenet搭建人脸识别平台 Bubbliiiing 聪明的人脸识别人脸识别 python Retinaface Facenet 人工智能
睿智的目标检测51——Pytorch利用Retinaface+Facenet搭建人脸识别平台学习前言什么是Retinface和Facenet1、Retinface2、Facenet整体实现代码实现流程一、数据库的初始化二、检测图片的处理1、人脸的截取与对齐2、利用Facenet对矫正后的人脸进行编码3、将实时图片中的人脸特征与数据库中的进行比对4、图片绘制使用Retinaface+Facenet进
[OpenCV-dlib]人脸识别功能拓展-通过随机要求头部动作实现活体检测 friklogff 深度学习 python opencv 人工智能计算机视觉 python
引言在现代计算机视觉中，面部检测和姿势识别是一个重要的领域，它在各种应用中发挥着关键作用，包括人脸解锁、表情识别、虚拟现实等。本文将深入探讨一个使用Python编写的应用程序，该应用程序结合了多个库和技术，用于面部检测和姿势识别。文章目录引言面部检测dlib库OpenCV库Retinaface-FaceNet实现人脸识别眨眼检测嘴部动作检测头部姿势检测完整代码结尾与未来展望下一步计划面部检测面部检
Retinaface+FaceNet人脸识别系统-Gradio界面设计 friklogff gradio python 深度学习 python 深度学习
前言本文是我的学习笔记，基于人工智能领域大佬Bubbliiiing聪明的人脸识别4——Pytorch利用Retinaface+Facenet搭建人脸识别平台原文链接：https://blog.csdn.net/weixin_44791964/article/details/111130326本文将详细介绍这个人脸检测与识别系统的功能实现。该系统使用深度学习模型,能够对图片、视频甚至实时摄像头流进行
编译RetinaFace及使用 chencao100 nn python
编译RetinaFace另见RetinaFace-Cpp、Retinaface-caffeAnaconda下运行pipinstallmxnet或pipinstallmxnet-cu101condainstalllibpythonm2w64-toolchain-cmsys2condainstallcython在Python安装路径下找到\Lib\distutils文件夹，创建distutils.cf
人脸检测Retinaface算法原理详解 orangerfun 计算机视觉算法目标检测
论文：RetinaFace:Single-stageDenseFaceLocalisationintheWild代码：officialImplementedbymxnetdetection/retinaface代码：unofficialimplementedbytochRetinaFaces是一个单阶段人脸检测SOTA模型，被CVPR2020所接收。在前一篇文章SSD目标检测算法详解中，我们介绍了
Retinaface 人脸检测及数据集介绍工头阿乐深度学习人工智能视觉检测
人脸检测文章目录人脸检测前言1.先从官网下载图片数据集训练集验证集测试集2.从百度云下载注释数据3.相关数据集前言数据集官方网址：WIDERFACE:AFaceDetectionBenchmark本文所用的开源代码：https://github.com/biubug6/Pytorch_Retinaface数据集介绍WIDERFACE数据集是一个人脸检测基准数据集，其中图像选自公开可用的WIDER数
海思NNIE Hi3559量化部署Mobilefacenet与RetinaFace 孤鸥111 Hi3559A 神经网络深度学习人脸识别
目录海思NNIEHi3559量化部署Mobileface模型环境介绍前言准备工作1、完成RuyiStudio的安装2、下载模型、数据集NNIE量化1、创建工程2、配置cfg文件并生成仿真wk3、中间层结果对比验证4、生成instWK板上运行代码附录海思NNIEHi3559量化部署Retinaface模型环境介绍Retinaface介绍NNIE量化工作cfg文件配置向量对比结果板上运行海思NNIEH
CVPR2021 | 记录SCRFD人脸检测C++工程化(含docker镜像) Tom Hardy c++人工智能 java slam oauth
作者|DefTruth@知乎（已授权）来源|https://zhuanlan.zhihu.com/p/455165568编辑|极市平台导读前段时间写了篇关于SCRFD（吊打了自己的老大哥RetinaFace）模型转换的文章，还有C++工程部分没有补充，所以这篇文章目的之一就是填坑。本文从SCRFD的官仓中，重新导出具体命名输出的onnx文件，比如score_8,score_16,score_32等
人脸检测几种模型在RK3399上推理速度对比 Ceri 模型部署人工智能深度学习
引用：(9条消息)树莓派上几种人脸检测模型对比_熊叫大雄的博客-CSDN博客https://blog.csdn.net/yz2zcx/article/details/105467106首先在可以参考上述博客。可知主流几款人脸检测模型MTCNN，CenterFace，RetinaFace，UltraFace-1MB，LFFD在树莓派上的运行时间。以下为结论：测试图片：Selfie.jpg分辨率：20
【python】Retinaface人脸检测与关键点定位识别数据集标注制作python 路-路-路深度学习 python numpy matplotlib
1.在制作人脸数据集的识别，往往需要制作标注自己的数据集，特征点可以自己定，所以写下这段代码，希望对你有所帮助。2.用labelme做的标记，按照顺序：五个点+一个bbox3.用labelme进行标注。4.下面代码将xml文件转换为Retinaface训练集的label.txt。5.也可以应用于工业特征点检测识别中。fromxml.dom.minidomimportparseimportxml.d
【无标题】泽野千里wmh 有趣的人脸识别考研复试专栏深度学习 python 人工智能
Retinaface预测过程：利用主干特征提取网络MobilenetV1对图片进行初步的特征提取，其中mobilenetv1的核心思想是深度可分离提取网络。利用FPN特征金字塔，对初步特征提取的最后三层进行特征融合。为了进一步加强特征提取，Retinaface使用SSH模块加强感受野，获得三个有效特征层SSH1SSH2SSH3假设输入图像shape为640*640*3那么SSH1的特征层shape
2020-02-27 BlueCCircle
RetinaFace一、论文地址https://arxiv.xilesou.top/pdf/1905.00641.pdf什么是RetinaFace？RetinaFace是一种人脸检测方案，这个方案利用self-supervised和extra-supervised多任务学习的优势，可以实现像素级、多尺度的人脸的检测。二、论文亮点：1.手动标记了WIDERFACE数据库的人脸landmarks(5个
基于AidLux&AI中台，轻松落地动态人脸识别AI应用菜鸟的追梦旅行人工智能计算机视觉深度学习
1.引言该项目来自阿加犀公司举办的AidLux动态人脸识别AI实战训练营，由PauIX老师主讲，课程内容涉及人脸识别原理及Retinaface实战、动态人脸识别整体流程实战、AI视觉软件中台人脸识别实战等。欢迎大家加入训练营，课程链接：https://mp.weixin.qq.com/s/kTezijvdGTqF-eFM1lucoA开始课程之前，需要准备一台安卓系统的手机，手机中安装AidLux软
pytorch的学习之路（一）| 模型的forward方法是如何被调用的张益_杨亚骏 pytorch的学习之路
问题out=net(image)#图像作为输入，经过net做正向传播，得到输出（分类/框/。。。）你有没有一个疑问，上面这行代码是如何调用forward()函数得到结果的？我会贴出源码并做解释解答一步一步跟踪，net(image)到底经历了什么？(以下引用该开源代码做讲解，其中会做适当简化，以达到说明的目的)net的定义net=RetinaFace()RetinaFace类的定义classReti
关于torch开启cudnn导致显存占用过多的问题 jstzwjr
1、问题基于retinaface+insightface封装了一个人脸识别接口，两个模型一起跑的时候显存占用为2.5G，但是将人脸识别模块删除后，显存占用约为3.5G2、解决方法importtorch.backends.cudnnascudnncudnn.benchmark=True将这两句话注释掉，人脸检测+识别模型占用显存约1.5G，但是注释掉识别功能，显存占用为1.3G左右
【疲劳驾驶】Driver Fatigue Detection Based on Residual Channel Attention Network and Head Pose Estimation cv_family_z 疲劳驾驶深度学习计算机视觉神经网络
概述：提出RCAN网络，用于识别眼睛和嘴巴的状态。将眼睛闭合率（PERCLOS）和嘴巴张开程度（POM）用于疲劳检测，并提出PnP方法估计人头姿态辅助疲劳检测。3D人头姿态估计和疲劳检测基于深度学习实现。方法包含三个方面：人脸状态识别，人头姿态估计，和疲劳分析。首先使用Retinaface检测人脸，并标记人脸框、眼睛区域和嘴部区域。然后使用RCAN判断眼睛和嘴部区域的状态。并使用EPnP结合Ret
Libtorch前向推理 damon93 前向推理
Libtorch前向推理前言使用流程我的环境模型转换前向推理代码前言初次使用Libtorch做前向推理，如有不足请各位指正。在使用Libtorch做retinaface算法前向推理时发现不可以使用python训练时保存的是pth文件，报如下错误:terminatecalledafterthrowinganinstanceof'c10::Error'what():[enforcefailatinli
retinaface自定义增强 AI视觉网奇深度学习宝典 python宝典
宽高分别裁剪增强importcv2importnumpyasnpimportrandomfromutils.box_utilsimportmatrix_iofdef_crop(image,boxes,labels,img_size):#随意裁剪，裁剪到最后resize，会有放大效果，不会缩小，小目标检测无帮助height,width,_=image.shapepad_image_flag=True
人脸识别（AI） pzs0221 人工智能人工智能
0、网上资源imalg图像算法的博客1.数据集人脸识别常用开源数据集大全2.开源库RetinaFace、InsightFace、WiderFace、SeetaFace、face++、现在在中国做人脸识别的公司已经越来越多，应用也非常的广泛。其中市场占有率最高的是汉王科技。主要公司的研究方向和现状如下：汉王科技：汉王科技主要是做人脸识别的身份验证，主要用在门禁系统、考勤系统等等。科大讯飞：科大讯飞在
人脸数据集汇总 MS1M-IBUG MS1M-ArcFace MS1M-RetinaFace 等 leung5 人脸数据集
人脸数据集不太好直接找到，实际在github上的insightface里有汇总。说明：MS1M-IBUG：MS1MV1MS1M-ArcFace：MS1MV2MS1M-RetinaFace：MS1MV3以下信息来自于网站：https://github.com/deepinsight/insightface/tree/master/recognition/_datasets_FaceRecogniti
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

pytorch----retinaface(data文件)

data

你可能感兴趣的:(RetinaFace)