王小凡wxf

pytorch----RetinaFace(models)

自己的一些理解，如有错误请各位大老指出。

models文件

文件目录

models为python文件自带__init__.py。
net.py:

import time
import torch
import torch.nn as nn
import torchvision.models._utils as _utils
import torchvision.models as models
import torch.nn.functional as F
from torch.autograd import Variable

def conv_bn(inp, oup, stride = 1, leaky = 0):
    return nn.Sequential(
        nn.Conv2d(inp, oup, 3, stride, 1, bias=False),
        nn.BatchNorm2d(oup),
        nn.LeakyReLU(negative_slope=leaky, inplace=True)
    )

def conv_bn_no_relu(inp, oup, stride):
    return nn.Sequential(
        nn.Conv2d(inp, oup, 3, stride, 1, bias=False),
        nn.BatchNorm2d(oup),
    )

def conv_bn1X1(inp, oup, stride, leaky=0):
    return nn.Sequential(
        nn.Conv2d(inp, oup, 1, stride, padding=0, bias=False),
        nn.BatchNorm2d(oup),
        nn.LeakyReLU(negative_slope=leaky, inplace=True)
    )

def conv_dw(inp, oup, stride, leaky=0.1):
    return nn.Sequential(
        nn.Conv2d(inp, inp, 3, stride, 1, groups=inp, bias=False),
        nn.BatchNorm2d(inp),
        nn.LeakyReLU(negative_slope= leaky,inplace=True),

        nn.Conv2d(inp, oup, 1, 1, 0, bias=False),
        nn.BatchNorm2d(oup),
        nn.LeakyReLU(negative_slope= leaky,inplace=True),
    )

class SSH(nn.Module):
    def __init__(self, in_channel, out_channel):
        super(SSH, self).__init__()
        assert out_channel % 4 == 0
        leaky = 0
        if (out_channel <= 64):
            leaky = 0.1
        self.conv3X3 = conv_bn_no_relu(in_channel, out_channel//2, stride=1)

        self.conv5X5_1 = conv_bn(in_channel, out_channel//4, stride=1, leaky = leaky)
        self.conv5X5_2 = conv_bn_no_relu(out_channel//4, out_channel//4, stride=1)

        self.conv7X7_2 = conv_bn(out_channel//4, out_channel//4, stride=1, leaky = leaky)
        self.conv7x7_3 = conv_bn_no_relu(out_channel//4, out_channel//4, stride=1)

    def forward(self, input):
        conv3X3 = self.conv3X3(input)

        conv5X5_1 = self.conv5X5_1(input)
        conv5X5 = self.conv5X5_2(conv5X5_1)

        conv7X7_2 = self.conv7X7_2(conv5X5_1)
        conv7X7 = self.conv7x7_3(conv7X7_2)

        out = torch.cat([conv3X3, conv5X5, conv7X7], dim=1)
        out = F.relu(out)
        return out

class FPN(nn.Module):
    def __init__(self,in_channels_list,out_channels):
        super(FPN,self).__init__()
        leaky = 0
        if (out_channels <= 64):
            leaky = 0.1
        self.output1 = conv_bn1X1(in_channels_list[0], out_channels, stride = 1, leaky = leaky)
        self.output2 = conv_bn1X1(in_channels_list[1], out_channels, stride = 1, leaky = leaky)
        self.output3 = conv_bn1X1(in_channels_list[2], out_channels, stride = 1, leaky = leaky)

        self.merge1 = conv_bn(out_channels, out_channels, leaky = leaky)
        self.merge2 = conv_bn(out_channels, out_channels, leaky = leaky)

    def forward(self, input):
        # names = list(input.keys())
        input = list(input.values())

        output1 = self.output1(input[0])
        output2 = self.output2(input[1])
        output3 = self.output3(input[2])

        up3 = F.interpolate(output3, size=[output2.size(2), output2.size(3)], mode="nearest")
        output2 = output2 + up3
        output2 = self.merge2(output2)

        up2 = F.interpolate(output2, size=[output1.size(2), output1.size(3)], mode="nearest")
        output1 = output1 + up2
        output1 = self.merge1(output1)

        out = [output1, output2, output3]
        return out



class MobileNetV1(nn.Module):
    def __init__(self):
        super(MobileNetV1, self).__init__()
        self.stage1 = nn.Sequential(
            conv_bn(3, 8, 2, leaky = 0.1),    # 3
            conv_dw(8, 16, 1),   # 7
            conv_dw(16, 32, 2),  # 11
            conv_dw(32, 32, 1),  # 19
            conv_dw(32, 64, 2),  # 27
            conv_dw(64, 64, 1),  # 43
        )
        self.stage2 = nn.Sequential(
            conv_dw(64, 128, 2),  # 43 + 16 = 59
            conv_dw(128, 128, 1), # 59 + 32 = 91
            conv_dw(128, 128, 1), # 91 + 32 = 123
            conv_dw(128, 128, 1), # 123 + 32 = 155
            conv_dw(128, 128, 1), # 155 + 32 = 187
            conv_dw(128, 128, 1), # 187 + 32 = 219
        )
        self.stage3 = nn.Sequential(
            conv_dw(128, 256, 2), # 219 +3 2 = 241
            conv_dw(256, 256, 1), # 241 + 64 = 301
        )
        self.avg = nn.AdaptiveAvgPool2d((1,1))
        self.fc = nn.Linear(256, 1000)

    def forward(self, x):
        x = self.stage1(x)
        x = self.stage2(x)
        x = self.stage3(x)
        x = self.avg(x)
        # x = self.model(x)
        x = x.view(-1, 256)
        x = self.fc(x)
        return x

retinaface.py:

import torch
import torch.nn as nn
import torchvision.models.detection.backbone_utils as backbone_utils
import torchvision.models._utils as _utils
import torch.nn.functional as F
from collections import OrderedDict

from models.net import MobileNetV1 as MobileNetV1
from models.net import FPN as FPN
from models.net import SSH as SSH



class ClassHead(nn.Module):
    def __init__(self,inchannels=512,num_anchors=3):
        super(ClassHead,self).__init__()
        self.num_anchors = num_anchors
        self.conv1x1 = nn.Conv2d(inchannels,self.num_anchors*2,kernel_size=(1,1),stride=1,padding=0)

    def forward(self,x):
        out = self.conv1x1(x)
        out = out.permute(0,2,3,1).contiguous()
        
        return out.view(out.shape[0], -1, 2)

class BboxHead(nn.Module):
    def __init__(self,inchannels=512,num_anchors=3):
        super(BboxHead,self).__init__()
        self.conv1x1 = nn.Conv2d(inchannels,num_anchors*4,kernel_size=(1,1),stride=1,padding=0)

    def forward(self,x):
        out = self.conv1x1(x)
        out = out.permute(0,2,3,1).contiguous()

        return out.view(out.shape[0], -1, 4)

class LandmarkHead(nn.Module):
    def __init__(self,inchannels=512,num_anchors=3):
        super(LandmarkHead,self).__init__()
        self.conv1x1 = nn.Conv2d(inchannels,num_anchors*10,kernel_size=(1,1),stride=1,padding=0)

    def forward(self,x):
        out = self.conv1x1(x)
        out = out.permute(0,2,3,1).contiguous()

        return out.view(out.shape[0], -1, 10)

class RetinaFace(nn.Module):
    def __init__(self, cfg = None, phase = 'train'):
        """
        :param cfg:  Network related settings.
        :param phase: train or test.
        """
        super(RetinaFace,self).__init__()
        self.phase = phase
        backbone = None
        if cfg['name'] == 'mobilenet0.25':
            backbone = MobileNetV1()
            if cfg['pretrain']:
                checkpoint = torch.load("./weights/mobilenetV1X0.25_pretrain.tar", map_location=torch.device('cpu'))
                from collections import OrderedDict
                new_state_dict = OrderedDict()
                for k, v in checkpoint['state_dict'].items():
                    name = k[7:]  # remove module.
                    new_state_dict[name] = v
                # load params
                backbone.load_state_dict(new_state_dict)
        elif cfg['name'] == 'Resnet50':
            import torchvision.models as models
            backbone = models.resnet50(pretrained=cfg['pretrain'])

        self.body = _utils.IntermediateLayerGetter(backbone, cfg['return_layers'])
        in_channels_stage2 = cfg['in_channel']
        in_channels_list = [
            in_channels_stage2 * 2,
            in_channels_stage2 * 4,
            in_channels_stage2 * 8,
        ]
        out_channels = cfg['out_channel']
        self.fpn = FPN(in_channels_list,out_channels)
        self.ssh1 = SSH(out_channels, out_channels)
        self.ssh2 = SSH(out_channels, out_channels)
        self.ssh3 = SSH(out_channels, out_channels)

        self.ClassHead = self._make_class_head(fpn_num=3, inchannels=cfg['out_channel'])
        self.BboxHead = self._make_bbox_head(fpn_num=3, inchannels=cfg['out_channel'])
        self.LandmarkHead = self._make_landmark_head(fpn_num=3, inchannels=cfg['out_channel'])

    def _make_class_head(self,fpn_num=3,inchannels=64,anchor_num=2):
        classhead = nn.ModuleList()
        for i in range(fpn_num):
            classhead.append(ClassHead(inchannels,anchor_num))
        return classhead
    
    def _make_bbox_head(self,fpn_num=3,inchannels=64,anchor_num=2):
        bboxhead = nn.ModuleList()
        for i in range(fpn_num):
            bboxhead.append(BboxHead(inchannels,anchor_num))
        return bboxhead

    def _make_landmark_head(self,fpn_num=3,inchannels=64,anchor_num=2):
        landmarkhead = nn.ModuleList()
        for i in range(fpn_num):
            landmarkhead.append(LandmarkHead(inchannels,anchor_num))
        return landmarkhead

    def forward(self,inputs):
        out = self.body(inputs)

        # FPN
        fpn = self.fpn(out)

        # SSH
        feature1 = self.ssh1(fpn[0])
        feature2 = self.ssh2(fpn[1])
        feature3 = self.ssh3(fpn[2])
        features = [feature1, feature2, feature3]

        bbox_regressions = torch.cat([self.BboxHead[i](feature) for i, feature in enumerate(features)], dim=1)
        classifications = torch.cat([self.ClassHead[i](feature) for i, feature in enumerate(features)],dim=1)
        ldm_regressions = torch.cat([self.LandmarkHead[i](feature) for i, feature in enumerate(features)], dim=1)

        if self.phase == 'train':
            output = (bbox_regressions, classifications, ldm_regressions)
        else:
            # print(111111)
            output = (bbox_regressions, F.softmax(classifications, dim=-1), ldm_regressions)
        return output

分析：
这个文件主要是建立retinaface神经网络：
net.py主要使用nn.Sequential（一个有序的容器，神经网络模块将按照在传入构造器的顺序依次被添加到计算图中执行，同时以神经网络模块为元素的有序字典也可以作为传入参数。）主要是构建MobileNetV1骨干网络。
nn.Conv2d(self, in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True))
参数：
in_channel:　输入数据的通道数，例RGB图片通道数为3；
out_channel: 输出数据的通道数，这个根据模型调整；
kennel_size: 卷积核大小，可以是int，或tuple；kennel_size=2,意味着卷积大小(2,2)， kennel_size=（2,3），意味着卷积大小（2，3）即非正方形卷积
stride：步长，默认为1，与kennel_size类似，stride=2,意味着步长上下左右扫描皆为2， stride=（2,3），左右扫描步长为2，上下为3；
padding：　零填充
bias被设置False，也就是没有用到偏置
在卷积神经网络的卷积层之后总会添加BatchNorm2d进行数据的归一化处理，这使得数据在进行Relu之前不会因为数据过大而导致网络性能的不稳定，BatchNorm2d()函数数学原理如下：

BatchNorm2d()内部的参数如下：

1.num_features：一般输入参数为batch_sizenum_featuresheight*width，即为其中特征的数量

2.eps：分母中添加的一个值，目的是为了计算的稳定性，默认为：1e-5

3.momentum：一个用于运行过程中均值和方差的一个估计参数（我的理解是一个稳定系数，类似于SGD中的momentum的系数）

4.affine：当设为true时，会给定可以学习的系数矩阵gamma和beta

torch.nn.LeakyReLU(negative_slope=0.01, inplace=False)

对输入的每一个元素运用 $f(x) = max(0, x) + {negative_slope} * min(0, x)$

参数：

negative_slope：控制负斜率的角度，默认等于0.01
inplace-选择是否进行覆盖运算

F.interpolate（）
根据给定 size 或 scale_factor，上采样或下采样输入数据input.

当前支持 temporal, spatial 和 volumetric 输入数据的上采样，其shape 分别为：3-D, 4-D 和 5-D.
输入数据的形式为：mini-batch x channels x [optional depth] x [optional height] x width.

上采样算法有：nearest, linear(3D-only), bilinear(4D-only), trilinear(5D-only).

参数:
- input (Tensor): input tensor
- size (int or Tuple[int] or Tuple[int, int] or Tuple[int, int, int]):输出的 spatial 尺寸.
- scale_factor (float or Tuple[float]): spatial 尺寸的缩放因子.
- mode (string): 上采样算法:nearest, linear, bilinear, trilinear, area. 默认为 nearest.
- align_corners (bool, optional): 如果 align_corners=True，则对齐 input 和 output 的角点像素(corner pixels)，保持在角点像素的值. 只会对 mode=linear, bilinear 和 trilinear 有作用. 默认是 False.

retinaface.py:定义retinaface网络

【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别---第三部分DeepFace库使用介绍之人脸检测模型介绍 Hello_WOAIAI CV 人脸识别目标检测计算机视觉视觉检测图像处理 YOLO opencv
【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别---第三部分DeepFace库使用介绍之人脸检测器介绍前言DeepFace库人脸检测器OpenCV人脸检测器RetinaFace人脸检测器mtcnn人脸检测器sdd人脸检测器dlib人脸检测器mediapipe人脸检测器yolov8人脸检测器人脸识别系列其他文章【人脸识别系列】从知名DeepFace人脸识别库入手详解人脸识别—第一部
基于RetinaFace+Jetson Nano的智能门锁系统——第一篇（烧录系统） Sol-itude Jetson Nano 嵌入式硬件人工智能机器学习 ubuntu linux
文章目录设备1.首先在PC端安装VMware虚拟机和Ubuntu182.安装VMwareTools3.安装SDKManager第二篇开始配置环境：[基于RetinaFace+JetsonNano的智能门锁系统——第二篇（配置环境）](https://blog.csdn.net/qq_42887663/article/details/135336376)设备JetsonNanoMicro-USB-U
基于RetinaFace+Jetson Nano的智能门锁系统——第二篇（配置环境） Sol-itude Jetson Nano 学习信息与通信嵌入式硬件人工智能机器学习
文章目录设备一、安装远程登录终端Xshell1.1下载Xshell1.2新建回话1.3查询ip地址1.4启动连接二、安装远程文件管理WinScp2.1下载WinScp2.2连接JetsonNano2.3连接成功三、安装远程桌面VNCViewer3.1下载VNCViewer3.2在JetsonNano安装VNCViewer3.3设置VINO登录选项3.4将网卡加入VINO服务3.5在JetsonNa
Retinaface实现人脸检测与关键点定位-深度学习学习笔记-1 friklogff python 深度学习深度学习学习笔记
前言本文基于人工智能领域大佬Bubbliiiing睿智的目标检测42——Pytorch搭建Retinaface人脸检测与关键点定位平台原文链接：https://blog.csdn.net/weixin_44791964/article/details/106872072这是是我的学习笔记，记录我复现与拓展的学习过程，万分感谢大佬的开源和无私奉献。本文部分内容来自网上搜集与个人实践。如果任何信息存在
RetinaFace人脸检测模型-Gradio界面设计 friklogff gradio python 深度学习 python 深度学习
前言本文基于人工智能领域大佬Bubbliiiing睿智的目标检测42——Pytorch搭建Retinaface人脸检测与关键点定位平台原文链接：https://blog.csdn.net/weixin_44791964/article/details/106872072这是是我的学习笔记，记录我对开源项目的本地复现，重新封装和功能拓展的学习历程，万分感谢大佬的开源和无私奉献。本文部分内容来自网上搜
极智项目 | 实战retinaface人脸检测极智视界极智项目人脸检测 retinaface pytorch 人工智能深度学习
欢迎关注我，获取我的更多经验分享大家好，我是极智视界，本文介绍实战retinaface人脸检测，并提供完整项目源码。本文介绍的实战retinaface人脸检测项目，提供完整的可以一键训练、测试的项目工程源码，获取方式有两个：(1)我整理的项目资源下载，链接：人脸检测项目-retinaface-pytorch-深度学习文档类资源-CSDN下载(2)加入我的知识星球「极智视界」，星球内有更多项目源码下
[论文翻译]RetinaFace: Single-stage Dense Face Localisation in the Wild 颖惠儿计算机视觉机器学习
论文来源:RetinaFace:Single-stageDenseFaceLocalisationintheWildRetinaFace:Single-stageDenseFaceLocalisationintheWildJiankangDeng*1,2,4JiaGuo*2YuxiangZhou1JinkeYu2IreneKotsia3StefanosZafeiriou1,41ImperialCo
【论文翻译】RetinaFace: Single-stage Dense Face Localisation in the Wild 大数据机器学习实验室机器学习计算机视觉人工智能机器学习
论文题目：RetinaFace:Single-stageDenseFaceLocalisationintheWild论文来源:RetinaFace:Single-stageDenseFaceLocalisationintheWild翻译人：BDML@CQUT实验室RetinaFace:Single-stageDenseFaceLocalisationintheWildJiankangDeng*1,
python 调用onnxruntime 实现单输入多输出 Ceri 模型部署深度学习神经网络 python
做模型部署的时候需要将模型转换为onnx，转换好之后需要将图像传入验证对比原来的pth看输出参数是否一致。我的模型输出有三部分，直接贴出代码了，注释那部分可以实现指定输出部分。importonnxruntimeasortort_session=ort.InferenceSession('./RetinaFace.onnx')#加载模型并且初始化input_name=ort_session.get_
HRNet-RetinaFace备忘 qizhen816
重要参数RetinaFace是一个密集回归的检测模型，关于预选框的配置会影响模型性能默认的RetinaFace将会在FPN之后生成3个尺寸的特征图，在使用HRNet时返回尺寸倍数分别为1/4，1/8，1/16，其他骨干网络为1/8，1/16，1/32，即STEPS对应在每个特征图中每个预选框的尺寸为MIN_SIZES，这是相对于输入原图的尺寸，这些预选框将与gt做IoU计算，根据IoU最大框xyw
聪明的人脸识别4——Pytorch 利用Retinaface+Facenet搭建人脸识别平台 Bubbliiiing 聪明的人脸识别人脸识别 python Retinaface Facenet 人工智能
睿智的目标检测51——Pytorch利用Retinaface+Facenet搭建人脸识别平台学习前言什么是Retinface和Facenet1、Retinface2、Facenet整体实现代码实现流程一、数据库的初始化二、检测图片的处理1、人脸的截取与对齐2、利用Facenet对矫正后的人脸进行编码3、将实时图片中的人脸特征与数据库中的进行比对4、图片绘制使用Retinaface+Facenet进
[OpenCV-dlib]人脸识别功能拓展-通过随机要求头部动作实现活体检测 friklogff 深度学习 python opencv 人工智能计算机视觉 python
引言在现代计算机视觉中，面部检测和姿势识别是一个重要的领域，它在各种应用中发挥着关键作用，包括人脸解锁、表情识别、虚拟现实等。本文将深入探讨一个使用Python编写的应用程序，该应用程序结合了多个库和技术，用于面部检测和姿势识别。文章目录引言面部检测dlib库OpenCV库Retinaface-FaceNet实现人脸识别眨眼检测嘴部动作检测头部姿势检测完整代码结尾与未来展望下一步计划面部检测面部检
Retinaface+FaceNet人脸识别系统-Gradio界面设计 friklogff gradio python 深度学习 python 深度学习
前言本文是我的学习笔记，基于人工智能领域大佬Bubbliiiing聪明的人脸识别4——Pytorch利用Retinaface+Facenet搭建人脸识别平台原文链接：https://blog.csdn.net/weixin_44791964/article/details/111130326本文将详细介绍这个人脸检测与识别系统的功能实现。该系统使用深度学习模型,能够对图片、视频甚至实时摄像头流进行
编译RetinaFace及使用 chencao100 nn python
编译RetinaFace另见RetinaFace-Cpp、Retinaface-caffeAnaconda下运行pipinstallmxnet或pipinstallmxnet-cu101condainstalllibpythonm2w64-toolchain-cmsys2condainstallcython在Python安装路径下找到\Lib\distutils文件夹，创建distutils.cf
人脸检测Retinaface算法原理详解 orangerfun 计算机视觉算法目标检测
论文：RetinaFace:Single-stageDenseFaceLocalisationintheWild代码：officialImplementedbymxnetdetection/retinaface代码：unofficialimplementedbytochRetinaFaces是一个单阶段人脸检测SOTA模型，被CVPR2020所接收。在前一篇文章SSD目标检测算法详解中，我们介绍了
Retinaface 人脸检测及数据集介绍工头阿乐深度学习人工智能视觉检测
人脸检测文章目录人脸检测前言1.先从官网下载图片数据集训练集验证集测试集2.从百度云下载注释数据3.相关数据集前言数据集官方网址：WIDERFACE:AFaceDetectionBenchmark本文所用的开源代码：https://github.com/biubug6/Pytorch_Retinaface数据集介绍WIDERFACE数据集是一个人脸检测基准数据集，其中图像选自公开可用的WIDER数
海思NNIE Hi3559量化部署Mobilefacenet与RetinaFace 孤鸥111 Hi3559A 神经网络深度学习人脸识别
目录海思NNIEHi3559量化部署Mobileface模型环境介绍前言准备工作1、完成RuyiStudio的安装2、下载模型、数据集NNIE量化1、创建工程2、配置cfg文件并生成仿真wk3、中间层结果对比验证4、生成instWK板上运行代码附录海思NNIEHi3559量化部署Retinaface模型环境介绍Retinaface介绍NNIE量化工作cfg文件配置向量对比结果板上运行海思NNIEH
CVPR2021 | 记录SCRFD人脸检测C++工程化(含docker镜像) Tom Hardy c++人工智能 java slam oauth
作者|DefTruth@知乎（已授权）来源|https://zhuanlan.zhihu.com/p/455165568编辑|极市平台导读前段时间写了篇关于SCRFD（吊打了自己的老大哥RetinaFace）模型转换的文章，还有C++工程部分没有补充，所以这篇文章目的之一就是填坑。本文从SCRFD的官仓中，重新导出具体命名输出的onnx文件，比如score_8,score_16,score_32等
人脸检测几种模型在RK3399上推理速度对比 Ceri 模型部署人工智能深度学习
引用：(9条消息)树莓派上几种人脸检测模型对比_熊叫大雄的博客-CSDN博客https://blog.csdn.net/yz2zcx/article/details/105467106首先在可以参考上述博客。可知主流几款人脸检测模型MTCNN，CenterFace，RetinaFace，UltraFace-1MB，LFFD在树莓派上的运行时间。以下为结论：测试图片：Selfie.jpg分辨率：20
【python】Retinaface人脸检测与关键点定位识别数据集标注制作python 路-路-路深度学习 python numpy matplotlib
1.在制作人脸数据集的识别，往往需要制作标注自己的数据集，特征点可以自己定，所以写下这段代码，希望对你有所帮助。2.用labelme做的标记，按照顺序：五个点+一个bbox3.用labelme进行标注。4.下面代码将xml文件转换为Retinaface训练集的label.txt。5.也可以应用于工业特征点检测识别中。fromxml.dom.minidomimportparseimportxml.d
【无标题】泽野千里wmh 有趣的人脸识别考研复试专栏深度学习 python 人工智能
Retinaface预测过程：利用主干特征提取网络MobilenetV1对图片进行初步的特征提取，其中mobilenetv1的核心思想是深度可分离提取网络。利用FPN特征金字塔，对初步特征提取的最后三层进行特征融合。为了进一步加强特征提取，Retinaface使用SSH模块加强感受野，获得三个有效特征层SSH1SSH2SSH3假设输入图像shape为640*640*3那么SSH1的特征层shape
2020-02-27 BlueCCircle
RetinaFace一、论文地址https://arxiv.xilesou.top/pdf/1905.00641.pdf什么是RetinaFace？RetinaFace是一种人脸检测方案，这个方案利用self-supervised和extra-supervised多任务学习的优势，可以实现像素级、多尺度的人脸的检测。二、论文亮点：1.手动标记了WIDERFACE数据库的人脸landmarks(5个
基于AidLux&AI中台，轻松落地动态人脸识别AI应用菜鸟的追梦旅行人工智能计算机视觉深度学习
1.引言该项目来自阿加犀公司举办的AidLux动态人脸识别AI实战训练营，由PauIX老师主讲，课程内容涉及人脸识别原理及Retinaface实战、动态人脸识别整体流程实战、AI视觉软件中台人脸识别实战等。欢迎大家加入训练营，课程链接：https://mp.weixin.qq.com/s/kTezijvdGTqF-eFM1lucoA开始课程之前，需要准备一台安卓系统的手机，手机中安装AidLux软
pytorch的学习之路（一）| 模型的forward方法是如何被调用的张益_杨亚骏 pytorch的学习之路
问题out=net(image)#图像作为输入，经过net做正向传播，得到输出（分类/框/。。。）你有没有一个疑问，上面这行代码是如何调用forward()函数得到结果的？我会贴出源码并做解释解答一步一步跟踪，net(image)到底经历了什么？(以下引用该开源代码做讲解，其中会做适当简化，以达到说明的目的)net的定义net=RetinaFace()RetinaFace类的定义classReti
关于torch开启cudnn导致显存占用过多的问题 jstzwjr
1、问题基于retinaface+insightface封装了一个人脸识别接口，两个模型一起跑的时候显存占用为2.5G，但是将人脸识别模块删除后，显存占用约为3.5G2、解决方法importtorch.backends.cudnnascudnncudnn.benchmark=True将这两句话注释掉，人脸检测+识别模型占用显存约1.5G，但是注释掉识别功能，显存占用为1.3G左右
【疲劳驾驶】Driver Fatigue Detection Based on Residual Channel Attention Network and Head Pose Estimation cv_family_z 疲劳驾驶深度学习计算机视觉神经网络
概述：提出RCAN网络，用于识别眼睛和嘴巴的状态。将眼睛闭合率（PERCLOS）和嘴巴张开程度（POM）用于疲劳检测，并提出PnP方法估计人头姿态辅助疲劳检测。3D人头姿态估计和疲劳检测基于深度学习实现。方法包含三个方面：人脸状态识别，人头姿态估计，和疲劳分析。首先使用Retinaface检测人脸，并标记人脸框、眼睛区域和嘴部区域。然后使用RCAN判断眼睛和嘴部区域的状态。并使用EPnP结合Ret
Libtorch前向推理 damon93 前向推理
Libtorch前向推理前言使用流程我的环境模型转换前向推理代码前言初次使用Libtorch做前向推理，如有不足请各位指正。在使用Libtorch做retinaface算法前向推理时发现不可以使用python训练时保存的是pth文件，报如下错误:terminatecalledafterthrowinganinstanceof'c10::Error'what():[enforcefailatinli
retinaface自定义增强 AI视觉网奇深度学习宝典 python宝典
宽高分别裁剪增强importcv2importnumpyasnpimportrandomfromutils.box_utilsimportmatrix_iofdef_crop(image,boxes,labels,img_size):#随意裁剪，裁剪到最后resize，会有放大效果，不会缩小，小目标检测无帮助height,width,_=image.shapepad_image_flag=True
人脸识别（AI） pzs0221 人工智能人工智能
0、网上资源imalg图像算法的博客1.数据集人脸识别常用开源数据集大全2.开源库RetinaFace、InsightFace、WiderFace、SeetaFace、face++、现在在中国做人脸识别的公司已经越来越多，应用也非常的广泛。其中市场占有率最高的是汉王科技。主要公司的研究方向和现状如下：汉王科技：汉王科技主要是做人脸识别的身份验证，主要用在门禁系统、考勤系统等等。科大讯飞：科大讯飞在
人脸数据集汇总 MS1M-IBUG MS1M-ArcFace MS1M-RetinaFace 等 leung5 人脸数据集
人脸数据集不太好直接找到，实际在github上的insightface里有汇总。说明：MS1M-IBUG：MS1MV1MS1M-ArcFace：MS1MV2MS1M-RetinaFace：MS1MV3以下信息来自于网站：https://github.com/deepinsight/insightface/tree/master/recognition/_datasets_FaceRecogniti
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr

pytorch----RetinaFace(models)

models文件

你可能感兴趣的:(RetinaFace)