Tom Hardy

工程详细记录：超准确人脸检测(带关键点)YOLO5Face C++

点击上方“计算机视觉工坊”，选择“星标”

干货第一时间送达

作者丨DefTruth

编辑丨极市平台

导读

本文主要记录一下YOLO5Face C++工程相关的问题，并且简单介绍下如何使用 Lite.AI.ToolKit C++工具箱来跑直接YOLO5Face人脸检测(带关键点) , 这些案例包含了ONNXRuntime C++、MNN、TNN和NCNN版本。

1. YOLO5Face简介

Github：https://github.com/deepcam-cn/yolov5-face

ArXiv 2021：https://arxiv.org/abs/2105.1293

C++ 实现：https://github.com/DefTruth/YOLO5Face.lite.ai.toolkit

YOLO5Face是深圳神目科技&LinkSprite Technologies开源的一个新SOTA的人脸检测器（带关键点），基于YOLOv5，并且对YOLOv5的骨干网络进行的改造，使得新的模型更加适合用于人脸检测的任务。并且在 YOLOv5 网络中加了一个预测5个关键点 regression head，采用Wing loss进行作为损失函数。从论文中放出的实验结果看YOLO5Face的平均精度（mAP）和速度方面的性能都非常优秀。在模型精度和速度方面，论文中给出了和当前SOTA算法的详细比较，包括比较新的SCRFD(CVPR 2021)、RetinaFace(CVPR 2020)等等。

另外由于YOLO5Face采用 Stem 块结构取代 YOLOv5 的 Focus 层，作者认为这样增加了网络的泛化能力，并降低了计算的复杂性。对于替换Focus层带来精度的提升，论文也给出了一些消融实验的对比，还是提了一些点。另外就是，去掉Focus的骚操作后，C++工程的难度也降低了一些，起码在用NCNN的时候，不用再额外捏个YoloV5FocusLayer自定义层进去了。

需要了解YOLO5Face相关的算法细节的同学可以看看原论文，或者阅读：

深圳神目科技《YOLO5Face》：人脸检测在 WiderFace 实现 SOTA

https://zhuanlan.zhihu.com/p/375966269

本文主要记录一下YOLO5Face C++工程相关的问题，并且简单介绍下如何使用 Lite.AI.ToolKit C++工具箱来跑直接YOLO5Face人脸检测(带关键点)(https://github.com/DefTruth/lite.ai.toolkit) , 这些案例包含了ONNXRuntime C++、MNN、TNN和NCNN版本。

2. C++版本源码

YOLO5Face C++ 版本的源码包含ONNXRuntime、MNN、TNN和NCNN四个版本，源码可以在 lite.ai.toolki（thttps://github.com/DefTruth/lite.ai.toolkit) 工具箱中找到。本文主要介绍如何基于 lite.ai.toolkit工具箱，直接使用YOLO5Face来跑人脸检测。需要说明的是，本文是基于MacOS下编译的 liblite.ai.toolkit.v0.1.0.dylib(https://github.com/DefTruth/yolox.lite.ai.toolkit/blob/main/lite.ai.toolkit/lib) 来实现的，对于使用MacOS的用户，可以直接下载本项目包含的liblite.ai.toolkit.v0.1.0动态库和其他依赖库进行使用。而非MacOS用户，则需要从lite.ai.toolkit中下载源码进行编译。lite.ai.toolkit c++工具箱目前包含80+流行的开源模型，就不多介绍了，只是平时顺手捏的，整合了自己学习过程中接触到的一些模型，感兴趣的同学可以去看看。

yolo5face.cpp（https://github.com/DefTruth/lite.ai.toolkit/blob/main/lite/ort/cv/yolo5face.cpp)
yolo5face.h (https://github.com/DefTruth/lite.ai.toolkit/blob/main/lite/ort/cv/yolo5face.h)
mnn_yolo5face.cpp (https://github.com/DefTruth/lite.ai.toolkit/blob/main/lite/mnn/cv/mnn_yolo5face.cpp)
mnn_yolo5face.h (https://github.com/DefTruth/lite.ai.toolkit/blob/main/lite/mnn/cv/mnn_yolo5faceh)
tnn_yolo5face.cpp (https://github.com/DefTruth/lite.ai.toolkit/blob/main/lite/tnn/cv/tnn_yolo5face.cpp)
tnn_yolo5face.h (https://github.com/DefTruth/lite.ai.toolkit/blob/main/lite/tnn/cv/tnn_yolo5face.h)
ncnn_yolo5face.cpp (https://github.com/DefTruth/lite.ai.toolkit/blob/main/lite/ncnn/cv/ncnn_yolo5face.cpp)
ncnn_yolo5face.h (https://github.com/DefTruth/lite.ai.toolkit/blob/main/lite/ncnn/cv/ncnn_yolo5face.h)

ONNXRuntime C++、MNN、TNN和NCNN版本的推理实现均已测试通过，欢迎白嫖~ 本文章的案例代码和工具箱仓库地址为:

代码	描述	GitHub
YOLO5Face.lite.ai.toolkit	YOLO5Face C++ 测试用例代码，包含ONNXRuntime、NCNN、MNN、TNN版本	https://github.com/DefTruth/YOLO5Face.lite.ai.toolkit
Lite.AI.ToolKit	A lite C++ toolkit of awesome AI models.（一个开箱即用的C++ AI模型工具箱，emmm，平时学一些新算法的时候顺手捏的，目前包含80+流行的开源模型。不知不觉已经将近800 ⭐️ star啦，欢迎大家来点star⭐️、提issue呀~）	https://github.com/DefTruth/lite.ai.toolkit

如果觉得有用，不妨给个Star⭐️支持一下吧~

3. 模型文件

3.1 ONNX模型文件

可以从我提供的链接下载 Baidu Drive（https://pan.baidu.com/s/1elUGcx7CZkkjEoYhTMwTRQ) code: 8gin, 也可以从本仓库下载。

Class	Pretrained ONNX Files	Rename or Converted From (Repo)	Size
lite::cv::face::detect::YOLO5Face	yolov5face-blazeface-640x640.onnx	YOLO5Face（https://github.com/deepcam-cn/yolov5-face）	3.4Mb
lite::cv::face::detect::YOLO5Face	yolov5face-l-640x640.onnx	YOLO5Face	181Mb
lite::cv::face::detect::YOLO5Face	yolov5face-m-640x640.onnx	YOLO5Face	83Mb
lite::cv::face::detect::YOLO5Face	yolov5face-n-0.5-320x320.onnx	YOLO5Face	2.5Mb
lite::cv::face::detect::YOLO5Face	yolov5face-n-0.5-640x640.onnx	YOLO5Face	4.6Mb
lite::cv::face::detect::YOLO5Face	yolov5face-n-640x640.onnx	YOLO5Face	9.5Mb
lite::cv::face::detect::YOLO5Face	yolov5face-s-640x640.onnx	YOLO5Face	30Mb

3.2 MNN模型文件

MNN模型文件下载地址，Baidu Drive(https://pan.baidu.com/s/1KyO-bCYUv6qPq2M8BH_Okg) code: 9v63, 也可以从本仓库下载。

Class	Pretrained MNN Files	Rename or Converted From (Repo)	Size
lite::mnn::cv::face::detect::YOLO5Face	yolov5face-blazeface-640x640.mnn	YOLO5Face	3.4Mb
lite::mnn::cv::face::detect::YOLO5Face	yolov5face-l-640x640.mnn	YOLO5Face	181Mb
lite::mnn::cv::face::detect::YOLO5Face	yolov5face-m-640x640.mnn	YOLO5Face	83Mb
lite::mnn::cv::face::detect::YOLO5Face	yolov5face-n-0.5-320x320.mnn	YOLO5Face	2.5Mb
lite::mnn::cv::face::detect::YOLO5Face	yolov5face-n-0.5-640x640.mnn	YOLO5Face	4.6Mb
lite::mnn::cv::face::detect::YOLO5Face	yolov5face-n-640x640.mnn	YOLO5Face	9.5Mb
lite::mnn::cv::face::detect::YOLO5Face	yolov5face-s-640x640.mnn	YOLO5Face	30Mb

3.3 TNN模型文件

TNN模型文件下载地址，Baidu Drive(https://pan.baidu.com/s/1lvM2YKyUbEc5HKVtqITpcw) code: 6o6k, 也可以从本仓库下载。

Class	Pretrained TNN Files	Rename or Converted From (Repo)	Size
lite::tnn::cv::face::detect::YOLO5Face	yolov5face-blazeface-640x640.opt.tnnproto&tnnmodel	YOLO5Face	3.4Mb
lite::tnn::cv::face::detect::YOLO5Face	yolov5face-l-640x640.opt.tnnproto&tnnmodel	YOLO5Face	181Mb
lite::tnn::cv::face::detect::YOLO5Face	yolov5face-m-640x640.opt.tnnproto&tnnmodel	YOLO5Face	83Mb
lite::tnn::cv::face::detect::YOLO5Face	yolov5face-n-0.5-320x320.opt.tnnproto&tnnmodel	YOLO5Face	2.5Mb
lite::tnn::cv::face::detect::YOLO5Face	yolov5face-n-0.5-640x640.opt.tnnproto&tnnmodel	YOLO5Face	4.6Mb
lite::tnn::cv::face::detect::YOLO5Face	yolov5face-n-640x640.opt.tnnproto&tnnmodel	YOLO5Face	9.5Mb
lite::tnn::cv::face::detect::YOLO5Face	yolov5face-s-640x640.opt.tnnproto&tnnmodel	YOLO5Face	30Mb

3.4 NCNN模型文件

NCNN模型文件下载地址，Baidu Drive(https://pan.baidu.com/s/1hlnqyNsFbMseGFWscgVhgQ) code: sc7f, 也可以从本仓库下载。

Class	Pretrained NCNN Files	Rename or Converted From (Repo)	Size
lite::ncnn::cv::face::detect::YOLO5Face	yolov5face-m-640x640.opt.param&bin	YOLO5Face	80Mb
lite::ncnn::cv::face::detect::YOLO5Face	yolov5face-n-0.5-320x320.opt.param&bin	YOLO5Face	1.7Mb
lite::ncnn::cv::face::detect::YOLO5Face	yolov5face-n-0.5-640x640.opt.param&bin	YOLO5Face	1.7Mb
lite::ncnn::cv::face::detect::YOLO5Face	yolov5face-n-640x640.opt.param&bin	YOLO5Face	6.5Mb
lite::ncnn::cv::face::detect::YOLO5Face	yolov5face-s-640x640.opt.param&bin	YOLO5Face	27Mb

4. 接口文档

在lite.ai.toolkit中，YOLO5Face的实现类为：

class LITE_EXPORTS lite::cv::face::detect::YOLO5Face;
class LITE_EXPORTS lite::mnn::cv::face::detect::YOLO5Face;
class LITE_EXPORTS lite::tnn::cv::face::detect::YOLO5Face;
class LITE_EXPORTS lite::ncnn::cv::face::detect::YOLO5Face;

该类型目前包含1公共接口detect用于进行目标检测。

public:
    /**
     * @param mat cv::Mat BGR format
     * @param detected_boxes_kps vector of BoxfWithLandmarks to catch detected boxes and landmarks.
     * @param score_threshold default 0.25f, only keep the result which >= score_threshold.
     * @param iou_threshold default 0.45f, iou threshold for NMS.
     * @param topk default 400, maximum output boxes after NMS.
     */
    void detect(const cv::Mat &mat, std::vector &detected_boxes_kps,
                float score_threshold = 0.25f, float iou_threshold = 0.45f,
                unsigned int topk = 400);

detect接口的输入参数说明：

mat: cv::Mat类型，BGR格式。
detected_boxes_kps: BoxfWithLandmarks向量，包含被检测到的框box(Boxf)，box中包含x1,y1,x2,y2,label,score等成员; 以及landmarks(landmarks)人脸关键点(5个)，其中包含了points，代表关键点，是一个cv::point2f向量(vector);
score_threshold：分类得分（质量得分）阈值，默认0.25，小于该阈值的框将被丢弃。
iou_threshold：NMS中的iou阈值，默认0.45。
topk：默认400，只保留前k个检测到的结果。

5. 使用案例

这里测试使用的是yolov5face-n-640x640.onnx(yolov5n-face)nano版本的模型，你可以尝试使用其他版本的模型。

5.1 ONNXRuntime版本

#include "lite/lite.h"

static void test_default()
{
    std::string onnx_path = "../hub/onnx/cv/yolov5face-n-640x640.onnx"; // yolov5n-face
    std::string test_img_path = "../resources/4.jpg";
    std::string save_img_path = "../logs/4.jpg";
    
    auto *yolov5face = new lite::cv::face::detect::YOLO5Face(onnx_path);
    
    std::vector detected_boxes;
    cv::Mat img_bgr = cv::imread(test_img_path);
    yolov5face->detect(img_bgr, detected_boxes);
    
    lite::utils::draw_boxes_with_landmarks_inplace(img_bgr, detected_boxes);
    
    cv::imwrite(save_img_path, img_bgr);
    
    std::cout << "Default Version Done! Detected Face Num: " << detected_boxes.size() << std::endl;
    
    delete yolov5face;
}

5.2 MNN版本

#include "lite/lite.h"

static void test_mnn()
{
#ifdef ENABLE_MNN
    std::string mnn_path = "../hub/mnn/cv/yolov5face-n-640x640.mnn"; // yolov5n-face
    std::string test_img_path = "../resources/12.jpg";
    std::string save_img_path = "../logs/12.jpg";
    
    auto *yolov5face = new lite::mnn::cv::face::detect::YOLO5Face(mnn_path);
    
    std::vector detected_boxes;
    cv::Mat img_bgr = cv::imread(test_img_path);
    yolov5face->detect(img_bgr, detected_boxes);
    
    lite::utils::draw_boxes_with_landmarks_inplace(img_bgr, detected_boxes);
    
    cv::imwrite(save_img_path, img_bgr);
    
    std::cout << "MNN Version Done! Detected Face Num: " << detected_boxes.size() << std::endl;
    
    delete yolov5face;
#endif
}

5.3 TNN版本

#include "lite/lite.h"

static void test_tnn()
{
#ifdef ENABLE_TNN
    std::string proto_path = "../hub/tnn/cv/yolov5face-n-640x640.opt.tnnproto"; // yolov5n-face
    std::string model_path = "../hub/tnn/cv/yolov5face-n-640x640.opt.tnnmodel";
    std::string test_img_path = "../resources/9.jpg";
    std::string save_img_path = "../logs/9.jpg";
    
    auto *yolov5face = new lite::tnn::cv::face::detect::YOLO5Face(proto_path, model_path);
    
    std::vector detected_boxes;
    cv::Mat img_bgr = cv::imread(test_img_path);
    yolov5face->detect(img_bgr, detected_boxes);
    
    lite::utils::draw_boxes_with_landmarks_inplace(img_bgr, detected_boxes);
    
    cv::imwrite(save_img_path, img_bgr);
    
    std::cout << "TNN Version Done! Detected Face Num: " << detected_boxes.size() << std::endl;
    
    delete yolov5face;
#endif
}

5.4 NCNN版本

#include "lite/lite.h"

static void test_ncnn()
{
#ifdef ENABLE_NCNN
    std::string param_path = "../hub/ncnn/cv/yolov5face-n-640x640.opt.param"; // yolov5n-face
    std::string bin_path = "../hub/ncnn/cv/yolov5face-n-640x640.opt.bin";
    std::string test_img_path = "../resources/1.jpg";
    std::string save_img_path = "../logs/1.jpg";
    
    auto *yolov5face = new lite::ncnn::cv::face::detect::YOLO5Face(param_path, bin_path, 1, 640, 640);
    
    std::vector detected_boxes;
    cv::Mat img_bgr = cv::imread(test_img_path);
    yolov5face->detect(img_bgr, detected_boxes);
    
    lite::utils::draw_boxes_with_landmarks_inplace(img_bgr, detected_boxes);
    
    cv::imwrite(save_img_path, img_bgr);
    
    std::cout << "NCNN Version Done! Detected Face Num: " << detected_boxes.size() << std::endl;
    
    delete yolov5face;
#endif
}

输出结果为:

虽然是nano版本的模型，但结果看起来还是非常准确的啊！还自带了5个人脸关键点，可以用来做人脸对齐，也是比较方便~

6. 编译运行

在MacOS下可以直接编译运行本项目，无需下载其他依赖库。其他系统则需要从lite.ai.toolkit 中下载源码先编译lite.ai.toolkit.v0.1.0动态库。

git clone --depth=1 https://github.com/DefTruth/YOLO5Face.lite.ai.toolkit.git
cd YOLO5Face.lite.ai.toolkit 
sh ./build.sh

CMakeLists.txt设置

cmake_minimum_required(VERSION 3.17)
project(YOLO5Face.lite.ai.toolkit)

set(CMAKE_CXX_STANDARD 11)

# setting up lite.ai.toolkit
set(LITE_AI_DIR ${CMAKE_SOURCE_DIR}/lite.ai.toolkit)
set(LITE_AI_INCLUDE_DIR ${LITE_AI_DIR}/include)
set(LITE_AI_LIBRARY_DIR ${LITE_AI_DIR}/lib)
include_directories(${LITE_AI_INCLUDE_DIR})
link_directories(${LITE_AI_LIBRARY_DIR})

set(OpenCV_LIBS
        opencv_highgui
        opencv_core
        opencv_imgcodecs
        opencv_imgproc
        opencv_video
        opencv_videoio
        )
# add your executable
set(EXECUTABLE_OUTPUT_PATH ${CMAKE_SOURCE_DIR}/examples/build)

add_executable(lite_yolo5face examples/test_lite_yolo5face.cpp)
target_link_libraries(lite_yolo5face
        lite.ai.toolkit
        onnxruntime
        MNN  # need, if built lite.ai.toolkit with ENABLE_MNN=ON,  default OFF
        ncnn # need, if built lite.ai.toolkit with ENABLE_NCNN=ON, default OFF
        TNN  # need, if built lite.ai.toolkit with ENABLE_TNN=ON,  default OFF
        ${OpenCV_LIBS})  # link lite.ai.toolkit & other libs.

building && testing information:

[ 50%] Building CXX object CMakeFiles/lite_yolo5face.dir/examples/test_lite_yolo5face.cpp.o
[100%] Linking CXX executable lite_yolo5face
[100%] Built target lite_yolo5face
Testing Start ...
LITEORT_DEBUG LogId: ../hub/onnx/cv/yolov5face-n-640x640.onnx
=============== Input-Dims ==============
input_node_dims: 1
input_node_dims: 3
input_node_dims: 640
input_node_dims: 640
=============== Output-Dims ==============
Output: 0 Name: output Dim: 0 :1
Output: 0 Name: output Dim: 1 :25200
Output: 0 Name: output Dim: 2 :16
========================================
generate_bboxes_kps num: 2824
Default Version Done! Detected Face Num: 326
LITEMNN_DEBUG LogId: ../hub/mnn/cv/yolov5face-n-640x640.mnn
=============== Input-Dims ==============
        **Tensor shape**: 1, 3, 640, 640, 
Dimension Type: (CAFFE/PyTorch/ONNX)NCHW
=============== Output-Dims ==============
getSessionOutputAll done!
Output: output:         **Tensor shape**: 1, 25200, 16, 
========================================
generate_bboxes_kps num: 71
MNN Version Done! Detected Face Num: 5
LITENCNN_DEBUG LogId: ../hub/ncnn/cv/yolov5face-n-640x640.opt.param
generate_bboxes_kps num: 34
NCNN Version Done! Detected Face Num: 2
LITETNN_DEBUG LogId: ../hub/tnn/cv/yolov5face-n-640x640.opt.tnnproto
=============== Input-Dims ==============
input: [1 3 640 640 ]
Input Data Format: NCHW
=============== Output-Dims ==============
output: [1 25200 16 ]
========================================
generate_bboxes_kps num: 98
TNN Version Done! Detected Face Num: 7
Testing Successful !

其中一个测试结果为：

7. 模型转换过程记录

ok，到这里，nano版本模型的效果大家都看到了，还是很不错的，640x640的input size下很多小人脸都检测出来了。C++版本的推理结果对齐也基本没有问题。那么这小节就主要记录一下，各种类型（ONNX/MNN/TNN/NCNN）的模型文件转换问题。毕竟这可以说是比较重要的一步了，因此也想和大家简单分享下。个人知识面有限，以下表述有不足之处，欢迎各位大佬指出哈~

7.1 Detect模块推理源码分析(pytorch)

def forward(self, x):
        # x = x.copy()  # for profiling
        z = []  # inference output
        if self.export_cat:
            for i in range(self.nl):
                x[i] = self.m[i](x[i])  # conv
                bs, _, ny, nx = x[i].shape  # YOLOv5: x(bs,255,20,20) to x(bs,3,20,20,85), YOLO5Face: x(bs,3,20,20,4+1+10+1=16)
                x[i] = x[i].view(bs, self.na, self.no, ny, nx).permute(0, 1, 3, 4, 2).contiguous()
                # x[i] = x[i].view(bs, 3, 16, -1).permute(0, 1, 3, 2).contiguous()  # e.g (b,3,20x20,16) for NCNN

                # if self.grid[i].shape[2:4] != x[i].shape[2:4]:
                #     # self.grid[i] = self._make_grid(nx, ny).to(x[i].device)
                #     self.grid[i], self.anchor_grid[i] = self._make_grid_new(nx, ny, i)  # 这是YOLO5Face原来的代码
                self.grid[i], self.anchor_grid[i] = self._make_grid_new(nx, ny, i) 
                # 这是我修改的代码，可以去掉jit的Tracing(TracerWarning:)
                y = torch.full_like(x[i], 0)
                y = y + torch.cat((x[i][:, :, :, :, 0:5].sigmoid(),
                                   torch.cat((x[i][:, :, :, :, 5:15], x[i][:, :, :, :, 15:15 + self.nc].sigmoid()), 4)),
                                  4)
                box_xy = (y[:, :, :, :, 0:2] * 2. - 0.5 + self.grid[i].to(x[i].device)) * self.stride[i]  # xy
                box_wh = (y[:, :, :, :, 2:4] * 2) ** 2 * self.anchor_grid[i]  # wh
                # box_conf = torch.cat((box_xy, torch.cat((box_wh, y[:, :, :, :, 4:5]), 4)), 4)
                landm1 = y[:, :, :, :, 5:7] * self.anchor_grid[i] + self.grid[i].to(x[i].device) * self.stride[i]  #  x1 y1
                landm2 = y[:, :, :, :, 7:9] * self.anchor_grid[i] + self.grid[i].to(x[i].device) * self.stride[i]  #  x2 y2
                landm3 = y[:, :, :, :, 9:11] * self.anchor_grid[i] + self.grid[i].to(x[i].device) * self.stride[i]  # x3 y3
                landm4 = y[:, :, :, :, 11:13] * self.anchor_grid[i] + self.grid[i].to(x[i].device) * self.stride[i]  # x4 y4
                landm5 = y[:, :, :, :, 13:15] * self.anchor_grid[i] + self.grid[i].to(x[i].device) * self.stride[i]  # x5 y5
                # landm = torch.cat((landm1, torch.cat((landm2, torch.cat((landm3, torch.cat((landm4, landm5), 4)), 4)), 4)), 4)
                # y = torch.cat((box_conf, torch.cat((landm, y[:, :, :, :, 15:15+self.nc]), 4)), 4)
                y = torch.cat([box_xy, box_wh, y[:, :, :, :, 4:5], landm1, landm2, landm3, landm4, landm5,
                               y[:, :, :, :, 15:15 + self.nc]], -1)

                z.append(y.view(bs, -1, self.no))  # (bs,-1,16)
            return torch.cat(z, 1)  # (bs,?,16)
            # return x # for NCNN

我们主要来看看Detect模块的forward函数。可以看到，新增的5个关键点，是在YOLOv5原来输出的基础上进行添加的，其余的和YOLOv5的输出一致。不同的是，原来的YOLOv5是一个多实体目标检测，nc=80(coco)，no=nc+5=85，前4个是预测bbox偏移量，第5个位置是前景背景的分类概率，后80个值是80个具体类别的分类概率。

而在YOLO5Face中，由于新增了5个关键点，并且只有一个实际的类别（是否为人脸），所以它的nc=1(face)，no=nc+5+10=16，前4个（索引0-3）是预测人脸框bbox偏移量，第5个（索引4）位置是前景背景的分类概率，中间10个（索引5-14）是5个关键点（x,y）的偏移量，最后1个值（索引15）是人脸类别的分类概率。

另外，关于偏移量坐标的计算方式，我们可以看到，YOLO5Face的bbox的计算方式和YOLOv5保持一致，但是关键点的偏移计算方式却是不同的，因为关键点只有一个点（x,y），没有宽和高，所以无法复用YOLOv5中的计算方式。在YOLO5Face中，关键点的偏移量是相对于步长stride和anchor的宽高而言的，是一个相对值，而不是绝对值，计算方式如下：

landmark_x_offset = (landmark_x - x_anchor * stride) / anchor_w

landmark_y_offset = (landmark_y - y_anchor * stride) / anchor_h

逆运算就是:

landmark_x = landmark_x_offset * anchor_w + x_anchor * stride

landmark_y = landmark_y_offset * anchor_h + y_anchor * stride

另外，我们可以看到，YOLO5Face这里，有一个新函数_make_grid_new，YOLOv5中用的是_make_grid。这个函数其实蛮重要的，我讲一讲我的理解。新函数中_make_grid_new中有2个新特点：

重新根据当前的anchors生成了对应的anchor_grid；
显示指定了na(num anchors)的值，而不是使用1；

@staticmethod
    def _make_grid(nx=20, ny=20):
        yv, xv = torch.meshgrid([torch.arange(ny), torch.arange(nx)])
        return torch.stack((xv, yv), 2).view((1, 1, ny, nx, 2)).float()  # 原来的函数

    def _make_grid_new(self, nx=20, ny=20, i=0):
        d = self.anchors[i].device
        if '1.10.0' in torch.__version__:  # torch>=1.10.0 meshgrid workaround for torch>=0.7 compatibility
            yv, xv = torch.meshgrid([torch.arange(ny).to(d), torch.arange(nx).to(d)], indexing='ij')
        else:
            yv, xv = torch.meshgrid([torch.arange(ny).to(d), torch.arange(nx).to(d)])
        grid = torch.stack((xv, yv), 2).expand((1, self.na, ny, nx, 2)).float()
        anchor_grid = (self.anchors[i].clone() * self.stride[i]).view((1, self.na, 1, 1, 2)).expand(
            (1, self.na, ny, nx, 2)).float()
        return grid, anchor_grid  # 新函数

为什么要这样做呢？我们先来看看anchor_grid和anchor的初始代码。

self.grid = [torch.zeros(1)] * self.nl  # init grid
        a = torch.tensor(anchors).float().view(self.nl, -1, 2)
        self.register_buffer('anchors', a)  # shape(nl,na,2)
        self.register_buffer('anchor_grid', a.clone().view(self.nl, 1, -1, 1, 1, 2))  # shape(nl,1,na,1,1,2)

在Detect模块的init中，使用了register_buffer来注册anchors和anchor_grid，这样这两个变量，就会变成能被torch识别的变量，在调用torch.save保存模型的时候，这两个变量的值，就会被作为模型的一部分，一并保存下来。（插个话，之前看到有同学问，为什么在使用YOLOv5时，直接加载预训练好的pth权重就好了呢？没看到哪里有代码使用了yolov5xxx.yaml的配置文件啊？也没看到在哪里设置了anchor啊？其实就是这原因，因为人家在save的时候已经把所有的东西都保存下来了。因此在推理的时候就可以脱离yolov5xxx.yaml配置文件了。）那么，在真正用的时候，可能需要根据情况设置新的anchors，比如YOLOv5保存的anchors并不适合与人脸检测（如果使用YOLOv5的权重作为预训练权重）又或者你纯粹只是想换新的anchors做实验，那么就要将权重文件中保存的旧anchors设置为新的适合于人脸检测的anchors，同时，由于anchor_grid是依赖于anchors的，所以也要重新生成。至于na设置成固定值，emmm...，我猜只是为了不过度依赖torch的broadcast特性吧，毕竟这个特性在工程落地的时候可能也会有坑（只是可能哦）。

# if self.grid[i].shape[2:4] != x[i].shape[2:4]:
                #     # self.grid[i] = self._make_grid(nx, ny).to(x[i].device)
                #     self.grid[i], self.anchor_grid[i] = self._make_grid_new(nx, ny, i)  # 这是YOLO5Face原来的代码
                self.grid[i], self.anchor_grid[i] = self._make_grid_new(nx, ny, i) 
                # 这是我修改的代码，可以去掉jit的Tracing(TracerWarning:)

对于YOLO5Face的Detect中forward的源码，我做了一个无关紧要的小改动。原来的代码不影响ONNX的导出，但会出现Tracing(TracerWarning:)，self.grid[i].shape[2:4] != x[i].shape[2:4] 的结果可能为True也可能为False，不是一个确定值，所以会出现Tracing(TracerWarning:)。所以解决问题的方法就是，去掉这个判断，始终根据目前的输入维度构造新的grid从逻辑上看，这并没有改变forward最终的推理结果。

7.2 ONNX/MNN/TNN模型文件转换

如果你已经梳理清楚了Detect模块的一些新的逻辑，那么转换成ONNX就是比较简单的事了，直接调用export.py即可。比如：

PYTHONPATH=. python3 export.py --weights weights/yolov5n-0.5.pt --img_size 640 640 --batch_size 1 --simplify 
 PYTHONPATH=. python3 export.py --weights weights/yolov5n-face.pt --img_size 640 640 --batch_size 1 --simplify

如果你去掉了self.grid[i].shape[2:4] != x[i].shape[2:4] 的判断，也不会再出现Tracing(TracerWarning:)。转换成MNN和TNN的模型文件的命令如下：

MNNConvert -f ONNX --modelFile yolov5n-0.5-640x640.onnx --MNNModel yolov5n-0.5-640x640.mnn --bizCode MNN  # MNN模型转换
python3 ./converter.py onnx2tnn yolov5n-0.5-640x640.onnx -o ./YOLO5Face/ -optimize -v v1.0 -align # TNN模型转换

我用的MNNConvert是对应MNN 1.2.0版本，tnn-convert镜像则是最新的镜像。

7.3 针对NCNN模型转换的定制化处理（不支持5维张量）

由于NCNN的Mat是一个3维张量（h,w,c），假设batch=1，所以目前似乎是对4维及以下的张量有比较好的支持，5维及以上的张量是无法转换到ncnn的（个人理解哈，如有错误，欢迎指正~）。我拿export出来的ONNX文件直接转ncnn会遇到unspport slice axes的情况。比如

~ onnx2ncnn YOLO5Face/yolov5n-face-640x640.onnx yolov5n-face-640x640.param yolov5n-face-640x640.bin
Unsupported slice axes !
Unsupported slice axes !
Unsupported slice axes !
Unsupported slice axes !
...

然后尝试采用野路子：记录一个解决onnx转ncnn时op不支持的trick 也无法解决，输出的信息如下：

~ onnx2ncnn YOLO5Face/yolov5n-face-640x640.opt.onnx yolov5n-face-640x640.param yolov5n-face-640x640.bin
Unsupported slice axes !
Unsupported slice axes !
Unsupported slice axes !
Unsupported slice axes !
...

所以，我想这可能是由于ncnn会把一个5维张量捏成4维（假设batch=1），但是YOLO5Face的坐标反算逻辑基本上是在5维上做slice，所以导致了NCNN在转换这段反算逻辑时出现了slice错误。那么怎么解决这个问题呢？那就是不使用5维张量，把Detect中关于坐标反算的那段拿到C++中做实现。如果你理解了Detect的细节，以及张量在内存中的分布，这个实现其实不难做。首先，我们来看看，在YOLO5Face中这个代码怎么改。

# x[i] = x[i].view(bs, self.na, self.no, ny, nx).permute(0, 1, 3, 4, 2).contiguous() 原来的处理
x[i] = x[i].view(bs, 3, 16, -1).permute(0, 1, 3, 2).contiguous()  # e.g (b,3,20x20,16) for NCNN
# ... 注释掉坐标反算的逻辑
# return torch.cat(z, 1)  # (bs,?,16) 原来的返回
return x # 修改后的返回 for NCNN

其实就是不展开最后(ny,no)这两个维度，把这2个维度flatten成一个维度。由于后续的处理都是基于5维的张量，所以，坐标反算那段逻辑也要注释掉，直接返回这个修改后的4维张量，把坐标反算这部分放在C++里面实现。为了顺利export出ONNX文件，还需要对应地修改export.py，因为现在输出是一个list了，里面有3个维度不一样的张量，而原来是被torch.cat在一起，只有一个张量。

# torch.onnx.export(model, img, f, verbose=False, opset_version=12,
    #                   input_names=input_names,
    #                   output_names=output_names,
    #                   dynamic_axes={'input': {0: 'batch'},
    #                                 'output': {0: 'batch'}
    #                                 } if opt.dynamic else None)
    torch.onnx.export(model, img, f,
                      verbose=False,
                      opset_version=12,
                      input_names=['input'],
                      output_names=["det_stride_8", "det_stride_16", "det_stride_32"],
                      )  # for ncnn

正常导出即可，然后转换成NCNN文件，并用ncnnoptimze过一遍，很顺利，没有再出现算子不支持的问题。

~ PYTHONPATH=. python3 export.py --weights weights/yolov5n-face.pt --img_size 640 640 --batch_size 1 --simplify
~ ncnn_models onnx2ncnn yolov5n-face-640x640-for-ncnn.onnx yolov5n-face-640x640.param yolov5n-face-640x640.bin
~ ncnnoptimize yolov5n-face-640x640.param yolov5n-face-640x640.bin yolov5n-face-640x640.opt.param yolov5n-face-640x640.opt.bin 0
  Input layer input without shape info, shape_inference skipped
  Input layer input without shape info, estimate_memory_footprint skipped

其实，这样做还是有好处的，因为不需要把anchors和anchor_grid导出来，那么模型文件的size就变小了，比如按照原来方式导出的yolov5face-n-640x640.onnx文件占了9.5Mb内存，修改后，不导出anchors和anchor_grid的模型文件只有6.5Mb。最后，关于YOLO5Face 的C++前后处理以及NMS的实现，建议大家可以去看看我仓库的源码，就不在这里啰嗦了~

本文仅做学术分享，如有侵权，请联系删文。

重磅！计算机视觉工坊-学习交流群已成立

扫码添加小助手微信，可申请加入3D视觉工坊-学术论文写作与投稿微信交流群，旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群，目前主要有ORB-SLAM系列源码学习、3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、深度估计、学术交流、求职交流等微信群，请扫描下面微信号加群，备注：”研究方向+学校/公司+昵称“，例如：”3D视觉 + 上海交大 + 静静“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球：针对3D视觉领域的视频课程（三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM、自动驾驶等）、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕，更有各类大厂的算法工程人员进行技术指导。与此同时，星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息，打造成集技术与就业为一体的铁杆粉丝聚集区，近4000星球成员为创造更好的AI世界共同进步，知识星球入口：

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用，麻烦给个赞和在看~

你可能感兴趣的:(算法,c++,人工智能,深度学习,java)

Apache POI Annaday Spring apache
ApachePOI概述ApachePOI是用于在Java环境中读写MicrosoftOffice格式文件的开源库。支持对Excel、Word、PowerPoint等多种Office文件格式进行创建、读取、修改操作。由于企业开发中最常用的就是导出Excel文件，所以本文就以此进行讲解入门案例首先看一个简单的案例，我们需要使用该技术来读和写一个Excel文件第一步导入坐标org.apache.poip
医学类使用TransUNet、UNet、DeepLabV3+、HRNet、PSPNet 模型对息肉分割数据集进行训练、评估和可视化 EDD2020息肉数据集分割数据集计算机C9硕士_算法工程师数据集语义分割医学类数据集语义分割息肉 TransUNet UNet
息肉数据集/息肉瘤分割项目解决（已处理好:EDD2020数据集(EndoscopyDiseaseDetectionandSegmentationChallenge)该息肉分割数据集主要包含人体生长的（肠胃）息肉用于器官内部息肉瘤分割，息肉目标检测，息肉定位任务息肉分割是一个重要的医学影像分析任务，特别是在内窥镜检查中。EDD2020数据集是一个很好的起点。我们将使用几种流行的深度学习模型（如Tra
Effective C++ 规则43：学习处理模板化基类内的名称哎呦，帅小伙哦 C++c++
1、背景在C++中，模板化基类为我们提供了强大的灵活性。然而，模板化基类的名称查找却经常会引发困惑，甚至导致编译错误。这是因为模板的名称查找规则与普通类不同。在普通类中，派生类可以直接访问基类的成员变量和成员函数，因为这些名称在编译时是确定的。然而，在模板化基类中，由于基类的定义依赖于模板参数，其成员的名称查找需要更多的信息来完成。如果派生类也是模板类，那么基类的成员名称只有在模板参数确定之后才能
Python | 基于支持向量机（SVM）的图像分类案例 python收藏家 python 机器学习 python 机器学习
支持向量机（SVM）是一种监督机器学习算法，可用于分类和回归任务。在本文中，我们将重点关注使用SVM进行图像分类。当计算机处理图像时，它将其视为二维像素阵列。数组的大小对应于图像的分辨率，例如，如果图像是200像素宽和200像素高，则数组的尺寸为200x200x3。前两个维度分别表示图像的宽度和高度，而第三个维度表示RGB颜色通道。数组中的值范围为0到255，表示每个点处像素的强度。为了使用SVM
华为OD机试E卷 --学生方阵--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述学校组织活动，将学生排成一个矩形方阵。请在矩形方阵中找到最大的位置相连的男生数量。这个相连位置在一个直线上，方向可以是水平的，垂直的，成对角线的或者呈反对角线的。注:学生个数不会超过10000输入描述输入的第一行为矩阵的行数和列数，接下来的n行为矩阵元素，元素间用”,”分隔。
谷歌开发者模式调试Js代码 [保姆级教程] yunAike javascript 开发语言 ecmascript
开启开发者模式方法一：在网页中右键单击，选择“检查”选项，即可打开开发者工具。方法二：使用快捷键，在Windows/Linux系统中按Ctrl+Shift+I，在Mac系统中按Command+Option+I。开始调试JavaScript代码1.定位到源代码打开开发者工具后，点击上方的“Sources”（源代码）面板。该面板左侧是文件树，你可以从中找到要调试的JavaScript文件。如果是内联的
tomcat:Caused by:java.lang.ClassNotFoundException: javax.servlet.ServletContextListener解决方法码农研究僧 BUG java tomcat spring maven
目录1.找主问题2.普通方法3.进阶方法1.找主问题出现以下问题大概是在终端中这样显示让你去查看日志[2021-08-1909:20:24,031]Artifactssm项目:warexploded:Artifactisbeingdeployed,pleasewait...19-Aug-202121:20:26.871信息[RMITCPConnection(3)-127.0.0.1]org.apa
idea版本与maven版本不匹配问题报错java.lang.RuntimeException: java.lang.RuntimeException _ks℘ℳJJ、意中人๓ maven intellij-idea maven java
问题如下解决办法java.lang.RuntimeException:java.lang.RuntimeException:org.codehaus.plexus.component.repository.exception.ComponentLookupException:com.google.inject.ProvisionException:Unabletoprovision,seethef
从入门到精通：HttpClient深度剖析与实战指南步、步、为营 c#.netcore asp.net 微服务
一、引言1.1背景引入在当今数字化时代，网络编程已成为软件开发中不可或缺的一部分。而HTTP通信作为网络编程的核心，承担着客户端与服务器之间数据传输的重任。无论是Web应用、移动应用，还是分布式系统，HTTP协议都扮演着关键角色，它使得不同设备、不同平台之间能够高效地进行数据交互。在Java开发领域，为了实现HTTP通信，我们有众多工具可供选择，其中ApacheHttpClient脱颖而出，成为开
eclipse运行java报错,eclipse用maven运行项目报错java.lang.ArrayIndexOutOfBoundsException: 28054... 陈姜梅子 Maven 构建错误 XML解析 pom.xml
[ERROR]28054java.lang.ArrayIndexOutOfBoundsException:28054atorg.codehaus.plexus.util.xml.pull.MXParser.parsePI(MXParser.java:2502)atorg.codehaus.plexus.util.xml.pull.MXParser.parseEpilog(MXParser.java
桌面应用程序开发：跨平台方案方案有什么？柚米汇开发语言
目前市面上最流行的桌面开发程序框架和工具包括以下几种：1.Electron简介：使用Web技术（HTML、CSS、JavaScript）开发跨平台桌面应用，结合Node.js和Chromium。优点：广泛使用的Web技术，开发门槛低。丰富的插件和生态系统支持。许多成功的应用案例（如VisualStudioCode、Slack、Discord）。工具：VisualStudioCode、Atom。2.
无人机飞行控制、导航和路径规划的原理、技术和相关算法 weixin_30777913 无人机算法
无人机飞行控制、导航和路径规划是无人机技术的核心组成部分，其原理和技术涉及多个学科领域。这些技术和算法的不断发展和优化，为无人机的应用和发展提供更强有力的支持。下面解释它们的原理、技术和相关算法。飞行控制：无人机飞行控制的基本原理是通过传感器检测无人机的飞行状态和环境信息，并将其反馈给控制器。控制器根据反馈信息和任务需求，计算出无人机的控制指令，并将其发送给执行机构。执行机构根据控制器的控制指令，
人形机器人的组成原理、相关技术和行业应用 weixin_30777913 机器人
人形机器人的部件和工作原理人形机器人的部件通常包括机身、关节、传感器、驱动器、控制器等。其工作原理是通过传感器收集环境信息，控制器根据预设的算法和程序生成动作指令，驱动器驱动关节运动，从而实现机器人的各种动作。人形机器人主要由以下几个部件组成：伺服电机：在自动控制系统中，伺服电机作为执行元件，将接收到的电信号转换为电动机轴上的角位移或角速度输出。在人形机器人中，伺服电机是驱动各个关节运动的核心部件
NPM 常用命令 pumpkin84514 其它 npm
NPM常用命令NPM（NodePackageManager）是JavaScript生态系统中最流行的包管理工具，它不仅可以管理Node.js项目的依赖，还提供了丰富的命令来管理和发布你的代码。本文将从不同角度，深入浅出地介绍NPM的常用命令和实际应用。目录NPM基础什么是NPM安装NPM初始化项目(npminit)管理依赖安装依赖(npminstall)升级和卸载依赖(npmupdate,npmu
Java实现音频转文本（语音识别） Tech Synapse java 音视频语音识别
在Java中实现音频转文本（也称为语音识别或ASR）通常涉及使用专门的语音识别服务，如GoogleCloudSpeech-to-Text、IBMWatsonSpeechtoText、AmazonTranscribe、MicrosoftAzureSpeechServices，或者一些开源库如CMUSphinx。由于直接使用开源库或云服务的API进行完整演示可能涉及复杂的设置和依赖管理，这里将提供一个
Java SE与Java EE的区别 Tech Synapse java java-ee 前端
一、javase与javaee的区别在于领域不同和作用不同：1.领域不同：javase为平台标准版，可供任何领域使用。javaee为平台企业版，主要供应企业的使用。2.作用不同：javase提供了开发与运行Java软件的编译器等开发工具、软件库及Java虚拟机。它也是Java2平台、企业版本和Java网页服务的基础。编写一次、随处运行”的特性、方便存取数据库的JDBCAPI、CORBA技术以及能够
深入解析LangChain框架：使用Python开发LLM应用的全生命周期指南 m0_57781768 langchain python 网络
深入解析LangChain框架：使用Python开发LLM应用的全生命周期指南前言在当前的人工智能浪潮中，大型语言模型（LLM）已成为众多应用的核心。LangChain是一个专为开发大型语言模型应用而设计的框架，它简化了LLM应用的整个生命周期，包括开发、生产化和部署。本文将详细介绍LangChain框架的各个方面，涵盖其核心组件、第三方集成、开发教程、API参考等，并通过实际案例展示如何使用La
我喜欢和不喜欢的C++特点 liulun c++开发语言
我喜欢C++把我当成年人对待：在C++设计中有一条原则，那就是：无论做什么事情，都要相信程序员。与可能出现什么样的错误相比，能做出什么好产品更重要。C++程序员总是被看作成年人，只需要最少的看护。C++之父的《C++语言的设计与演化》我不太喜欢别人管着我，因为事情做的好不好是我自己的事，如果我的工具担心我做不好事，就给我灌输一大堆原则、理念，骑在我脖子上，这也不让我做，那也不让我做，必须如何如何做
Error querying database. Cause: java.lang.IllegalArgumentException: Mapped Statements collection do leaftong java 数据库 mybatis
项目场景：背景：在练习mybatis的对象映射时，设置了一个嵌套查询
【Blazor】使用C#替代Java编写代码的前端开发框架雕技小虫系统开发 Windows Server Blazor .NET 前端开发框架 webassembly
Blazor是微软于2019年下半年开始陆续全新推出的前端开发框架。优势无需插件，基于Web标准可与JavaScript交互利用.NETCore优势Blazor有两个版本：Server||WebAssemblyBlazorServer可以理解为在服务器上运行的Blazor，客户端与服务器间通过SignalR实进通信，2019年09月正式发布。BlazorWebAssembly2020年05月正式发
获取java类中的属性注释小时候的阳光 java java 类注释属性注释 tools.jar 代码注释
一般我们的某个数据库表对象model，javabean对象如下：packagecom.xxx.message.model;importcom.middol.common.model.BaseModel;importlombok.Data;importlombok.EqualsAndHashCode;importjavax.persistence.Column;importjavax.persist
C++ 继承和多态 Tiantangbujimo7 基础 c++开发语言
定义：继承是一种面向对象编程的重要特性，它允许你创建一个新的类，从一个或多个现有的类中继承属性的行为。这个新的类被称为派生类(DerivedClass)，而被继承的类称之为基类(BaseClass)。继承所研究的是类与类之间的依赖关系，是多个类直接的共性与个性直接的代码表达。让代码结构更加合理，灵活，易于维护。继承单继承classBaseClass{};classDerive:publicBase
编译器概述 Tiantangbujimo7 编译原理学习编程语言
什么是编译器：编译器是一个程序，核心功能是把源代码翻译成目标代码。源代码：c/c++,Java,c#,html,sql,…目标代码:x86,IA64,ARM,MIPS,…编译器的核心功能：源代码经过编译器的翻译，生成了目标代码，这里的静态计算意思是编译器在对目标程序进行编译的过程中并不去执行这个代码，而是尝试以静态的方式对目标程序进行理解，理解的原因是编译器所生成的目标程序和源程序必须语义相同。生
如何快速在linux服务器部署java运行环境（JDK+TomCat+Redis+Mysql+Nginx） Noobwali java tomcat linux
一.jdk和Tomcat1.jdk安装tar-zxv-fjdk-8u231-linux-x64.tar.gz2.配置环境变量vim/etc/profileJAVA_HOME=/java_source/jdk1.8.0_231(这里填写你的路径，后面不变)PATH=JAVAHOME/bin:JAVA_HOME/bin:JAVAHOME/bin:PATHCLASSPATH=JAVAHOME/jre/l
L8打卡学习笔记无涯学徒1998 学习笔记支持向量机
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊SVM与集成学习SVMSVM线性模型SVM非线性模型SVM常用参数集成学习随机森林导入数据查看数据信息数据分析随机森林模型预测结果结果分析个人总结SVM超平面：SVM在特征空间中寻找一个能够最大化类别间隔的超平面，称为最大间隔超平面。这个超平面就是将数据集分成不同类别的边界。支持向量：支持向量是离分隔超平面最近的样本点，它们决定了超平面的
P5学习笔记无涯学徒1998 python pytorch
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊运动鞋品牌识别设置GPU导入数据构建CNN模型编写训练函数编写测试函数设置动态学习率等间隔动态调整自定义调整多间隔调整余弦退火正式训练结果可视化使用模型进行预测个人总结设置GPUimporttorchimporttorch.nnasnnimporttorchvision.transformsastransformsimporttorchv
【学习笔记】昇思25天学习打卡(D14)CV05-SSD目标检测.ipynb UnseenMe 昇思学习笔记目标检测
SSD目标检测模型简介SSD，全称SingleShotMultiBoxDetector，是WeiLiu在ECCV2016上提出的一种目标检测算法。使用NvidiaTitanX在VOC2007测试集上，SSD对于输入尺寸300x300的网络，达到74.3%mAP(meanAveragePrecision)以及59FPS；对于512x512的网络，达到了76.9%mAP，超越当时最强的FasterRC
每日一题洛谷P1420 最长连号c++ wen__xvn 洛谷 c++算法数据结构
#includeusingnamespacestd;intmain(){intn;cin>>n;ints[1000]={0};for(inti=0;i>s[i];}intmax=1;intt=1;for(inti=0;imax){max=t;}}else{t=1;}}cout<<max<<endl;return0;}
Spring Boot与H2数据库：快速搭建内存数据库应用 2501_90323865 数据库 spring boot oracle 个人开发
在现代软件开发中，快速搭建和测试应用程序是提高开发效率的关键环节之一。SpringBoot作为一款强大的Java应用开发框架，结合H2内存数据库，能够帮助开发者迅速构建出功能完善的原型系统。本文将通过一个简单的实例，详细介绍如何在SpringBoot项目中集成H2数据库，并利用其浏览器控制台进行数据操作。一、项目搭建创建SpringBoot项目首先，我们需要创建一个SpringBoot项目。可以通
Linux 部署 Java 项目：Tomcat、Redis、MySQL 教程 lingllllove java linux tomcat
在Linux服务器上部署Java项目通常需要配置应用服务器（如Tomcat）、数据库（如MySQL）和缓存服务器（如Redis）。本文将详细介绍如何在Linux环境中部署一个Java项目，涵盖Tomcat、Redis和MySQL的安装与配置。一、准备工作在开始之前，确保你拥有以下条件：一台运行Linux的服务器（本文以Ubuntu为例）。具有sudo权限的用户。安装好Java环境（JDK）。安装J
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe