基于场景的数据集------明厨亮灶数据集

为了和各位开发爱好者深入合作交流,特此准备分批次开放数据集拱大家交流学士研究使用,整理的非常细腻,有些是专业队伍标注的,主要是菲律宾那边的团队进行标注的。依据众多算法搭建的算法平台主体算法包括   人脸识别,人脸检测,区域入侵报警,人数统计,聚集检测,厨师帽,口罩,抽烟,打手机,老鼠,火苗,睡岗,跳楼检测,打架检测,持刀检测等等。所有算法框架采用的yolo框架,前后端打通,最主要的算法都做了后处理,很多算法基本没有任何误报,还可以支持定时任务,选择运行时段

一.明厨亮灶

数据集,质量很高,数量很大,场景很全,整理很细腻,可以拱广大爱好者很好的研究学习。技术上采取了后处理的措施,使之不会反复上传,不仅包括检测还有deepsort跟踪,不会频繁反复上报,加上图像学逻辑后处理过程

基于场景的数据集------明厨亮灶数据集_第1张图片

基于场景的数据集------明厨亮灶数据集_第2张图片

yolox简介

优点1:主干网络(CSPDarknet)加入Fcous结构
主干网络加入Fcous结构,将图片宽高信息缩小,减小参数量,提升网络计算速度

Fcous结构:将输入的图片先经过Fcos结构对图片进行每隔一个像素取出一个值,得到四个特征层,然后再进行concat。从而图片宽高的信息缩小,通道数增加。在原始信息丢失较少的情况下,减小了参数量(由于fcous替代了两层卷积与一层bottleneck)

图 1 Fcous示意

优点2:主干网络的激活函数替换为silu激活函数
silu函数相比于rule非线性能力更强,解决了rule当有负数输入输出为0,发生梯度弥散的缺点。同时继承了relu收敛更快的优点。

silu函数=x*sigmoid(x),是relu与sigmoid的结合。可以看做是一个平滑的Relu,对比来看,silu解决了relu具有负数输入输出为0的缺点,不会发生梯度弥散的问题。

(上层神经元通过加权求和,得到输出值,然后被作用一个激活函数,得到下一层的输入值。引入激活函数的目的是为了增加神经网络的非线性拟合能力。)

(被fcous处理后的feature map会被用silu激活函数的,残差卷积层进行卷积,卷积后进入

CSPLayer。)
 

你可能感兴趣的:(深度学习,计算机,嵌入式,深度学习,人工智能)