前情提要;最近出了一个新的人脸检测框架scrfd,scrfd的论文在5月10日挂在了阿凯上,感兴趣的同学们可以去看一看
https://arxiv.org/abs/2105.04714
新出的scrfd旨在实现模型效能的极致均衡:(Extensive experiments conducted on WIDER FACE demonstrate the state-of-the-art efficiency-accuracy trade-off for the proposed \scrfd family across a wide range of compute regimes,论文如是说)
对比实验似乎也在说明这一点,最小的scrfd-0.5GF检测速度要比之前提出Retinaface-mb0.25快两倍,检测性能也实现全方位的突破:
但具体效果如何,还是需要down下源码run一遍,才能得以验证。
实际效果如何,还是需要通过git clone下来测试才行,拉取官方代码;
git clone https://github.com/deepinsight/insightface.git
将scrfd的源码单独提出来,其他删除即可,不影响跑库
确保文件齐全,安装环境所需库(具体写在requirements文件夹中),在Inter Core i5-4210M处理器上进行测试,测试结果如下:
以下几点补充:
测试的单帧Infer Time=推理一分钟/该分钟内处理的帧数
具体安装方法可参考mm的官网:
https://link.zhihu.com/?target=https%3A//github.com/open-mmlab/mmcv
pip install mmcv-full -f https://download.openmmlab.com/mmcv/dist/cu102/torch1.6.0/index.html
补充踩过的几个坑
安装和编译mmdet
完成后查看下list有没有这三个库:
如果有,就可以开始提取onnx模型,官方给出的baseline如下:
github.com/deepinsight/insightface
看你所需的模型,点击download即可下载,使用以下命令导出onnx模型:
python tools/scrfd2onnx.py configs/scrfd/scrfd_500m.py weights/scrfd_500m.pth --shape -1 -1 --input-img face.jpg
其中
这里有两种公网推流的方式:
①使用云服务器作为中介服务器
②购买内网穿刺所用的域名
两种方式都尝试过
第一种使用的是那种9.9块包月的学生云资源,带宽和处理算力远达不到模型所需的吞吐率要求,这样造成了严重延迟,体验感贼差(还是软妹币的问题。。。。)
第二种通过软件进行内网穿刺,具体网上的资料有很多(可参考引用【2】,讲得很详细),优点在于省时省力还能白嫖
无论是哪种,思想无非就是借用公网IP来进行不同局域网下的互通
进行内网穿刺后,就可以使用flask将检测后的帧推到公网上,代码如下:
from flask import Flask, render_template, Response
import argparse
from tools.scrfd import *
import datetime
import cv2
class VideoCamera(object):
def __init__(self):
# 通过opencv获取实时视频流
self.video = cv2.VideoCapture(0)
def __del__(self):
self.video.release()
def get_frame(self):
success, image = self.video.read()
# 因为opencv读取的图片并非jpeg格式,因此要用motion JPEG模式需要先将图片转码成jpg格式图片
# ret, jpeg = cv2.imencode('.jpg', image)
# return jpeg.tobytes()
return image
app = Flask(__name__)
@app.route('/') # 主页
def index():
# 具体格式保存在index.html文件中
return render_template('index.html')
def scrfd(camera):
detector = SCRFD(model_file='onnx/scrfd_500m_bnkps_shape160x160.onnx')
while True:
frame = camera.get_frame()
# cv2.imshow('fourcc', frame)
# img = cv2.imread(frame)
for _ in range(1):
ta = datetime.datetime.now()
bboxes, kpss = detector.detect(frame, 0.5, input_size = (160, 160))
tb = datetime.datetime.now()
print('all cost:', (tb - ta).total_seconds() * 1000)
for i in range(bboxes.shape[0]):
bbox = bboxes[i]
x1, y1, x2, y2, score = bbox.astype(np.int)
cv2.rectangle(frame, (x1, y1), (x2, y2), (255, 0, 0), 2)
if kpss is not None:
kps = kpss[i]
for kp in kps:
kp = kp.astype(np.int)
cv2.circle(frame, tuple(kp), 1, (0, 0, 255), 2)
ret, jpeg = cv2.imencode('.jpg', frame)
frame = jpeg.tobytes()
yield (b'--frame\r\n'
b'Content-Type: image/jpeg\r\n\r\n' + frame + b'\r\n\r\n')
@app.route('/video_feed') # 这个地址返回视频流响应
def video_feed():
if model == 'scrfd':
return Response(scrfd(VideoCamera()),
mimetype='multipart/x-mixed-replace; boundary=frame')
if __name__ == '__main__':
parser = argparse.ArgumentParser(description='Object Detection using YOLO-Fastest in OPENCV')
parser.add_argument('--model', type=str, default='scrfd')
args = parser.parse_args()
model = args.model
app.run(host='0.0.0.0', debug=True, port=1938)
运行命令:
python flask_api.py
将检测结果推送到网页上,此时根据网段号w400985k15.wicp.vip:54551 登录网页进行查看(w400985k15.wicp.vip为赠送的域名,54551为分配的端口,原host指定为本机ip,映射后自动跳转到公网域名,port也会跟着改变),此时的树莓派和电脑属于不同的局域网下:
不仅如此,还可以用手机进行查看,不管在多远的距离都可以。
代码与所有onnx模型放在此连接上
pengtougu/onnx-scrfd-flask
最后,放上我喜欢听的一首歌
参考:
【1】nihui:详细记录insightface的SCRFD人脸检测ncnn实现
【2】树莓派远程监控 - web异地监控
欢迎加入深度学习交流群:696654483
里面有很多的研究生大佬和各行各业的大咖~