基于FPGA的YOLO加速器设计与实现

        去年空闲之余基于FPGA实现了类YOLO的轻量化的CNN加速器。为了方便,直接基于Ultra96平台进行了验证,整个加速器资源消耗还算客观,帧率基本在200FPS左右。

FPGA实现架构

基于FPGA的YOLO加速器设计与实现_第1张图片

硬件资源消耗:

基于FPGA的YOLO加速器设计与实现_第2张图片

       后面打算优化架构设计,实现一种更为轻量级或者资源占用更少的CNN加速器,这样可以在低端的片子,以更少的资源和主频,达到同样的效果。先立个flag。争取这几个月实现tiny yolov3的轻量级加速器,可以在Artix50T或者7020的FPGA上,达到实时性能。

你可能感兴趣的:(神经网络硬件加速,CNN硬件加速,YOLOV3,FPGA)