fpga 机器学习 rtl实现

准备开一个用fpga实现整个机器学习的专栏,也正好巩固自己目前所学的东西,同时也提高自己的code能力

手撸一个cnn ip,其实目前cnn ip模式也挺固定,核心的conv计算,充分利用fpga内的DSP,怎么把ddr内的数据有效的存到片上RAM,IP的结构也比较固定,如下

fpga 机器学习 rtl实现_第1张图片

目前手里有块zedboard的板卡,准备在这上面实现整个功能,fpga内有arm核,一些处理也可以在软件上操作。

大概思考了下后面的具体实现步骤:

(1)python实现某个深度学习网络,参数定点量化,楼主只会些matlab,但是目前python比较流行,决定学习下

(2)conv初级版本,先把数据运算完成, 需要比对结果

(3)load和save部分

(4)整体仿真运行

(5)上板测试

大概会分为这5部分来完成整个 cnn ip,实现过程中会把某些章节再次细分,估计python这节就够我喝一壶的,本人是rtl coder,后来rtl部分可能会轻松些,再接再厉吧

你可能感兴趣的:(机器学习)