硬件的计算方式

卷积转GEMM

硬件的计算方式_第1张图片

硬件的计算方式_第2张图片

神经网络90%以上的计算单元都是由卷积和全链接构成的,所以说,一个具有tensor core矩阵乘法单元的加速卡,已经足以加速绝大部分CNN类型的网络了。


结束

你可能感兴趣的:(Linux,算法,人工智能,深度学习,神经网络,cnn)