智能AI计算芯片对比

下面是本人接触到的AI芯片,主要涉及华为、比特大陆-算丰、英伟达。其他还有寒武纪、地平线、瑞芯微等没有接触过就不对比了。
易开发性:比特大陆>英伟达>华为
性能:华为>英伟达>比特大陆(性能不是很好对比,每家实现的算子性能有差异,不能单纯对比TOPS)

算力 内存 带宽(GB/s) 解码 编码 功耗 备注
昇腾310 16TOPS INT8 LPDDR4x 8/4GB H.264/H.265 16路1080P@30FPSJPEG 1080P@256FPS 1路1080P@30FPS 9.5W Caffe/TensorFlow
Atlas300 4x4TFLOPS62TOPS@INT8 LPDDR4x 4x 8GB H.264/H.265 4x 16路1080P@30FPSJPEG 4x 1080P@256FPS 4路1080P@30FPS 67W
HI3559A 4TOPS@INT8-NNIE+2TOPS@INT8-DSP LPDDR4x 4GB 视频:8路1080P@30FPSJPEG:1080P@240FPS 5W
算丰BM1880终端芯片 1TOPS@INT8(Winograd算计可达2TOPS@INT8) LPDDR4 最大4GB 2路1080P@30FPSFHD:1080P@75FPS 2.5W 多框架支持Caffe\ONNX
算丰BM1682云端芯片 3TFLOPS 8路1080P@30FPS 可堆叠多颗芯片
算丰SC1/SC1+ 2TFLOPs/4TFLOPs 16/32GB 50 1颗BM1680/2颗
Nvidia jetson TX2 1TFLOPS4TOPS@INT8 LPDDR4x 8GB D2D 35D2H/H2D 20 8路1080P@30FPS 7.5W

实测BM1682 VS HI3559A(单NNIE)网络有快有慢,并不是某个芯片一定快。

bm1682 hi3559a
YOLOv3_352x384 32.65ms 41.4ms
1 2 4
YOLOv3_288x320 19.31ms 33.74ms 61.17ms
mobilenetv2_288x320 3.16ms
MTCNN_16x56 0.246ms 0.193ms
CNN_48x168 0.649ms 3.75ms

你可能感兴趣的:(智能硬件)