在CUDA C/C++中如何衡量代码性能

转载自
https://segmentfault.com/a/1190000007540468

主要讲三方面:
1. 时间
2. 带宽
3. GFLOPS

你可能感兴趣的:(CUDA)