异构计算

1. AMD图形系统介绍

强烈推荐,算是异构的入门材料
https://www.cnblogs.com/shoemaker/p/linux_graphics01.html

2. 异构框架介绍

AMD GPU整个软件堆栈结构如下,整个软件栈全部是开源的:
HIP --> HCC --> ROCR Runtime --> ROCT Thunk --> drm driver --> gpu hardware
nvidia的软件栈结构如下,cuda, nvcc和C runtime全部不开源:
cuda --> nvcc --> C runtime --> cuda driver
所谓kernel的优化或者算子优化,更多的是编译器层面的后端设计和DAG优化,参考LLVM 7机器周期说明
https://blog.csdn.net/wuhui_gdnt/article/details/69525354
注:这部分理解不一定正确,持续学习更新中…

3. TVM中相关优化部分

https://docs.tvm.ai/vta/index.html
tvm里面vta的fpga的优化实现
https://docs.tvm.ai/vta/tutorials/matrix_multiply.html#sphx-glr-vta-tutorials-matrix-multiply-py

intel的AVX512指令,对应到TVM里面就像blocking技术
https://docs.tvm.ai/tutorials/optimize/opt_gemm.html#sphx-glr-tutorials-optimize-opt-gemm-py

4. CUDA学习

http://www.cnblogs.com/1024incn/tag/CUDA/

你可能感兴趣的:(异构计算)