single-passParallel Prefix Scan with Decoupled Look-back

背景

最近在写基数排序,nvidia的基数排序依赖这个实现,所以有必要搞懂。

原理

代码

总结

参考

你可能感兴趣的:(CUDA编程,c++)