cuda sdk 2.3 convolution separable之存疑

convolution是图像处理中最常用的一个算法。

cuda sdk2.3中的convolution separable与以前版本有点不同,用同一个block去处理一系列相邻的图像块。这个不晓得为什么?

在俺的quadroFx5800上跑了跑,不同的ROWS_RESULT_STEPS也有不同的运行速度,不过每次运行的差别比较大。看到论坛里有人说这是为了资源均衡。。。还是不太理解

你可能感兴趣的:(算法,CUDA,图像处理)