opencl:提高kernel有效并发约束(Effective concurrency constraint)的一点心得
下面是一个简单的kernel函数,从integ_count_mat矩阵中用vload8函数取出A1,A2,A3,A4四个向量执行A4+A1-A2-A3,结果存入density_mat,代码中只用到了一个向量类型的变量sum。__kernelvoidobject_density_filter(matrix_info_clim_info,const__globalushort*integ_count_