cuda编程之数据更新小技巧

不知道大家有没有遇到这样的情况:

在某个迭代计算过程中,数组new的计算需要old的值,当计算完成后,需要把new的值写入old再下一次迭代?
如果这里使用memcpy的方式,当数据量较大的时候会很耗时的!

解决方法:交换指针

也就是把指向设备内存new和old的指针进行交换,这样就避免了memcpy的时间消耗~当然用过的人无视以上内容~

交换方法:定义一个函数
void pointerExch(void **pt1, void **pt2)
{
    void *tmp;
    tmp = *pt1;
    *pt1 = *pt2;
    *pt2 = tmp;
}

然后调用上面的函数,把保存指向设备的指针传入

pointerExch((void**)&new, (void**)&old);

这样new和old指向的位置就进行了交换,并且以前的代码也不需要修改!这样就代替了

cudaMemcpy(old, new, size, cudaMemcpyDeviceToDevice);

经实际测试,我有大概15个double的数组需要更新,每个都在10W个元素以上,如果用内存拷贝的方式,大概耗时在5ms,而用交换指针,只需要0.000007 s = 0.007ms就完成了! 

你可能感兴趣的:(cuda编程之数据更新小技巧)