关于CPU与GPU的同步问题

前两天在写论文的时候,想到这个问题,我的程序GPU要把结果输出到深度缓冲区,然后交给CPU查询,
GPU不是通用处理器,通常的smp是不合适的。又仔细读了OpenGL ext spec,发现nVidia的Occlusion query考虑到了这个问题,是我一直没有读到,还是把这些天的一些简单笔记写一下。

标准OpenGL的只提供了两种同步的机制:glFlush, glFinish.

Flush,只是向user保证可以在有限的时间里完成命令,但是这个时间无法确定,它只是一个适度的工具;

Finish,stall CPU的执行,直到所有pending的图形命令执行完成。

而NV_fence扩展则提供了一个中间的尺度,既能够保证finish一部分的命令,又提供了判断已给图形命令是否完成的能力。一个有用的应用就是检测GPU完成GL命令的性能,如下示例:

start = getCurrentTime();

updateTextures();

glSetFenceNV(TEXTURE_LOAD_FENCE, GL_ALL_COMPLETED_NV);

drawBackground();

glSetFenceNV(DRAW_BACKGROUND_FENCE, GL_ALL_COMPLETED_NV);

drawCharacters();

glSetFenceNV(DRAW_CHARACTERS_FENCE, GL_ALL_COMPLETED_NV);

glFinishFenceNV(TEXTURE_LOAD_FENCE); //make app hang, until return

textureLoadEnd = getCurrentTime();

glFinishFenceNV(DRAW_BACKGROUND_FENCE);

drawBackgroundEnd = getCurrentTime();

glFinishFenceNV(DRAW_CHARACTERS_FENCE);

drawCharactersEnd = getCurrentTime();

printf("texture load time = %d/n", textureLoadEnd - start);

printf("draw background time = %d/n", drawBackgroundEnd - textureLoadEnd);

printf("draw characters time = %d/n", drawCharacters - drawBackgroundEnd);

 

你可能感兴趣的:(关于CPU与GPU的同步问题)