前两天在写论文的时候,想到这个问题,我的程序GPU要把结果输出到深度缓冲区,然后交给CPU查询,
GPU不是通用处理器,通常的smp是不合适的。又仔细读了OpenGL ext spec,发现nVidia的Occlusion query考虑到了这个问题,是我一直没有读到,还是把这些天的一些简单笔记写一下。
标准OpenGL的只提供了两种同步的机制:glFlush, glFinish.
Flush,只是向user保证可以在有限的时间里完成命令,但是这个时间无法确定,它只是一个适度的工具;
Finish,会stall CPU的执行,直到所有pending的图形命令执行完成。
而NV_fence扩展则提供了一个中间的尺度,既能够保证finish一部分的命令,又提供了判断已给图形命令是否完成的能力。一个有用的应用就是检测GPU完成GL命令的性能,如下示例:
start = getCurrentTime();
updateTextures();
glSetFenceNV(TEXTURE_LOAD_FENCE, GL_ALL_COMPLETED_NV);
drawBackground();
glSetFenceNV(DRAW_BACKGROUND_FENCE, GL_ALL_COMPLETED_NV);
drawCharacters();
glSetFenceNV(DRAW_CHARACTERS_FENCE, GL_ALL_COMPLETED_NV);
glFinishFenceNV(TEXTURE_LOAD_FENCE); //make app hang, until return
textureLoadEnd = getCurrentTime();
glFinishFenceNV(DRAW_BACKGROUND_FENCE);
drawBackgroundEnd = getCurrentTime();
glFinishFenceNV(DRAW_CHARACTERS_FENCE);
drawCharactersEnd = getCurrentTime();
printf("texture load time = %d/n", textureLoadEnd - start);
printf("draw background time = %d/n", drawBackgroundEnd - textureLoadEnd);
printf("draw characters time = %d/n", drawCharacters - drawBackgroundEnd);