在Directx11中采用DirectCompute进行GPU并行的数值计算,或者Debug DirectCompute的程序,一个最典型的问题就是将GPU中的计算结果读出来到CPU让我们也可以看结果是否正确。
首先讲由于Directx11中用来存储结果的subresource(主要是指buffer)有不同属性:各种D3D11_USAGE,所以其GPU和GPU的读写权限也不一样。我们这里主要是针对D3D11_USAGE_DEFAULT的buffer。即假设我们GPU的计算结果输出到一个D3D11_USAGE_DEFAULT属性的buffer中。
然后buffer是subresource的一种,计算结果一般用buffer来存储。下面有时说buffer有时说subresource,一般是一样的。
将GPU中的数据读到CPU的方法总结。
1:先将存有GPU计算结果的subresource0(一般是buffer)拷贝到一份CPU也可以读写的subresource1(创建subresource1时标识其为D3D10_USAGE_STAGING,表示其是从GPU拷贝到CPU的数据;调用ID3D11DeviceContext::CopyResource将subresource0的东东拷贝到subresource1)。
2:然后通过Map函数,Get a pointer(*D3D11_MAPPED_SUBRESOURCE) to the data contained in a subresource, and deny the GPU access to that subresource1(这句话不好翻译)。
3:将上面得到的(*D3D11_MAPPED_SUBRESOURCE).(void*)强制转换为CPU可以理解的struct或者class或者float等CPU类型的指针。
4:对上面得到的CPU指针读写即可得到或者更改GPU中的数据。
5:最后Unmap()刚刚Map()的Resource。
/*示例:
1:我们想将GPU中的计算结果ID3D11Buffer* m_pTestBuffer读出来。我们先通过调用函数ID3D11Buffer *CreateAndCopyToDebugBuffer(ID3D11Buffer* sourceBuffer)得到一份它的CPU可以读写的拷贝buffer。*/
HRESULT hr=S_OK;
ID3D11Buffer* resultBuffer=NULL;
resultBuffer=CreateAndCopyToDebugBuffer(m_pTestBuffer);
/*
2:然后通过Map函数,Get a pointer (D3D11_MAPPED_SUBRESOURCE *) to the data contained in a subresource, and deny the GPU access to that subresource。*/
D3D11_MAPPED_SUBRESOURCE resultResources;
ZeroMemory(&resultResources,sizeof(D3D11_MAPPED_SUBRESOURCE));
IFR(m_pContext->Map(resultBuffer,0,D3D11_MAP_READ,0,&resultResources));
/*
3:将上面得到的D3D11_MAPPED_SUBRESOURCE::VOID*强制转换为CPU可以理解的struct或者class或者float等类型的指针。*/
TestBufType* p=NULL;
p=(TestBufType*)resultResources.pData;
/*
4:对上面得到的CPU指针p读写即可得到或者更改GPU中ID3D11Buffer* m_pTestBuffer的数据。*/
m_pGPUTestResult=new TestBufType[uNumSimpleElements];
for(int i=0;i<uNumSimpleElements;i++)
{
m_pGPUTestResult[i].pos.x=p[i].pos.x;
m_pGPUTestResult[i].pos.y=p[i].pos.y;
m_pGPUTestResult[i].velocity.x=p[i].velocity.x;
m_pGPUTestResult[i].velocity.y=p[i].velocity.y;
}
/*
5:最后Unmap()刚刚Map()的Resource,使得这个resource的CPU指针无效,GPU重新获得对该resource的读写权限。*/
m_pContext->Unmap(resultBuffer,0);
我们最后反过来看下最开始调用的将仅GPU读写的resource拷贝到CPU的resource的函数CreateAndCopyToDebugBuffer(),里面用来描述拷贝出来的resource的D3D11_BUFFER_DESC有两个要注意的点,CPUAccessFlags和Usage。其中CPUAccessFlags根据需要可以设置为D3D11_CPU_ACCESS_READ和D3D11_CPU_ACCESS_WRITE。然后Usage就一定要设置为D3D11_USAGE_STAGING,它表明这个resource是从GPU拷贝到CPU的。CreateAndCopyToDebugBuffer()的实现如下:
ID3D11Buffer* DemoApp::CreateAndCopyToDebugBuffer(ID3D11Buffer* pSrcBuffer)
{
ID3D11Buffer* debugBuffer=NULL;
D3D11_BUFFER_DESC bfDESC;
ZeroMemory(&bfDESC,sizeof(D3D11_BUFFER_DESC));
pSrcBuffer->GetDesc(&bfDESC);
bfDESC.BindFlags=0;
bfDESC.MiscFlags=0;
bfDESC.CPUAccessFlags=D3D11_CPU_ACCESS_READ;
bfDESC.Usage=D3D11_USAGE_STAGING;
if(SUCCEEDED(m_pDevice->CreateBuffer(&bfDESC,NULL,&debugBuffer)))
{
m_pContext->CopyResource(debugBuffer,pSrcBuffer);
}
return debugBuffer;
}