• Directx11之Debug DirectCompute_将数据从GPU读到CPU


      在Directx11中采用DirectCompute进行GPU并行的数值计算,或者Debug DirectCompute的程序,一个最典型的问题就是将GPU中的计算结果读出来到CPU让我们也可以看结果是否正确。

      首先讲由于Directx11中用来存储结果的subresource(主要是指buffer)有不同属性:各种D3D11_USAGE,所以其GPU和GPU的读写权限也不一样。我们这里主要是针对D3D11_USAGE_DEFAULT的buffer。即假设我们GPU的计算结果输出到一个D3D11_USAGE_DEFAULT属性的buffer中。

      然后buffer是subresource的一种,计算结果一般用buffer来存储。下面有时说buffer有时说subresource,一般是一样的。

      将GPU中的数据读到CPU的方法总结。

      1:先将存有GPU计算结果subresource0(一般是buffer)拷贝到一份CPU也可以读写的subresource1(创建subresource1时标识其为D3D10_USAGE_STAGING,表示其是从GPU拷贝到CPU的数据;调用ID3D11DeviceContext::CopyResource将subresource0的东东拷贝到subresource1)。

      2:然后通过Map函数,Get a pointer*D3D11_MAPPED_SUBRESOURCE to the data contained in a subresource, and deny the GPU access to that subresource1(这句话不好翻译)

      3:将上面得到的(*D3D11_MAPPED_SUBRESOURCE).(void*)强制转换为CPU可以理解的struct或者class或者float等CPU类型的指针。

      4:对上面得到的CPU指针读写即可得到或者更改GPU中的数据。

      5最后Unmap()刚刚Map()Resource

      /*示例:

      1:我们想将GPU中的计算结果ID3D11Buffer* m_pTestBuffer读出来。我们先通过调用函数ID3D11Buffer *CreateAndCopyToDebugBuffer(ID3D11Buffer* sourceBuffer)得到一份它的CPU可以读写的拷贝buffer。*/

    HRESULT hr=S_OK;

    ID3D11BufferresultBuffer=NULL;

    resultBuffer=CreateAndCopyToDebugBuffer(m_pTestBuffer);

       /*

      2:然后通过Map函数,Get a pointer (D3D11_MAPPED_SUBRESOURCE * to the data contained in a subresource, and deny the GPU access to that subresource。*/

    D3D11_MAPPED_SUBRESOURCE resultResources;

    ZeroMemory(&resultResources,sizeof(D3D11_MAPPED_SUBRESOURCE));

    IFR(m_pContext->Map(resultBuffer,0,D3D11_MAP_READ,0,&resultResources));

       /*

      3:将上面得到的D3D11_MAPPED_SUBRESOURCE::VOID*强制转换为CPU可以理解的struct或者class或者float等类型的指针。*/

    TestBufTypep=NULL;

    p=(TestBufType*)resultResources.pData;

       /*

      4:对上面得到的CPU指针p读写即可得到或者更改GPUID3D11Buffer* m_pTestBuffer的数据。*/

        m_pGPUTestResult=new TestBufType[uNumSimpleElements];

    for(int i=0;i<uNumSimpleElements;i++)

    {

    m_pGPUTestResult[i].pos.x=p[i].pos.x;

    m_pGPUTestResult[i].pos.y=p[i].pos.y;

    m_pGPUTestResult[i].velocity.x=p[i].velocity.x;

    m_pGPUTestResult[i].velocity.y=p[i].velocity.y;

    }

        /*

      5:最后Unmap()刚刚Map()Resource,使得这个resourceCPU指针无效,GPU重新获得对该resource的读写权限。*/

    m_pContext->Unmap(resultBuffer,0);

     

      我们最后反过来看下最开始调用的将仅GPU读写的resource拷贝到CPUresource的函数CreateAndCopyToDebugBuffer(),里面用来描述拷贝出来的resourceD3D11_BUFFER_DESC有两个要注意的点,CPUAccessFlagsUsage。其中CPUAccessFlags根据需要可以设置为D3D11_CPU_ACCESS_READD3D11_CPU_ACCESS_WRITE。然后Usage就一定要设置为D3D11_USAGE_STAGING,它表明这个resource是从GPU拷贝到CPUCreateAndCopyToDebugBuffer()的实现如下:

    ID3D11BufferDemoApp::CreateAndCopyToDebugBuffer(ID3D11BufferpSrcBuffer)

    {

    ID3D11BufferdebugBuffer=NULL;


    D3D11_BUFFER_DESC bfDESC;

    ZeroMemory(&bfDESC,sizeof(D3D11_BUFFER_DESC));

    pSrcBuffer->GetDesc(&bfDESC);

    bfDESC.BindFlags=0;

    bfDESC.MiscFlags=0;

    bfDESC.CPUAccessFlags=D3D11_CPU_ACCESS_READ;

    bfDESC.Usage=D3D11_USAGE_STAGING;

    if(SUCCEEDED(m_pDevice->CreateBuffer(&bfDESC,NULL,&debugBuffer)))

    {

    m_pContext->CopyResource(debugBuffer,pSrcBuffer);

    }

    return debugBuffer;

    }

  • 相关阅读:
    事务数据oracle 锁1
    编译文件系统移植linux3.0.62 + busybox最小系统到单板TQ2440
    事务说明[tomcat] spring2.5.6 + hiberante3.1.3 + atomikos3.8.0 多数据源事务配置
    字符判断字母顺序问题
    维度字段缓慢渐变维度的处理方式
    nullnull提取汉字第一个字母
    期望连续2013百度之星4.27月赛 题目一 Fir
    覆盖距离AsiaHatyai2012 & LA 6144 Radiation 二分搜索
    冒泡,插入,希尔,快排的比较
    链表打印从尾到头打印链表
  • 原文地址:https://www.cnblogs.com/bester/p/3255819.html
Copyright © 2020-2023  润新知