【Vulkan学习记录-基础篇-4】Vulkan中的同步机制

提醒:本文不含任何图,读起来可能有些枯燥,如果对Vulkan中的同步还没有任何了解的,建议先参考后面给出的链接 [1][2][3]

在Vulkan中,对资源读写所需要做的同步是应用程序的职责,Vulkan本身只提供了很少的隐式同步机制,其余的都需要在程序中显式地使用Vulkan中的同步机制来实现。

提交顺序

提交顺序是Vulkan中的一个非常基本的概念,它本身并不具有任何同步的意义,但是不管是Vulkan提供的隐式同步,还是用户要自己实现的显式同步,都要以这个精确的概念为前提。
在Vulkan中,用户需要将命令写入CommandBuffer中,然后把一个或多个CommandBuffer写入到一个或多个VkSubmitInfo中,再把一个或多个VkSubmitInfo传给vkQueueSubmit,让Queue开始执行传入的命令,由此,从高往低,提交顺序为:
1.在CPU上通过多次vkQueueSubmit提交了一系列命令,这些命令的提交顺序为调用vkQueueSubmit从前往后的顺序,即先通过vkQueueSubmit提交的命令一定在后通过vkQueueSubmit提交的命令之前。

2.在同一次vkQueueSubmit中,传入了一个或多个VkSubmitInfo,这些VkSubmitInfo中的命令,按照VkSubmitInfo的下标顺序排列,即在pSubmits所指向的VkSubmitInfo数组中,下标靠前的VkSubmitInfo中所记录的所有命令都在下标靠后的VkSubmitInfo中所记录的所有命令之前。

3.在同一个VkSubmitInfo中,填入了一个或多个CommandBuffer,这些CommandBuffer中的命令的提交顺序为按照这些CommandBuffer的下标顺序,类似2中的顺序。

4.在同一个CommandBuffer中,所记录的命令分为两种:
一是不在RenderPass中的命令,即除去所有在vkCmdBeginRenderPass和vkCmdEndRenderPass之间的命令,这些命令的提交顺序为按照在CPU上写入CommandBuffer时的顺序。
二是在RenderPass中的命令,在RenderPass中的命令,只定义在同一SubPass中的其他命令的提交顺序,这些命令的提交顺序也是按照在CPU上写入CommandBuffer时的顺序。注意,如果几个命令在vkCmdBeginRenderPass和vkCmdEndRenderPass之间,但是它们不在同一SubPass中,那么它们之间是不存在任何提交顺序的。

Vulkan提供的隐式同步

有了提交顺序的概念,就可以定义一些隐式的同步机制,即不需要用户自己去实现,一定会默认遵循的同步。
Spec中提到的隐式同步有:

1.所有的Action类命令(Draw、Transfer、Clear、Copy等)以及显示地使用同步机制的命令(这个在之后会介绍),这些命令在执行VK_PIPELINE_STAGE_TOP_OF_PIPE_BIT时,会遵循提交顺序。即这些命令开始执行的顺序,是严格遵循提交顺序的。(但这并不意味着这些命令结束执行时的顺序会有什么约束,所有的这些命令,到底是哪个先结束,隐式同步并没有严格的规定,也就是说任何一个命令都有可能最先结束。)

2.所有的设置状态类的命令(bind pipelines, descriptor sets, and buffers等),由于它们不需要在GPU上执行,它们只负责设置CPU上相应CommandBuffer的状态,所以它们的执行顺序,遵循它们在CPU上写入CommandBuffer时的顺序。

3.所有的Draw类命令在处理Primitive时,首先遵循提交顺序,即先提交的Draw中的Primitive会先被处理。而在一个Draw内所提交的Primitive,会按照顶点和索引的下标顺序执行。

4.ImageLayout的转移,是通过ImageMemoryBarrier实现的(也是一种显式的同步原语),它们遵循提交顺序,即先提交的先转移。

以上差不多就是Vulkan中所提供的隐式同步了,还有一些细节可以参考Spec6.2中相关内容。
其他的所有需要用到同步的情景(比如写后写问题,写后读问题,读后写问题),都需要手动地通过显式的同步机制来实现。

Vulkan同步的基本概念

在使用同步类命令时,往往会填一些让人不太容易理解的参数,比如看pipeline barrier以及image memory barrier 的参数:

void vkCmdPipelineBarrier(
    VkCommandBuffer                             commandBuffer,
    VkPipelineStageFlags                        srcStageMask,
    VkPipelineStageFlags                        dstStageMask,
    VkDependencyFlags                           dependencyFlags,
    uint32_t                                    memoryBarrierCount,
    const VkMemoryBarrier*                      pMemoryBarriers,
    uint32_t                                    bufferMemoryBarrierCount,
    const VkBufferMemoryBarrier*                pBufferMemoryBarriers,
    uint32_t                                    imageMemoryBarrierCount,
    const VkImageMemoryBarrier*                 pImageMemoryBarriers);
typedef struct VkImageMemoryBarrier {
    VkStructureType            sType;
    const void*                pNext;
    VkAccessFlags              srcAccessMask;
    VkAccessFlags              dstAccessMask;
    VkImageLayout              oldLayout;
    VkImageLayout              newLayout;
    uint32_t                   srcQueueFamilyIndex;
    uint32_t                   dstQueueFamilyIndex;
    VkImage                    image;
    VkImageSubresourceRange    subresourceRange;
} VkImageMemoryBarrier;

可以看到这里面有很多莫名其妙的参数,比如VkPipelineStageFlags、VkAccessFlags、VkImageLayout等,初看时,可能会认为这些东西和同步根本没有任何关系,所谓同步,是想让一个命令的某个过程,一定要等待另一个命令的某个过程完成后才能开始执行,所以这些参数有什么意义呢?

VkPipelineStageFlags
Vulkan中并不提供任何命令级别的同步,即明确地指定某两个命令之间需要满足什么同步。所有需要同步的命令,都会将其执行过程划分为若干个阶段,所有的命令都会在流水线上执行,只是不同类型的命令,它们的阶段划分是不同的。当我们在Vulkan中使用同步机制时,都是以流水线阶段为单位,即某个流水线阶段上执行的所有命令,会在当前阶段暂停,等待另一个流水线阶段上的所有命令在相应的阶段执行完全后,再开始执行。VkPipelineStageFlags就代表流水线阶段,在Spec 6.1.2节中给出了它的所有可能取值,以及对于不同类型命令的流水线划分规则。

VkAccessFlags
Vulkan中的同步不仅控制操作执行的顺序,还要控制缓存的写回,即内存数据的同步。什么意思呢?不管是CPU还是GPU,存储系统都是按级划分的,比如主存、L2 Cache、L1 Cache等等,为了简化讨论,我们就假设只有这三级的存储结构(然而实际肯定是要更加复杂一些的)。从左往右,读写的速率会依次提升,但是价格也会依次增高,所包含的数据量也会依次减少。观察一下VkAccessFlags的取值(Spec 6.1.3节),它们的命名都是按照:VK_ACCESS_ + Stage + Resource Read/Write ,代表对内存进行读写,所以VkAccessFlags是为了表达流水线阶段对于内存的读写操作。
每一个这样的Access,都会从某一个L1 Cache上读或写数据,具体地选择哪一个L1 Cache来进行读或写,由驱动决定。那么这样就会有一个问题,假如某一个资源,比如一个Buffer,在某一次Access中被修改了,那么那一次的写操作只会对相应的那个L1 Cache有效果,在此后的某个Access中,需要再读这个Buffer的相关数据,如果只做执行过程间的同步(设置一个同步,让这次的读操作在前一个Access的写操作完成后再执行),这次读到的很有可能就不是这个Buffer的最新的值,因为尽管这次读操作确实是在写操作完成之后才执行的,但是那一次写操作只将数据写到了L1 Cache上,我们需要让这次读操作用到的L1 Cache也要包含的是修改以后得到的值才行。所以你会发现,所有的MemoryBarrier,都要包含VkAccessFlags,对于MemoryBarrier,它所控制的同步执行过程为:
①等待srcStageMask所代表的流水线阶段上的所有操作执行完成
②等待srcAccessMask所代表的内存操作available
③等待相应的available内存对于dstAccessMask所代表的内存操作是visible的
④唤醒dstStageMask所代表的流水线阶段上的所有操作
那么什么叫做available和visible呢?在spec上说的也比较含糊,我也没有找到它们的精确定义,以下是我个人的猜测
让某一个内存操作available,指的是这一次操作,可以被某一个内存区域(host、device等)所看到(注意这里的用语——可以看到,我猜测这里是将这次操作写回到了某一个全局可见的Cache或者主存或者跟可以通过BUS传递到主存的某块内存中,但是还并没有写回到后面这个Access所用到的L1 Cache中)
而visible指的就是让一个available的内存,它的最新值写入到了该Access所要用到的相应的L1 Cache中。

上述讨论也说明一点,Vulkan中的所有同步,大体上可以分为两种,一种是操作执行类的同步,即操作执行的先后顺序,另一种是内存类的同步,即让内存数据在各种不同的L1 Cache之间同步,当进行内存数据的显式同步时,都需要用到某一类MemoryBarrier。

还要注意,并不是所有的同步情景一定都得用到内存类的同步,比如读后写问题,这个情景下,只需要控制写操作在读操作之后进行就可以了,读操作不涉及到任何内存的修改,因此不需要将修改以后的内存变得available、visible之类的操作。

VkImageLayout
Vulkan中的同步原语还可以有附加的作用。比如一个VkImageMemoryBarrier,它附带的oldLayout和newLayout参数,可以实现让相应的Image进行Layout的转移。每一个Image都会处于某一个Layout下,一些操作只能在特定的流水线阶段对特定Layout下的Image才能使用,所以我们需要在程序执行过程的每一个阶段细致地设置每一个Image的Layout,Layout的转移就是通过这样的一个同步机制来实现的。这样你可能会有疑问,为什么Vulkan会将这样一个操作设计在一个同步原语中呢?事实上Layout的转移,无非也就是将相应的Image数据通过不同的压缩、排列等方式经过变换以后写到内存中的其他位置以供特殊的需求使用,即Layout的转移实际就是内存的读写操作,因此它需要用到内存数据的同步。Spec中明确指出,Layout进行转移时,相应的Image的内存一定得是available的,一个ImageMemoryBarrier所包含的同步执行过程为:
①等待srcStageMask所代表的流水线阶段上的所有操作执行完成
②等待srcAccessMask所代表的内存操作available
③进行ImageLayout Transition
④等待相应的available内存对于dstAccessMask所代表的内存操作是visible的
⑤唤醒dstStageMask所代表的流水线阶段上的所有操作

Vulkan中不存在只在一个CommandBuffer内有效的同步机制,所有的同步,在全局上都应该认为是对一个Queue中的所有命令有效果。
下面来逐个介绍Vulkan中的同步原语,它们的作用都是大体相同的,即控制 操作执行的同步或者内存数据的同步,不同之处在于它们的粒度以及作用的范围。

下面来逐个介绍Vulkan中的各个同步原语

Fence

Fence用于同步渲染队列和CPU之间的同步,它有两种状态——signaled和unsignaled。
在创建Fence时可以指定它的初始状态;
在调用vkQueueSubmit时,可以传入一个Fence,这样当Queue中的所有命令都被完成以后,Fence就会被设置成signaled的状态;
通过调用vKResetFences可以让一个Fence恢复成unsignaled的状态;

vkWaitForFences会让CPU在当前位置被阻塞掉,然后一直等待到它接受的Fence变为signaled的状态,这样就可以实现在某个渲染队列内的所有任务被完成后,CPU再执行某些操作的同步情景。

举一个具体的例子:假如现在SwapChain中一共有3个Image,然后创建了3个CommandBuffer分别代表在渲染到相应Image时所需要执行的所有命令。在每一帧渲染时,我们需要获取当前需要渲染到的Image的编号,然后使用对应的CommandBuffer,传入渲染队列中,执行渲染命令。那么现在就有一个问题,一个CommandBuffer,如果它还没有被执行完全,那么它是不能够再次被开始执行的。也就是说上面所说的那个获取CommandBuffer后,把它传入渲染队列执行的这样一个CPU上的操作一定要在这个CommandBuffer在上一次被执行完全以后才可以执行。所以这里就遇到了一个渲染队列和CPU之间的一个同步情景,此时可以对每个CommandBuffer分别设置一个Fence来实现这样的一种同步,大体的实现如下(这里用到了Semaphore,不过可以先只关注Fence):

	void draw()
	{
		// Get next image in the swap chain (back/front buffer)
		VK_CHECK_RESULT(swapChain.acquireNextImage(presentCompleteSemaphore, ¤tBuffer));

		// Use a fence to wait until the command buffer has finished execution before using it again
		VK_CHECK_RESULT(vkWaitForFences(device, 1, &waitFences[currentBuffer], VK_TRUE, UINT64_MAX));
		VK_CHECK_RESULT(vkResetFences(device, 1, &waitFences[currentBuffer]));

		// Pipeline stage at which the queue submission will wait (via pWaitSemaphores)
		VkPipelineStageFlags waitStageMask = VK_PIPELINE_STAGE_COLOR_ATTACHMENT_OUTPUT_BIT;
		// The submit info structure specifices a command buffer queue submission batch
		VkSubmitInfo submitInfo = {};
		submitInfo.sType = VK_STRUCTURE_TYPE_SUBMIT_INFO;
		submitInfo.pWaitDstStageMask = &waitStageMask;									// Pointer to the list of pipeline stages that the semaphore waits will occur at
		submitInfo.pWaitSemaphores = &presentCompleteSemaphore;							// Semaphore(s) to wait upon before the submitted command buffer starts executing
		submitInfo.waitSemaphoreCount = 1;												// One wait semaphore																				
		submitInfo.pSignalSemaphores = &renderCompleteSemaphore;						// Semaphore(s) to be signaled when command buffers have completed
		submitInfo.signalSemaphoreCount = 1;											// One signal semaphore
		submitInfo.pCommandBuffers = &drawCmdBuffers[currentBuffer];					// Command buffers(s) to execute in this batch (submission)
		submitInfo.commandBufferCount = 1;												// One command buffer

		// Submit to the graphics queue passing a wait fence
		VK_CHECK_RESULT(vkQueueSubmit(queue, 1, &submitInfo, waitFences[currentBuffer]));
		
		// Present the current buffer to the swap chain
		// Pass the semaphore signaled by the command buffer submission from the submit info as the wait semaphore for swap chain presentation
		// This ensures that the image is not presented to the windowing system until all commands have been submitted
		VK_CHECK_RESULT(swapChain.queuePresent(queue, currentBuffer, renderCompleteSemaphore));
	}

由此可见Fence是一种比较粗粒度的同步原语,另一个需要关心的问题是:上面只提到了它在操作执行方面的同步,而Vulkan中非常重要的另一种——内存数据的同步,Fence能不能做到呢?

事实上,Fence也具备这种内存数据同步的功能,但是并不需要手动地指定,在使用Fence时,如果它一旦被signaled,那么使用这个Fence的Queue中的所有的命令如果涉及到了对内存的修改,那么这些Memory Access就一定会再signaled之前在Device上变得available(注意只是在Device上有这个效果,如果在CPU上读相关的内存数据,并不能保证读到的是最新的值,所以如果确保CPU也能够获取最新的值的话,就需要再用上其他的同步原语)

Semaphore

Semaphore用于渲染队列每次提交的一批命令(batch)之间的同步,和Fence一样,它也有两种状态:signaled和unsignaled。
调用vkQueueSubmit提交命令时,会填充VkSubmitInfo结构,而这个结构体中需要填入pWaitSemaphores、pSignalSemaphores、pWaitDstStageMask,表示此次提交的所有命令在执行到pWaitDstStageMask时,要停下,必须要等待pWaitSemaphores所指向的所有Semaphore的状态变成signaled时才可以继续执行,此次提交的所有命令结束以后,pSignalSemaphores所指向的所有Semaphore的状态都会被设置成signaled。

可以看到Fence和Semaphore都会在vkQueueSubmit时作为参数传入,不同之处是,Fence用于阻塞CPU直到Queue中的命令执行结束(GPU、CPU之间的同步),而Semaphore用于不同的命令提交之间的同步(GPU、GPU之间的同步)

在Fence中给出的那段代码中,使用了两个Semaphore,用于控制queue提交的present命令(注意swapChain.queuePresent()的实现也是通过queue提交了一个执行present的命令)和render命令之间的同步:在渲染时,需要将渲染的结果写入到ColorAttachment中,我们必须要等待上一次把这个ColorAttachment给present到屏幕上的命令结束以后,才可以完成这个写入操作;
并且,将当前帧渲染结果显示到屏幕上的这个present命令,必须要等到当前帧的render命令完全执行结束以后,才可以开始执行。

和Fence一样,Semaphore也是一种粗粒度的同步,它本身也提供了隐含的内存数据的同步:
1.当让一个semaphore变成signaled时:semaphore之前的所有命令涉及到的内存写操作,都会在semaphore变成signaled之前,达到available的状态
2.当等待一个semaphore变成signaled时:在semaphore变成signaled之后,所有暂停的命令被重新唤醒继续执行之前,所有此后相关的Memory Access,都会达到visible的状态。
也就是说在使用Fence和Semaphore时,一般是不需要对GPU上有关的任何Memory Access做同步处理,这些都会被自动完成。但是,这些隐含的同步只是针对GPU的,CPU上所需要的内存数据同步操作必须由应用程序显式完成,比如:当CPU需要读一个经由GPU修改过的内存数据,就需要加一个MemoryBarrier来确保CPU读到的是最新的数据。

还有一点值得注意的是,在讨论Fence和Semaphore时,都提到了vkQueueSubmit函数,这个函数本身也是隐含了一个内存数据的同步的:就是CPU上所有的内存修改操作,都会在GPU读写之前,对GPU而言变成available的,并且对于所有之后GPU上的MemoryAccess,它们都是visible的。

Event

Event用于同步提交到同一队列的不同命令,或者同步CPU和队列。它同样也具有两种状态——signaled和unsignaled,与Fence不同的是,它的状态改变既可以在CPU上完成,也可以在GPU上完成,并且它是一种细粒度的同步机制。注意:Event不能用于不同队列的命令之间的同步。

在CPU上,可以调用vkSetEvent来使一个Event变成Signaled的状态;可以调用vkResetEvent来使一个Event变成Unsignaled的状态;可以调用vkGetEventStatus来获取一个Event的当前状态,可以利用这个状态来对CPU进行阻塞。

而在GPU上:
1.可以通过vkCmdSetEvent命令来使得一个Event变成Signaled状态,此时该命令附带了一个操作执行同步:根据提交顺序,所有在该命令之前的所有命令都必须在此次把Event设置Signaled状态之前完成。
2.可以通过vkCmdResetEvent命令来使得一个Event变成Unsignaled状态,此时该命令附带了一个操作执行同步:根据提交顺序,所有在该命令之前的所有命令都必须在此次把Event设置Unsignaled状态之前完成。

这里有一点非常需要注意:vkCmdSetEvent和vkCmdResetEvent不能够在一个RenderPass内被执行,原因可以参见[4]。
3.

void vkCmdWaitEvents(
VkCommandBuffer                             commandBuffer,
uint32_t                                    eventCount,
const VkEvent*                              pEvents,
VkPipelineStageFlags                        srcStageMask,
VkPipelineStageFlags                        dstStageMask,
uint32_t                                    memoryBarrierCount,
const VkMemoryBarrier*                      pMemoryBarriers,
uint32_t                                    bufferMemoryBarrierCount,
const VkBufferMemoryBarrier*                pBufferMemoryBarriers,
uint32_t                                    imageMemoryBarrierCount,
const VkImageMemoryBarrier*                 pImageMemoryBarriers);

该函数直接显式定义一个同步(比较繁琐):
首先是操作执行的同步:
A:pEvents所指向的所有Event被Signal的操作,以及这些Event被Signal之前的所有命令在指定的srcStageMask时的操作
B:根据提交顺序,在这条命令之后的所有命令在指定的dstStageMask时的操作
B一定要在A完成之后才能开始进行

而内存数据的同步则来自于后面6个参数所给出的MemoryBarrier,如果不传入任何MemoryBarrier,那么就不具有任何的内存数据的同步。

来看一个例子:
1.vkCmdDispatch
2.vkCmdDispatch
3.vkCmdSetEvent(event, srcStageMask = COMPUTE)
4.vkCmdDispatch
5.vkCmdWaitEvent(event, dstStageMask = COMPUTE)
6.vkCmdDispatch
7.vkCmdDispatch

那么这里实现的就是:{6,7}命令在指定的stage要停下来,等{1,2}在指定的stage的所有操作都完成后才可以继续重新开始执行。而命令{4}并不受此次同步的影响,它的执行过程是不受到约束的。
注意这里省略掉了内存数据的同步,如果{6,7}中所要读/写的数据,被{1,2}修改过的话,就需要在命令{5}中传入MemoryBarrier来实现这个同步。

关于MemoryBarrier马上就会解释。

Barrier

pipeline barrier
首先再看一下它的定义:

void vkCmdPipelineBarrier(
    VkCommandBuffer                             commandBuffer,
    VkPipelineStageFlags                        srcStageMask,
    VkPipelineStageFlags                        dstStageMask,
    VkDependencyFlags                           dependencyFlags,
    uint32_t                                    memoryBarrierCount,
    const VkMemoryBarrier*                      pMemoryBarriers,
    uint32_t                                    bufferMemoryBarrierCount,
    const VkBufferMemoryBarrier*                pBufferMemoryBarriers,
    uint32_t                                    imageMemoryBarrierCount,
    const VkImageMemoryBarrier*                 pImageMemoryBarriers);

现在再看应该比较轻松了。它本身定义了一个操作执行的同步:
A:在这条命令之前的所有的命令在srcStageMask所指示的stage的操作;
B:在这条命令之后的所有的命令在dstStageMask所指示的stage的操作
B一定要在A执行完全后才可以开始执行。
同时后6个参数代表的MemoryBarrier实现内存数据的同步。
可以发现PipelineBarrier和Event非常像,区别在于Event的Signal和Wait可以在两个地方,而PipelineBarrier直接将命令序列一分为二。

关注一下参数dependencyFlags:
如果它的取值中包含VK_DEPENDENCY_BY_REGION_BIT,那么任何涉及到 framebuffer-space的同步,都是framebuffer-local的,什么意思呢?

所谓的framebuffer-space,就是指以下4个STAGE:

VK_PIPELINE_STAGE_FRAGMENT_SHADER_BIT
VK_PIPELINE_STAGE_EARLY_FRAGMENT_TESTS_BIT
VK_PIPELINE_STAGE_LATE_FRAGMENT_TESTS_BIT
VK_PIPELINE_STAGE_COLOR_ATTACHMENT_OUTPUT_BIT

任何同步原语,只要包含以上四种STAGE之一,我们就可以说这个同步是涉及到framebuffer-space的。
而根framebuffer-space有关的同步,指的是流水线在对framebuffer执行读写时必须要遵循的同步,framebuffer中的读写都是以framebuffer-region为单位进行,一个framebuffer-region指的是(x,y,layer,sample),如果一个同步是framebuffer-local的:那么B中的任何对某一framebuffer-region的操作,只会在A中的同一位置的framebuffer-region的操作结束后开始执行,不同framebuffer-region之间不存在同步关系。而如果一个同步是framebuffer-global的,那么对一个framebuffer上的所有framebuffer-region都是存在同步关系的,也即B中的任何一个操作,都必须要等到A中所有的framebuffer-region被处理完全以后才能开始执行。

还有一点非常重要:如果在一个subpass内使用vkCmdPipelineBarrier,那么必须让这个subpass所在的renderpass为它声明一个self-dependency,即必须存在一个VkSubpassDependency,它的srcSubpass和dstSubpass都是这个subpass的index(Spec 6.6.1),原因可以参考[4]

[3]中给出了大量的使用Barrier的例子,可以仔细阅读。

Memory Barrier
前面反复提及过了,内存数据的同步需要使用Memory Barrier完成,然而MemoryBarrier的作用不止于此,它还可以进行QueueFamily的转移、ImageLayout的转移。
ImageLayout的转移前面已经说过了,这里介绍一下QueueFamily的转移:在创建Vulkan中的资源时,都指定了一个Queue,表示当前创建的这个资源的所有权是指定的这个Queue的,如果在创建时指定了VkSharingMode为VK_SHARING_MODE_EXCLUSIVE,那么这个资源如果要想被某些命令使用,那么这些命令提交到的队列就必须得具有它的所有权,如果没有就必须进行QueueFamily的转移。

Vulkan中一共有三种MemoryBarrier:

typedef struct VkMemoryBarrier {
    VkStructureType    sType;
    const void*        pNext;
    VkAccessFlags      srcAccessMask;
    VkAccessFlags      dstAccessMask;
} VkMemoryBarrier;
typedef struct VkBufferMemoryBarrier {
    VkStructureType    sType;
    const void*        pNext;
    VkAccessFlags      srcAccessMask;
    VkAccessFlags      dstAccessMask;
    uint32_t           srcQueueFamilyIndex;
    uint32_t           dstQueueFamilyIndex;
    VkBuffer           buffer;
    VkDeviceSize       offset;
    VkDeviceSize       size;
} VkBufferMemoryBarrier;
typedef struct VkImageMemoryBarrier {
    VkStructureType            sType;
    const void*                pNext;
    VkAccessFlags              srcAccessMask;
    VkAccessFlags              dstAccessMask;
    VkImageLayout              oldLayout;
    VkImageLayout              newLayout;
    uint32_t                   srcQueueFamilyIndex;
    uint32_t                   dstQueueFamilyIndex;
    VkImage                    image;
    VkImageSubresourceRange    subresourceRange;
} VkImageMemoryBarrier;

可以看到后两种Barrier无非就是针对Buffer和Image添加了一些参数,以及加入了QueueFamily的转移、ImageLayout的转移。
此前说过了,有关内存数据的读写,我们要关注此前对它的写操作是否是Available的,当前对它的读写操作是不是visible的,以确定当前的读写操作能够获取最新的值。
那么这里三个barrier所共同都需要制定的srcAccessMask和dstAccessMask就具备此含义。所有的MemoryBarrier都需要搭配PipelineBarrier或者Event使用,PipelineBarrier和Event都定义了执行操作的Stage,并给出了操作的同步,那么在MemoryBarrier中,我们就需要指定好在相应的Stage中的Access,这样就可以保证此前的对内存的Access一定会available,并且对后面的dstAccessMask是visible的。

本文一定有不少不严谨或者是不正确的地方,希望读者能不吝斧正。

相关链接:
[1]Vulkan Specification
[2]Yet another blog explaining Vulkan synchronization
[3]Synchronization Examples
[4]Why some commands can be recorded only outside of a render pass?

你可能感兴趣的:(Vulkan)