[Unity3D]Shader学习笔记之Shader与DrawCall

Shader是什么?

  Shader所在阶段是渲染流水线的一部分,具体的说就是:

  • GPU流水线上一些可高度编程的阶段,而由着色器编译出来的最终代码是会在GPU上运行的(对于固定管线的渲染来说,着色器有时等同于一些特定的渲染设置)
  • 有一些特定类型的着色器,如顶点着色器、片元着色器
  • 依靠着色器我们可以控制流水线中的渲染细节,例如用顶点着色器来进行顶点变换以及传递数据,用片元着色器来进行逐像素的渲染

  要的到出色的游戏画面是需要包括Shader在内的所有渲染流水线阶段的共同参与才可以完成:设置适当的渲染状态,使用合适的混合函数,开始或关闭深度测试/深度写入。

Draw Call

  Draw Call即CPU调用图像编程接口。造成性能瓶颈的不是GPU,而是CPU。

CPU和GPU是如何实现并行工作的

  解决方案是命令缓冲区(Command Buffer)
  命令缓冲区包含一个命令队列,由CPU向其中添加命令,而由GPU从中读取命令,添加和读取的过程是相互独立的。命令缓冲区使得CPU和GPU可以相互独立工作。
  当CPU需要渲染一些对象时,它可以向命令缓冲区中添加命令,而当GPU完成了上一次的渲染任务后,它就可以从命令队列中再取出一个命令并执行它。
  命令缓冲区中的命令有很多种,而Draw Call是其中的一种,其他命令还有改变渲染状态等(例如改变使用的着色器,使用不同的纹理等)。
[Unity3D]Shader学习笔记之Shader与DrawCall_第1张图片

Draw Call多了为什么会影响帧率

  在每次调用Draw Call之前,CPU需要向GPU发送很多内容,包括数据
状态和命令等。在这一阶段,CPU需要完成许多工作,例如检查渲染状态等。而一旦CPU完成这些准备工作,GPU就可以开始本次的渲染。
  GPU的渲染速度往往快于CPU提交命令的速度。如果Draw Call的数量太多,CPU就会把大量时间话费在提交Draw Call上,造成CPU的过载。

如何减少Draw Call

  提交大量很小的Draw Call会造成CPU的性能瓶颈,即CPU把时间都花费在准备Draw Call的工作上。那么一个很显然的优化方案就是把很多小的Draw Call合并成一个大的Draw Call,这就是批处理(Batching)的思想。
  由于需要在CPU中合并网格,而合并的过程是需要消耗时间的,因此,批处理技术更加合适于那些静态的物体,例如不会移动的大地、石头等,对于这些物体我们只需要合并一次即可。对于动态物体也可以进行批处理,由于这些物体是不断运动的,因此每一帧都需要进行合并然后再发送给GPU,这对空间和时间都会造成一定的影响。
  利用批处理技术,CPU在RAM把多个网格合并成一个更大的网格,再发送给GPU,然后在一个Draw Call中渲染它们。但要注意的是,使用批处理合并的网格将会使用同一种渲染状态。也就是说,如果网格之间需要使用不同的渲染状态,那么就无法使用这种技术。

在游戏开发过程中,为了减少Draw Call的开销,有两点需要注意:

  • 避免使用大量很小的网格。当不可避免的需要使用很小的网格结构时,考虑是否可以合并它们。
  • 避免使用过多的材质。尽量在不同的网格之间共用同一个材质。

[Unity3D]Shader学习笔记之Shader与DrawCall_第2张图片

你可能感兴趣的:(Unity3D)