0. 初识图形API
OpenGL
(Open Graphics Library)是⼀个跨编程语⾔言、跨平台的编程图形程序接⼝口,它将计算机的资源抽象称为⼀个OpenGL
的对象,对这些资源的操作抽象为⼀个的OpenGL
指令。
OpenGL ES
(OpenGL for Embedded Systems)是 OpenGL
三维图形 API 的⼦子集,针对⼿手机、 PDA和游戏主机等嵌⼊入式设备⽽而设计,去除了了许多不不必要和性能较低的API接⼝口。
DirectX
是由很多API组成的,DirectX
并不不是⼀个单纯的图形API. 最重要的是DirectX
是属于 Windows上⼀个多媒体处理理API。并不支持Windows以外的平台,所以不是跨平台框架, 按照性 质分类,可以分为四⼤大部分,显示部分、声⾳音部分、输⼊入部分和⽹网络部分。
Metal
: Apple为游戏开发者推出了了新的平台技术Metal
,该技术能够为 3D 图像提⾼高 10 倍的渲染性能。Metal
是Apple为了了解决3D渲染⽽而推出的框架。
1. OpenGL状态机
状态机可以理解为一台可以保存状态,并根据当前状态进行相应输出的机器。
核心要点:
- 记忆功能,保存当前状态
- 接收输入,修改当前状态,或根据当前状态进行输出
- 当进⼊特殊状态(停机状态)时,不再接收输⼊,停⽌工作
2. OpenGL上下文(context)
在应⽤程序调⽤任何OpenGL
的指令之前,首先需要创建⼀个OpenGL
的上下⽂文。这个上下⽂是⼀个⾮常庞⼤的状态机,保存了了OpenGL
中的各种状态,这也是OpenGL
指令执⾏的基础。
OpenGL
的函数不管在哪个语⾔中,都是类似C语⾔一样的面向过程的函数。本质上都是对OpenGL
上下⽂这个庞⼤的状态机中的某个状态或者对象进行操作。通过对 OpenGL
指令的封装,可以将OpenGL
的相关调⽤封装成为⼀个⾯向对象的图形API。
由于OpenGL
上下⽂是⼀个巨⼤大的状态机,切换上下文往往会产生较⼤的开销,但是不同的绘制模块,可能需要使⽤完全独立的状态管理。因此,可以在应⽤程序中分别创建多个不同的上下文,在不同线程中使⽤不同的上下文,上下⽂之间共享纹理、缓冲区等资源。这样的⽅方案,会⽐比反复切换上下⽂,或者⼤量修改渲染状态,更加合理高效。
核心要点:
-
OpenGL
指令执⾏的基础,是⼀个⾮常庞⼤的状态机。 -
OpenGL
上下文切换开销大。虽然可能使用多个上下文,但上下文之间会共享纹理、缓冲区等资源。 -
OpenGL
的函数虽然是面向过程的,但可以把相关的调用封装为面向过程的图形API。
3. 渲染
将图形/图像数据转换成3D空间图像操作叫做渲染(Rendering)。
4. 顶点数组和顶点缓冲区
顶点数据就是图像的轮廓。OpenGL
中的图像都是由图元组成。在OpenGL ES
中,有3种类型的图元:点、线、三⻆形。
在调⽤绘制⽅法的时候,直接由内存传入顶点数据,也就是说这部分数据之前是存储在内存当中的,被称为顶点数组(VertexArray)。
⽽性能更高的做法是,提前分配⼀块显存,将顶点数据预先传⼊到显存当中。这部分的显存,就被称为顶点缓冲区(VertexBuffer)。
核心要点:
- 3种类型的图元:点、线、三⻆形。
- 顶点数组(VertexArray)在内存中。
- 顶点缓冲区(VertexBuffer)在缓存中。
5. 管线
在OpenGL
下渲染图形,就会经历⼀个⼀个的节点。而这样的操作可以理理解管线。就像一个流⽔线,任务按照先后顺序依次执行。管线是⼀个抽象的概念,之所以称之为管线是因为显卡在处理数据的时候是按照一个固定的顺序来的,而且严格按照这个顺序。
核心要点:
- 任务严格按顺序依次执行。
6. 固定管线/存储着色器
在早期的OpenGL
版本,封装了多种着色器程序块,内置了一段包含了光照、坐标变换、裁剪等诸多功能的固定shader程序来完成。来帮助开发者来完成图形的渲染。开发者只需要传入相应的参数,就能快速完成图形的渲染。类似于iOS开发会封装很多API,而我们只需要调⽤,就可以实现功能,不需要关注底层实现原理。
但是由于OpenGL
的使⽤场景⾮常丰富,固定管线或存储着⾊器⽆法完成每一 个业务,这时将相关部分开放成可编程。
核心要点:
- 早期的
OpenGL
版本封装的辅助快速开发的着色器程序块。 - 由于提供的功能有限,后期变成了可编程的形式。
7. 着⾊器程序(Shader)
将固定渲染管线架构变为了可编程渲染管线。
OpenGL
在实际调⽤绘制函数之前,还需要指定⼀个由shader编译成的着色器程序。常见的着⾊器主要有顶点着⾊器(VertexShader),⽚段着⾊器(FragmentShader)/像素着⾊器(PixelShader),几何着⾊(GeometryShader),曲⾯细分着⾊器(TessellationShader)。片段着⾊器和像素着⾊器只是在OpenGL
和DX
中的不同叫法而已。可惜的是,直到OpenGL ES 3.0
,OpenGL ES
依然只⽀持顶点着⾊器和片段着⾊器这两个最基础的着⾊器。
OpenGL
在处理理shader时,和其他编译器一样。通过编译、链接等步骤,⽣成了着⾊器程序(glProgram),着⾊器程序同时包含了顶点着⾊器和⽚段着⾊器的运算逻辑。在OpenGL
进行绘制的时候,⾸先由顶点着⾊器对传⼊的顶点数据进⾏运算。再通过图元装配,将顶点转换为图元。然后进⾏光栅化,将图元这种⽮量图形,转换为栅格化数据。最后,将栅格化数据传入⽚段着⾊器中进⾏运算。⽚段着⾊器会对栅格化数据中的每一个像素进行运算,并决定像素的颜⾊。
核心要点:
- 将固定渲染管线架构变为了可编程渲染管线。
- 常见的着⾊器主要有顶点着⾊器,⽚段着⾊器/像素着⾊器,几何着⾊,曲⾯细分着⾊器。
-
OpenGL ES
只⽀持顶点着⾊器和片段着⾊器。 -
OpenGL
通过编译、链接等步骤,将⽣成着⾊器程序。 - 在
OpenGL
进行绘制的时候,由顶点着⾊器对传⼊的顶点数据进⾏运算。再通过图元装配,将顶点转换为图元。之后进⾏光栅化,将图元这种⽮量图形,转换为栅格化数据。最后,将栅格化数据传入⽚段着⾊器中进⾏运算。⽚段着⾊器会对栅格化数据中的每一个像素进行运算,并决定像素的颜⾊。
7.1 顶点着⾊器(VertexShader)
顶点着⾊器是OpenGL
中⽤于计算顶点属性的程序。
⼀般来说典型的需要计算的顶点属性主要包括顶点坐标变换、逐顶点光照运算等等。顶点坐标由⾃身坐标系转换到归一化坐标系的运算,就是在这里发⽣的。
顶点着⾊器是逐顶点运算的程序,也就是说每个顶点数据都会执⾏一次顶点着⾊器。当然这是并行的,并且顶点着⾊器运算过程中⽆法访问其他顶点的数据。
核心要点:
- ⼀般⽤来处理理图形每个顶点变换(旋转/平移/投影等)。
- 并行计算,且运算过程中⽆法访问其他顶点的数据。
7.2 片段着⾊器(FragmentShader)
⽚段着⾊器是OpenGL
中⽤于计算⽚段(像素)颜⾊的程序。一般⽤来处理图形中每个像素点颜⾊计算和填充。
⽚段着⾊器是逐像素运算的程序,也就是说每个像素都会执⾏一次⽚段着⾊器,当然也是并⾏的。
核心要点:
- 一般⽤来处理图形中每个像素点颜⾊计算和填充。
- 并行计算,且运算过程中⽆法访问其他顶点的数据。
8. GLSL(OpenGL Shading Language)
GLSL着色语⾔是⽤来在OpenGL
中着⾊编程的语⾔,是在图形卡的GPU上执⾏的。代替了固定的渲染管线的⼀部分,使渲染管线中不同层次具有可编程性。⽐如:视图转换、投影转换等。GLSL(GL Shading Language)的着⾊器代码分成2个部分: Vertex Shader(顶点着⾊器)和Fragment(⽚断着⾊器)。
9. 光栅化(Rasterization)
光栅化就是把顶点数据转换为片元的过程。具有将图转化为⼀个个栅格组成的图象 的作⽤,特点是每个元素对应帧缓冲区中的⼀像素。
光栅化其实是⼀种将⼏何图元变为二维图像的过程。该过程包含了两部分的⼯作。第⼀部分工作:决定窗⼝坐标中的哪些整型栅格区域被基本图元占⽤;第⼆部分⼯作:分配一个颜⾊值和⼀个深度值到各个区域。
把物体的数学描述以及与物体相关的颜色信息转换为屏幕上用于对应位置的像素及⽤于填充像素的颜⾊,这个过程称为光栅化。这是⼀个将模拟信号转化为离散信号的过程。
核心要点:
- 光栅化就是把顶点数据转换为片元的过程。
- 该过程包含了两部分的⼯作:①决定窗⼝坐标中的哪些整型栅格区域被基本图元占⽤;②分配一个颜⾊值和⼀个深度值到各个区域。
10. 纹理(Texture)
纹理可以理解为图⽚。 在渲染图形时需要在顶点围成的区域中填充图⽚,使得场景更加逼真。⽽这⾥使⽤的图⽚,就是常说的纹理。只是在OpenGL
,我们更加习惯叫纹理,⽽不是图⽚。
11. 混合(Blending)
在测试阶段之后,如果像素依然没有被剔除,那么像素的颜⾊将会和帧缓冲区中颜⾊附着上的颜色进⾏混合,混合的算法可以通过OpenGL
的函数进行指定。但是OpenGL
提供的混合算法有限。如果需要更加复杂的混合算法,一般可以通过片段着⾊器进⾏实现,当然性能会⽐原⽣的混合算法差⼀些。
12. 矩阵
12.1 变换矩阵(Transformation)
例如图形想发⽣平移、缩放、旋转等变换,就需要使用变换矩阵。
12.1 投影矩阵(Projection)
⽤于将3D坐标转换为⼆维屏幕坐标,实际线条也将在二维坐标下进行绘制。
13. 渲染上屏/交换缓冲区(SwapBuffer)
渲染缓冲区⼀般映射的是系统的资源⽐如窗⼝。如果将图像直接渲染到窗口对应的渲染缓冲区,则可以将图像显示到屏幕上。
值得注意的是,如果每个窗⼝只有⼀个缓冲区,那么在绘制过程中屏幕进⾏了刷新,窗⼝可能显示出不完整的图像。
为了解决这个问题,常规的OpenGL
程序⾄少都会有两个缓冲区。显示在屏幕上的称为屏幕缓冲区,没有显示的称为离屏缓冲区。在一个缓冲区渲染完成之后,通过将屏幕缓冲区和离屏缓冲区交换,实现图像在屏幕上显示。
由于显示器的刷新⼀般是逐⾏进⾏的,为了防⽌交换缓冲区的时候屏幕上下区域的图像分属于两个不同的帧,交换一般会等待显示器刷新完成的信号,在显示器器两次刷新的间隔中进⾏交换,这个信号就被称为垂直同步信号,这个技术被称为垂直同步。
使用了双缓冲区和垂直同步技术之后,由于总是要等待缓冲区交换之后再进⾏下⼀帧的渲染,使得帧率无法完全达到硬件允许的最⾼⽔平。为了解决这个问题,引⼊了三缓冲区技术。在等待垂直同步时,来回交替渲染两个离屏的缓冲区,⽽垂直同步发⽣生时,屏幕缓冲区和最近渲染完成的离屏缓冲区交换,实现充分利利⽤硬件性能的⽬的。
核心要点:
- 如果每个窗⼝只有⼀个缓冲区,若在绘制过程中屏幕进⾏了刷新,窗⼝可能显示出不完整的图像。为了解决这个问题,常规的
OpenGL
程序⾄少都会有两个缓冲区。 - 垂直同步:由于显示器的刷新⼀般是逐⾏进⾏的,为了防⽌交换缓冲区的时候屏幕上下区域的图像分属于两个不同的帧,交换一般会等待显示器刷新完成的信号,在显示器器两次刷新的间隔中进⾏交换,这个信号就被称为垂直同步信号,这个技术被称为垂直同步。
- 三缓冲区技术:使用了双缓冲区和垂直同步技术之后,由于总是要等待缓冲区交换之后再进⾏下⼀帧的渲染,使得帧率无法完全达到硬件允许的最⾼⽔平。为了解决这个问题,引⼊了三缓冲区技术。在等待垂直同步时,来回交替渲染两个离屏的缓冲区,⽽垂直同步发⽣生时,屏幕缓冲区和最近渲染完成的离屏缓冲区交换,实现充分利利⽤硬件性能的⽬的。